33
1 1 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas DETECCIÓN DE PATOLOGÍAS VINCULADAS CON EL CORAZÓN DERECHO EN IMÁGENES DE TOMOGRAFÍA COMPUTARIZADA Huérfano Chacón, Yoleidy Katherine [email protected] Universidad Simón Bolívar Vera, Miguel Angel [email protected] Universidad Simón Bolívar Chacón Rangel ,José Gerardo [email protected] Universidad Simón Bolívar Bautista ,Nahid Antuan [email protected] Universidad Simón Bolívar Resumen- Se propone una estrategia computacional para la detección de patologías vinculadas con las estructuras cardiacas que conforman la porción derecha del corazón humano. A partir de la generación automática de la morfología de las principales estructuras del corazón derecho en imágenes 3–D cardiacas, de tomografía computarizada multi–corte (MSCT) cardiaca, la mencionada estrategia pretende estimar un conjunto de descriptores de la función cardiaca tales como volumen diastólico final, volumen sistólico final, gasto cardiaco, volumen latido, fracción de eyección. Para ello, se deben desarrollar 2 etapas primordiales vinculadas con el área de procesamiento digital de imágenes denominadas preprocesamiento y segmentación. La etapa de preprocesamiento incluye dos fases. En la primera, denominada fase de filtrado, con la finalidad de elevar la calidad de las mencionadas imágenes se consideran métodos de filtrado para conforman una técnica basada en realce por similaridad global. Dicho realce está estructurado con base en un banco de filtros digitales que incluye un detector de bordes, una función de similaridad y técnicas suavizadoras o reductoras de ruido. En la segunda fase, denominada definición de una región de interés (ROI), se desarrolla una metodología que consiste en combinar una transformación para la reducción de la resolución espacial de las mencionadas imágenes y paradigmas de aprendizaje, basados en operadores de inteligencia artificial, para definir una ROI que facilite la segmentación de las referidas estructuras cardiacas. La etapa de segmentación considera las imágenes preprocesadas y técnicas de segmentación, basadas en métodos de agrupamiento, para generar la morfología 3–D de dos de las principales estructuras cardiacas del corazón derecho: aurícula derecha y ventrículo derecho. Tales segmentaciones permiten calcular ciertos descriptores cardiacos que posibilitan el diagnóstico y monitoreo de enfermedades cardiacas tales como: fibrilación auricular, hipertensión pulmonar, insuficiencia cardiaca, hipertrofia ventricular, etc. Adicionalmente, las referidas segmentaciones pueden ser útiles para la planificación de procedimientos clínicos diseñados para abordar las mencionadas enfermedades cardiacas. Palabras Clave: Ventrículo derecho, Tomografía Computarizada, Realce por similaridad global, Segmentación, Crecimiento de regiones, Coeficiente de Dice, Enfermedades Cardiacas. I. INTRODUCCIÓN. El corazón es el principal órgano del sistema cardiaco humano y es el responsable de recibir y bombear la sangre para que ésta circule por

DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

Embed Size (px)

Citation preview

Page 1: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

1 1 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

DETECCIÓN DE PATOLOGÍAS VINCULADAS CON EL CORAZÓN DERECHO EN

IMÁGENES DE TOMOGRAFÍA COMPUTARIZADA

Huérfano Chacón, Yoleidy Katherine [email protected] Universidad Simón Bolívar

Vera, Miguel Angel [email protected]

Universidad Simón Bolívar Chacón Rangel ,José Gerardo

[email protected] Universidad Simón Bolívar Bautista ,Nahid Antuan

[email protected] Universidad Simón Bolívar

Resumen- Se propone una estrategia

computacional para la detección de patologías vinculadas con las estructuras cardiacas que conforman la porción derecha del corazón humano.

A partir de la generación automática de la

morfología de las principales estructuras del corazón derecho en imágenes 3–D cardiacas, de tomografía computarizada multi–corte (MSCT) cardiaca, la mencionada estrategia pretende estimar un conjunto de descriptores de la función cardiaca tales como volumen diastólico final, volumen sistólico final, gasto cardiaco, volumen latido, fracción de eyección. Para ello, se deben desarrollar 2 etapas primordiales vinculadas con el área de procesamiento digital de imágenes denominadas preprocesamiento y segmentación.

La etapa de preprocesamiento incluye dos fases. En la primera, denominada fase de filtrado, con la finalidad de elevar la calidad de las mencionadas imágenes se consideran métodos de filtrado para conforman una técnica basada en realce por similaridad global. Dicho realce está estructurado con base en un banco de filtros digitales que incluye un detector de bordes, una función de similaridad y técnicas suavizadoras o reductoras de ruido. En la segunda fase, denominada definición de una región de interés (ROI), se desarrolla una metodología que consiste en combinar una transformación para la reducción de la

resolución espacial de las mencionadas imágenes y paradigmas de aprendizaje, basados en operadores de inteligencia artificial, para definir una ROI que facilite la segmentación de las referidas estructuras cardiacas.

La etapa de segmentación considera las imágenes preprocesadas y técnicas de segmentación, basadas en métodos de agrupamiento, para generar la morfología 3–D de dos de las principales estructuras cardiacas del corazón derecho: aurícula derecha y ventrículo derecho. Tales segmentaciones permiten calcular ciertos descriptores cardiacos que posibilitan el diagnóstico y monitoreo de enfermedades cardiacas tales como: fibrilación auricular, hipertensión pulmonar, insuficiencia cardiaca, hipertrofia ventricular, etc. Adicionalmente, las referidas segmentaciones pueden ser útiles para la planificación de procedimientos clínicos diseñados para abordar las mencionadas enfermedades cardiacas.

Palabras Clave: Ventrículo derecho,

Tomografía Computarizada, Realce por similaridad global, Segmentación, Crecimiento de regiones, Coeficiente de Dice, Enfermedades Cardiacas.

I. INTRODUCCIÓN.

El corazón es el principal órgano del sistema

cardiaco humano y es el responsable de recibir y bombear la sangre para que ésta circule por

Page 2: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

2 2 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

todo el cuerpo. Básicamente, el mencionado órgano consta de 4 cavidades: dos aurículas y dos ventrículos. Los ventrículos son los encargados de enviar la sangre desde el corazón hacia el resto del organismo; mientras que las aurículas son las cavidades que reciben la sangre retornada al corazón [1].

En los contextos clínico y social, reviste gran interés y relevancia las múltiples enfermedades vinculadas con el corazón. En particular, las enfermedades cardiovasculares (CVD) debido a que, a nivel mundial, cada año mueren más personas por CVD que por cualquier otra enfermedad [2].

Adicionalmente, en Venezuela, durante el año 2008 perdieron la vida 10.810 mujeres, en edades comprendidas entre 45 y 64 años, de las cuales 5.506 muertes fueron causadas por enfermedades cardiacas equivalente al 50.9% de los fallecimientos en el rango de edades señalado [3]; mientras que, en 2009, las enfermedades cardiacas ocuparon el primer lugar entre las 25 principales causas de muerte, con un 20.99% correspondiente a 29.078 defunciones [4].

Debido a que las estructuras cardiacas del corazón derecho son de principal interés para el presente trabajo, es importante señalar que una de las enfermedades vinculadas, directa o indirectamente, con el corazón derecho es la hipertensión pulmonar (PHT). De acuerdo con Galié et al. [5], la PHT se define como una presión arterial promedio mayor a 25 mmHg en estado de reposo ó superior a 30 mmHg luego de hacer ejercicio. Esto quiere decir que la PHT se caracteriza por la presencia de una presión arterial, anormalmente alta en las arterias de los pulmones, lo cual hace que el lado derecho del corazón experimente esfuerzos superiores a los normales para forzar la circulación de la sangre, a través de los vasos sanguíneos, en contra de esta presión. Esto trae como consecuencia que el lado derecho del corazón se dilate pudiéndose generar insuficiencia cardíaca del corazón derecho [5].

En el contexto clínico, la detección de ciertas CVD y el diagnóstico de la PHT puede llevarse a cabo con el apoyo de exámenes especializados y/o técnicas de imagenología que, por ejemplo, permite a los cardiólogos extraer las estructuras más relevantes del corazón humano. Respecto a tales técnicas, es necesario indicar que existen diversas modalidades de imagenología para analizar la fisiología y/o anatomía de los órganos que conforman el cuerpo humano. Una de tales modalidades, que está siendo utilizada para el

diagnóstico y monitoreo de la función cardiovascular, es la tomografía computarizada (CT).

En este orden de ideas, los cardiólogos que consideran la CT deben analizar un número considerable de imágenes y, para ello, realizan un proceso de segmentación manual que les permite identificar las estructuras anatómicas cardiacas de interés. Entre las dificultades que exhibe la segmentación manual se pueden mencionar: empleo de un tiempo excesivo, trabajo que requiere de alta concentración muy engorroso y proceso operador dependiente.

Adicionalmente, la mayoría de métodos propuestos para la segmentación de diversas estructuras cardiacas, reportados en la literatura, no han sido validados clínicamente de manera rigurosa.

Por lo expresado en el párrafo anterior, se puede afirmar que la segmentación de estructuras cardiacas es un problema abierto y muy desafiante debido, entre otras razones, a que tales estructuras exhiben, permanentemente, un movimiento altamente complejo. Además la realización de tales segmentaciones se hace aún más difícil debido a que las imágenes provenientes de un estudio clínico, generadas mediante cualquier modalidad, poseen imperfecciones tales como ruido, artefactos y bajo contraste, que afectan la calidad de la información presente en las imágenes tridimensionales, particularmente, en imágenes de tomografía computarizada multi–capa (MSCT) cardiaca [6].

A modo de ejemplo, mediante la figura 1.1 se muestran imágenes 2-D, correspondiente a tres pacientes masculinos, en las que se aprecia la presencia del ruido Poisson (fig. 1.1 a), el artefacto escalera (fig. 1.1 b) y la marcada ausencia de contraste entre las estructuras anatómicas del corazón (fig. 1.1 c).

a. b. c. Figura 1.1: Imágenes 2D que ilustran: a) Ruido Poisson. b)

Artefacto escalera. c) Ausencia de contraste entre estructuras anatómicas cardiaca.

Page 3: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

3 3 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

En la presente investigación, para abordar los problemas mostrados en la figura 1.1, se propone una técnica computarizada mediante la cual se pretende minimizar el efecto de tales problemas en la calidad de las imágenes y que facilite la segmentación 3-D, de estructuras del corazón derecho en MSCT cardiaca.

En este punto, es importante indicar que entre las estructuras cardiacas más importantes del corazón derecho se pueden mencionar las siguientes: las venas cava inferior y superior, la arteria pulmonar, las válvulas tricúspide y pulmonar, el ventrículo derecho (RV) y la aurícula derecha (RA).

En este sentido, a fin de abordar el mencionado problema, las imágenes de MSCT cardiaca deben ser tratadas considerando etapas de pre-procesamiento y segmentación. Las mencionadas etapas deben someterse a un proceso de validación que permita estimar su desempeño. Primero, se debe implementar una etapa de pre-procesamiento la cual deberá incluir, por una parte, técnicas de filtrado que permitan disminuir el impacto de las imperfecciones que poseen las imágenes consideradas y, por la otra, definir regiones de interés asociadas con las estructuras cardiacas mencionadas.

Luego, se considera una etapa de segmentación mediante la cual se haga uso de algoritmos de agrupamiento que permitan generar la morfología de algunas de las estructuras cardiacas pertenecientes al corazón derecho. Finalmente, para determinar la calidad de los resultados, se desarrollará una etapa de validación que considera la métrica más reportadas en la literatura especializada.

II. GENERALIDADES

a. Marco teórico

En este marco se encuentra el estado de la cuestión la cual relaciona los antecedentes de la investigación y el estado del arte, es decir, las teorías que sustentan la investigación.

1) Antecedentes de la investigación Los antecedentes de la investigación se

refieren a los estudios previos relacionados con el problema planteado, es decir, investigaciones realizadas, anteriormente, y que tienen alguna vinculación con esta investigación. En atención a ello, se presenta a continuación una síntesis de trabajos realizados por otros investigadores

en los cuales se ha abordado directa o indirectamente la segmentación de estructuras cardiacas.

Zhuang et al. [9] proponen un método automático, basado en técnicas de registro de tipo local afín y deformaciones libres dotadas de control adaptativo, para segmentar el corazón en imágenes de resonancia magnética (MRI) cardíaca. La técnica de registro ofrece la correspondencia de sub-estructuras anatómicas como las cuatro cámaras y los grandes vasos del corazón, mientras que las deformaciones libres afinan los detalles locales utilizando un esquema de optimización. Ellos validan el método propuesto considerando 37 volúmenes cardíacos correspondientes a la fase diastólica final. Tales volúmenes exhiben una amplia diversidad de morfología y anatomía patológica, y logran un error cuadrático medio de 2.14 ± 0.63mm. Además, ellos reportan un coeficiente de Dice promedio de 0.84, para la segmentación del ventrículo izquierdo (LV). Una de las características mejorables del enfoque presentado por estos investigadores es el elevado costo computacional por volumen, el cual supera las 2 horas. Este tiempo es típico en los procesos de segmentación basados en técnicas clásicas de registro.

Kirisli et al. [10], presentan un método automático para la segmentación de las cuatro cavidades cardiacas, con un enfoque basado en multi-atlas, en imágenes de MSCT. La robustez del método es evaluado considerando 243 bases de datos, distintas de las usadas para generar el multi-atlas. Ellos reportaron un coeficiente de Dice promedio de 0.91, lo cual indica que el mencionado algoritmo exhibió una alta precisión. Uno de los aspectos mejorables de este algoritmo es el costo computacional, ya que es un hecho conocido que las técnicas clásicas de registro emplean un tiempo muy elevado para producir la segmentación de las estructuras cardiacas presentes en bases de datos de gran tamaño como las de tomografía computarizada cardiaca.

Adicionalmente, Chen et al [8], proponen una técnica basada en modelos de apariencia activa y level set, para segmentar la RA en imágenes de MRI. En esta investigación, los parámetros de forma, del análisis de componentes principales se optimizaron utilizando un modelo energético basado en histogramas globales. Sin embargo, ya que los parámetros de forma abarcan un espacio mucho más pequeño, no puede capturar los detalles finos de los objetos presentes en las imágenes consideradas. Por lo

Page 4: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

4 4 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

tanto, realizaron una segunda etapa de segmentación, basada en level set, para refinar la segmentación generada mediante el modelo de apariencia activa. Estos autores no reportaron ninguna métrica que permita inferir la calidad de la técnica propuesta.

Por otra parte, Liangjia [11], propone una técnica para la segmentación automática de diversas estructuras cardiacas considerando tanto MSCT como MRI. Particularmente, la técnica permite: a) extraer los ventrículos de imágenes de MSCT cardiaca mediante una técnica variacional. b) segmentar la aurícula izquierda presente en bases de datos de MRI considerando un algoritmo de agrupamiento. Estos autores no reportaron ninguna métrica que permita inferir la calidad de la técnica propuesta.

En [12], se propone una técnica automática para segmentar las aurículas en imágenes de MSCT cardiaca, utilizando atlas y técnicas de registro. El error promedio de correspondencia entre superficies fue de 0.53 mm 0.18 mm para la aurícula izquierda y derecha, respectivamente.

Finalmente, Vera [6], propone una estrategia basada en un realce por similaridad local la cual se emplea para el pre-procesamiento y segmentación automática del LV, en imágenes cardiacas 3-D de MSCT. Tal estrategia será identificada, en el contexto de la presente investigación, como E1. Es importante señalar que la investigación desarrollada en [6] es de vital importancia en el desarrollo de la presente investigación por ello, a continuación se realizará la respectiva descripción de E1, considerando como referencia el diagrama de bloques que se presenta mediante la figura 2.1.

Figura 2.1: Diagrama de bloques de la estrategia E1. Tomada de

[6].

De acuerdo con [6] y, apoyándose en la estructura presentada en la figura 2.1, se puede afirmar que E1 consiste de 2 etapas: una de pre-procesamiento y otra de segmentación. La etapa de pre–procesamiento consta de dos fases. En la primera fase, se empleó una técnica denominada realce por similaridad local con el propósito de disminuir las imperfecciones de las imágenes. En la segunda fase, se define una región de interés (ROI) que aísla el LV de las estructuras anatómicas circundantes utilizando una metodología, que considera paradigmas de aprendizaje e información a priori, relacionada con la localización de las válvulas del LV.

Adicionalmente, para la etapa de segmentación 3-D del LV se consideran 3 técnicas de manera independiente, denominadas: a) Crecimiento de regiones (RG) el cual está tipificado como un algoritmo de agrupamiento no supervisado. b) Conjuntos de nivel (o level set) cuya operatividad está basada en técnicas variacionales de tipo computacional. c) Técnica híbrida mediante la cual se inicializan los conjuntos de nivel con segmentaciones preliminares generadas por RG. Durante el proceso de validación la técnica, propuesta en [6], fue comparada respecto con 9 estrategias de segmentación adicionales. Además, E1 requiere del proceso de segmentación para inferir, de manera indirecta, el nivel de calidad de la fase de pre-procesamiento.

E1 presenta la ventaja de requerir un tiempo de cómputo inferior a los 5 minutos para generar segmentaciones del LV con un coeficiente de Dice promedio de 0.91. Esto permitió concluir que la estrategia E1 genera resultados comparables, en precisión, a la mayoría de técnicas reportadas en la literatura. Sin embargo, E1 presenta como aspecto mejorable que requiere de un número elevado de parámetros para lograr su entonación, los cuales son muy difíciles de establecer a priori.

Es muy importante enfatizar que la estrategia de segmentación denominada E1 está basada en el realce por similaridad local, y es parte fundamental de la presente investigación, ya que para segmentar las estructuras del corazón derecho se implementa una variante de E1, que permite verificar si su aplicación genera (ó no) estructuras cardiacas, del corazón derecho, segmentadas con un nivel de precisión y tiempo de cómputo comparable al reportado en la literatura especializada.

Finalmente, se hace necesario señalar que todas las técnicas que conforman la estrategia

Page 5: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

5 5 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

E1, serán descritas en el contexto de las bases teóricas que se presentan a continuación.

2) Bases teóricas En este apartado se presenta una serie de

constructos teóricos que le dan fundamento al problema que se quiere abordar y permite guiar al investigador en la consecución de los fines propuestos. Los constructos a desarrollar son aquellos que están vinculados directa o indirectamente con las variables que se pueden identificar en el título del presente trabajo de investigación, estos son: la segmentación del corazón derecho y tomografía computarizada cardiaca.

2.1) Anatomía del corazón Según Latarjet y Ruíz [13], el corazón se divide

en dos mitades laterales, análogamente constituidas: corazón derecho, en el cual circula la sangre venosa, y corazón izquierdo, vinculado con la sangre arterial. Cada uno de estos corazones se subdivide a su vez en dos mitades, situadas una encima de otra: la cavidad superior, de paredes delgadas y fláccidas llamada aurícula y la cavidad inferior de paredes más gruesas y más resistentes que lleva el nombre de ventrículo. Cada aurícula se comunica con el ventrículo correspondiente por medio de una válvula. La parte superior del corazón está conectada al resto del aparato circulatorio a través de vasos sanguíneos que conducen sangre hacia el corazón y conducen sangre del corazón al cuerpo. La aorta es la arteria principal que conduce la sangre oxigenada desde el ventrículo izquierdo a otras partes del cuerpo; mientras que la arteria pulmonar conduce la sangre para su oxigenación desde el ventrículo derecho a los pulmones.

En la figura 2.2, se pueden apreciar las

principales estructuras anatómicas que conforman el corazón.

Figura 2.2: Vista transversal del corazón humano. Tomado de [13]

Por otra parte, en [13] y [14] se analizan,

desde el punto de vista anatómico, las cámaras cardiacas que conforman el corazón humano. Tales cámaras son: las aurículas y los ventrículos.

El corazón humano, también denominado músculo cardiaco, es un órgano que está dividido por dos tabiques: el inter-auricular el cual separa las aurículas y el inter–ventricular que separa los ventrículos. Adicionalmente, el músculo cardiaco está compuesto por tres capas. Ellas son:

• Endocardio: Es la túnica que tapiza tanto la superficie de las válvulas cardiacas como la cara interna de las cavidades del corazón.

• Miocardio: Constituye las fibras musculares estriadas del corazón.

• Epicardio: Es la túnica externa del corazón la cual está en contacto con la capa visceral de la bolsa que contiene el corazón denominada pericardio. Debido a que las cámaras ventriculares deben soportar mayores esfuerzos que las cámaras auriculares, el miocardio de los ventrículos es más grueso que el miocardio de las aurículas.

A continuación se describe, detalladamente, cada una de las cavidades que conforman el corazón.

Aurículas. En la base del corazón se encuentran las aurículas que son cavidades de paredes delgadas. Su superficie es lisa aunque en sus prolongaciones, denominadas orejuelas, aparecen formaciones carnosas y rugosas. El corazón posee dos aurículas, denominadas derecha e izquierda. Tales aurículas se describen a continuación:

• Aurícula derecha. Es una cavidad de

forma irregular compuesta por paredes delgadas. En ella se observa la desembocadura de las venas cavas (superior e inferior) y el seno

Page 6: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

6 6 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

coronario. • Aurícula izquierda. Esta cavidad tiene

forma de ampolla cuyo eje mayor está ubicado en el plano transversal. Recibe la sangre proveniente de las cuatro venas pulmonares. Al igual que la aurícula derecha está, predominantemente, constituida por un conjunto de paredes lisas.

Ventrículos. Las cámaras ventriculares poseen paredes mucho más gruesas que las aurículas. Las paredes de los ventrículos presentan como rasgos distintivos formaciones irregulares debido a la presencia de unas saliencias musculares denominadas músculos papilares. El corazón posee dos ventrículos, denominados ventrículo derecho y ventrículo izquierdo. Tales ventrículos se describen a continuación:

• Ventrículo derecho. Es una cavidad conformada por paredes con cierto grado de rugosidad. Esta cavidad tiene forma de pirámide irregular y está ubicada prácticamente detrás del esternón. Considerando su ubicación en el ventrículo derecho las paredes son reportadas, en la literatura especializada, de la siguiente manera:

- Pared externo-costal: En su parte inferior

se inserta el músculo papilar de primer orden del cual parten las cuerdas tendinosas que controlan la valva anterior de la válvula tricúspide.

- Pared septal: Esta pared corresponde con el tabique inter ventricular. Tiene papilares unidos a la valva interna de la válvula tricúspide entre ellos el músculo papilar del cono arterial pulmonar.

- Pared diafragmática: Le sirve de soporte a los músculos papilares inferiores que controlan la valva septal de la válvula tricúspide.

• Ventrículo izquierdo. En su extremo postero-superior derecho posee el orificio aórtico, rodeado por un anillo fibroso, en el cual se insertan las valvas de la válvula aórtica. Sus paredes son aproximadamente el doble de gruesas que las del ventrículo derecho. Estas paredes están tapizadas por una malla de trabéculas carnosas. Considerando su ubicación en el ventrículo derecho las paredes son reportadas, en la literatura especializada, de la siguiente manera:

- Pared externa o izquierda: Permite la

inserción del papilar anterior. - Pared septal: Corresponde al tabique

inter–ventricular. Aloja las estrías endocárdicas correspondientes a la rama izquierda del haz de His.

- Pared diafragmática: Está conformada por numerosos músculos papilares destacándose los papilares posteriores e inferiores.

2.1.1) Ciclo cardiaco Las cavidades del corazón laten en secuencia

a través de las siguientes fases: 1. Diástole Auricular: las válvulas aórtica y

pulmonar se cierran, y la presión ventricular disminuye debido a la relajación del musculo ventricular. La sangre desoxigenada pasa a la aurícula derecha mientras la aurícula izquierda recibe la sangre oxigenada.

2. Diástole Ventricular: las aurículas derechas e izquierdas se contraen, haciendo que la sangre vaya a los ventrículos a través de las válvulas mitral y tricúspide [1], por tanto, cualquier obstrucción en cualquiera de las válvulas puede generar la estenosis o insuficiencia valvular.

3. Sístole ventricular: la presión en los ventrículos alcanza su máximo y las válvulas tricúspide y mitral se cierran, mientras se produce la apertura de las válvulas aórtica y pulmonar y posteriormente la sangre oxigenada fluye del ventrículo izquierdo al resto del cuerpo, mientras que la sangre contenida en el ventrículo derecho pasa hacia los pulmones a través de la arteria pulmonar para su oxigenación [15].

4. Sístole auricular: las aurículas se contraen y las válvulas mitral y tricúspide se abren para permitir el flujo de sangre hacia los ventrículos, iniciando nuevamente el ciclo.

2.1.2) Actividad mecánica del corazón El ciclo cardiaco es ocasionado por el

movimiento del corazón el cual es controlado por el funcionamiento de las válvulas cardiacas. A pesar de que las cuatro cavidades del corazón se mueven, los movimientos de las cámaras ventriculares son los de mayor preponderancia, desde el punto de vista clínico [1, 15].

Debido a ello, solo se hace una descripción de los movimientos ventriculares, dirigiendo la atención sobre todo en los movimientos primarios del ventrículo derecho, ya que esta cavidad es de interés para el desarrollo de la presente investigación puesto que este ventrículo es una de las estructuras anatómicas que se pretende segmentar.

Page 7: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

7 7 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

Los movimientos ventriculares no son homogéneos debido, en parte, a las fuerzas externas que ejerce el tórax, la variabilidad del flujo sanguíneo y los tiempos de activación de las fibras contráctiles, la orientación espacial de dichas fibras y a la diversidad de movimientos primarios que conforman el movimiento global de cada ventrículo [16]. Tales movimientos se describen a continuación, discriminados en función de cada ventrículo:

• Movimientos primarios del ventrículo derecho. El movimiento global del RV está compuesto por tres movimientos primarios. Ellos son: a) movimiento de traslación; b) movimiento del plano de la válvula tricúspide hacia la pared externo–costal del RV; c) movimiento contráctil de la circunferencia endocárdica hacia el centro de la cámara ventricular derecha [17].

• Movimientos primarios del ventrículo izquierdo. El LV experimenta, durante la sístole, cinco movimientos específicos no uniformes. Ellos son: a) movimiento de traslación; b) movimiento de rotación; c) movimiento de torsión; d) movimiento de acordeón o de contracción longitudinal; e) movimiento de la circunferencia endocárdica hacia el centro de la cámara ventricular izquierda. Este movimiento también se denomina transversal o de contracción radial.

Seguidamente, [18] reportan los siguientes descriptores cardiacos para el volumen del ventrículo derecho, de personas consideradas normales, estimadas a partir de MRI:

• RV volumen diastólico final: 138 40 ml (varones: 157 35 ml, hembras: 106 24 ml).

• RV volumen sistólico final: 54 21 ml (varones: 63 20 ml, hembras: 40 14ml).

• RV fracción de eyección: 61 7% (varones: 60 7% ml, hembras: 63 8%).

Los parámetros se expresan mediante la combinación del valor medio desviación estándar. El volumen sistólico sería aproximadamente el mismo que para el ventrículo izquierdo debido al sistema de bucle cerrado del corazón y las venas. Sin embargo, la fracción de eyección no, necesariamente, tiene que ser la misma que para el ventrículo izquierdo, porque el volumen diastólico no necesariamente es el mismo [18].

2.2.1.3 Anatomía de las válvulas cardiacas Las válvulas cardiacas son las responsables

de impedir que la sangre fluya en dirección contraria entre aurículas y ventrículos, así como entre ventrículos y arterias tanto aorta como pulmonar. Cualquier obstrucción o afección

valvular produce disminución del flujo sanguíneo y en algunos casos regurgitación valvular y como consecuencia se altera la hemodinámica del aparato valvular y del ciclo cardiaco. Existen cuatro válvulas [14], que controlan la dirección del flujo de la sangre en diástole y sístole (ver figura 2.3).

Figura 2.3: Anatomía de las válvulas cardiacas. Tomado de [13]. 2.1.3.1) Válvula aórtica La válvula aórtica (AV) se compone de un

anillo, 3 cúspides, y 3 comisuras. El anillo aórtico es un anillo fibroso adherido en el endocardio en la unión seno tubular al que se atribuyen las 3 cúspides. A diferencia de la válvula mitral, la válvula aórtica carece de cuerdas tendinosas y de músculos papilares. La cúspide posterior carece de una arteria coronaria, por ello se denomina cúspide no coronaria.

La separación de las 3 cúspides aórticas son las 3 comisuras de aorta, que son más o menos equidistantes alrededor del anillo de la válvula. En sístole, la presión en el ventrículo izquierdo causa que las cúspides aórticas se abran. En esta posición, las cúspides producen un orificio de forma triangular, que se amolda a la estructura circular del anillo. En diástole disminuye la presión ventricular y las cúspides aórticas se cierran. Se han identificado distintas afecciones relacionadas con estas válvulas, como estenosis aórtica, regurgitación valvular, endocarditis valvular y fibroelastomas papilares.

2.2.1.3.2 Válvula pulmonar Es virtualmente idéntica en su diseño a la

válvula aórtica, está compuesta por tres valvas, anterior, posterior derecha y posterior izquierda, por tres comisuras, y un anillo con inserción

Page 8: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

8 8 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

semilunar; una parte en la pared de la arteria pulmonar y otra en el miocardio ventricular derecho, lo que determina que no se observe a nivel de la válvula pulmonar la presencia de un anillo fibroso circular, sino en forma de corona de tres picos, los triángulos subcomisurales; incorporados al tracto de salida ventricular derecho, la unión sinotubular y los senos de valsalva. La válvula pulmonar evita el flujo retrogrado del conducto pulmonar al ventrículo derecho; es decir que controla el flujo de sangre entre el corazón y los pulmones. La enfermedad más común es la estenosis, o estrechamiento, ocurre cuando la válvula no se puede abrir lo suficiente y, como resultado, hay menos flujo de sangre a los pulmones, generalmente es congénita y ocurre durante la formación del feto [14].

2.1.3.3) Válvula mitral El aparato de la válvula mitral comprende el

anillo valvular mitral en forma de D; en el cual se entrelazan las fibras auriculares, las cuerdas tendinosas; que unen los músculos papilares con los velos y funcionan como tensores en el cierre valvular, los músculos papilares; que se conocen como anterolateral y posteromedial, los velos mitrales y las comisuras. Durante las fases de diástole la válvula mitral permite el paso de la sangre desde la aurícula izquierda hacia el ventrículo izquierdo y durante la fase de sístole se cierra para evitar el flujo retrogrado de la sangre hacia la aurícula izquierda, mientras que su velo anterior permite el flujo hacia la aorta [14].

2.1.3.4) Válvula tricúspide Similar a la válvula mitral, tiene forma elíptica

con componentes rectos y curvos, esta se localiza en la unión áuricoventricular derecha y también se describe como una válvula atrioventricular. Su aparato comprende tres valvas; medial o septal, anterosuperior y los posteriores o inferiores, un anillo valvular; en el que las valvas están articuladas, comisuras, cuerdas tendinosas y los músculos papilares. No hay un anillo fibroso bien formado para la válvula tricúspide, y está sujeto sólo en un punto al trígono fibroso derecho.

Las cuerdas tendinosas alcanzan la superficie septal ventricular. La válvula tricúspide regula el flujo de sangre de la cavidad superior derecha del corazón (aurícula derecha) a la cavidad inferior derecha (ventrículo derecho), evitando que la sangre fluya en la dirección contraria.

Para efectos de la presente investigación se tiene especial interés en la válvula pulmonar y tricúspide. En [19], se presenta una caracterización de las válvulas, en condiciones normales el área en de la válvula aórtica oscila en un rango de [2.6 – 3.5], con estenosis presenta una reducción de [1.30- 1.75], la mitral de [4.0 – 6.0] en condiciones normales y de [2.5 – 1.0] con estenosis, la tricúspide [10.0 – 13.0] y con estenosis una reducción de menos de 5, y la pulmonar con estenosis presenta una reducción de [1.30- 1.75].

2.1.4) Descriptores clásicos de la función cardiaca La cuantificación y el monitoreo de la función

cardiaca son actividades importantes en la rutina clínica. Estas actividades pueden hacerse con base en la estimación, para las cavidades ventriculares, de ciertos descriptores. Entre los descriptores clásicos más importantes, para la estimación de la función cardiaca, se encuentran: la masa de las cavidades ventriculares, el volumen diastólico final (FDV), el volumen sistólico final (FSV), el volumen latido (SV), el movimiento regional y el stress de las paredes ventriculares, la fracción de eyección (EF) y el gasto cardiaco (CO). Normalmente, la obtención de tales descriptores y por ende la valoración de la función cardiaca requiere de la segmentación de las cámaras ventriculares [20].

Para la presente investigación, los descriptores cuantitativos de la función cardiaca que revisten especial importancia son los siguientes: FDV, FSV, SV, EF y CO. Los modelos matemáticos que permiten estimar estos descriptores se presentan a continuación:

• Volumen latido (SV). Es el volumen eyectado entre la diástole final y la sístole final [21]. Puede calcularse usando la ecuación 2.1.

SV = FDV − FSV , (2.1)

en la cual FDV y FSV se calculan multiplicando las dimensiones del vóxel por el número de vóxeles que conforman el RV segmentado, en diástole final y sístole final, respectivamente.

• Fracción de eyección (EF). Es un índice global del acortamiento de la fibra del RV y es considerado como uno de los descriptores más significativos del funcionamiento del RV [21]. La ecuación 2.2 permite calcular el valor porcentual de la EF [20].

• Gasto cardiaco (CO). Es la cantidad de

sangre bombeada por el corazón hacia la arteria

Page 9: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

9 9 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

aorta en cada minuto y depende de la frecuencia cardiaca (HR) [22]. Se considera el factor más importante respecto a la circulación sanguínea y se calcula usando la ecuación 2.3.

CO = SV ∗ HR . (2.3)

Es importante señalar que en las referencias [23], [20] y [24] se han reportado diversas investigaciones mediante las cuales se estiman los mencionados descriptores a partir de imágenes del corazón obtenidas mediante las distintas modalidades de imagenología cardiaca, reportadas en la literatura. Tales modalidades se presentan en el siguiente apartado.

2.2.2) Modalidades de imagenología cardiaca Diversos parámetros cuantitativos de

importancia clínica pueden ser extraídos a partir de imágenes dinámicas de las estructuras cardiovasculares con la idea de caracterizar el comportamiento espacio–temporal del corazón. En cardiología, casi todas las modalidades imagenológicas son usadas [25].

De acuerdo con [6], entre las modalidades de imagenología médica se tienen las que se muestran en la figura 2.4.

Figura 2.4: Visión integrada de las principales modalidades de la

imagenología médica.

2.2.1) Ultrasonido Las imágenes obtenidas por ultrasonido (US)

son, esencialmente, una medida de la respuesta

acústica de un impulso a una señal con una frecuencia particular. Normalmente, un transductor ultrasónico es capaz de producir ondas acústicas mediante la conversión de las energías térmica, eléctrica y magnética, en energía mecánica; siendo el efecto piezoeléctrico el proceso más eficiente al momento de realizar este proceso de conversión, para obtener imágenes médicas usando US.

El US del corazón, denominado ecocardiografía, permite la realización de estudios no invasivos de la anatomía de las estructuras intra-cardiacas. Cuando el estudio ecocardiográfico se realiza en dos dimensiones, se aprecia la fuerte dependencia que el proceso global de generación de imágenes presenta con respecto al operador del equipo de ecocardiografía. Esto se debe a que el referido operador hace un proceso de reconstrucción mental para obtener la anatomía tridimensional a partir de la información 2-D recabada; con las consecuencias que ello implica como, por ejemplo, la no reproductibilidad fiable de dicho proceso [26].

2.2.2) Emisión nuclear Se caracteriza por el uso de sustancias

radiactivas (radio-isótopos) para trazar las rutas metabólicas del organismo. Esta técnica se basa en la visualización y cuantificación de los rayos gamma que marcan los trazadores radioactivos [27], esta modalidad se subdivide en dos técnicas: tomografía por emisión de positrones (PET) y tomografía por emisión de fotón único (SPECT) [28], esta última es de gran aplicación en el diagnóstico cardiovascular, puesto que las deficiencias cardiacas se manifiestan en reacciones bioquímicas que se producen por la interacción de los isótopos.

2.2.3) Resonancia magnética Proporciona imágenes morfológicas y

funcionales con gran variedad de contrastes en tejidos blandos y buena resolución espacial, se destaca la resonancia magnética en imágenes para extraer información de las estructuras cardiacas del corazón. Esta técnica consiste en irradiar con pulsos de ondas de radiofrecuencias la materia que previamente ha sido sometida al efecto de un campo electromagnético, al interrumpir los pulsos de radiofrecuencias se libera energía y emiten señales de radio que son analizadas por un ordenador que trasforma la información en imágenes [29].

Modalidades de

Emisión

Ultrasonido

Tomografía

por emisión de

positro

Tomografía

por emisión de

fotone

Resonancia

Emisión de

Tomografía

computarizada

(CT)

Angiografía

Dividida

Dividida

Page 10: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

1

1 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

2.2.4 Angiocardiografía La angiografía es una técnica, basada en

rayos–X, que permite estudiar las cavidades cardiacas, las arterias y las venas. Mediante esta técnica se puede diagnosticar bloqueos y otros problemas en los grandes vasos sanguíneos. Cuando esta técnica se usa en el ámbito cardiaco, recibe el nombre de angiocardiografía.

La angiocardiografía posibilita la visualización de los grandes vasos sanguíneos cardiacos (arterias y venas cardiacas) de imágenes obtenidas en diversos planos de proyección. De esta manera, la angiocardiografía es capaz de proveer suficiente información para la evaluación de tales vasos a través del ciclo cardiaco completo [30]. Típicamente, esta técnica usa un procedimiento denominado cateterismo para introducir en el corazón del paciente, un medio de contraste que posibilita la visualización de las estructuras cardiacas cuando la sangre entra y sale de ellas [31].

Además, el uso de detectores digitales, en sistemas para la adquisición de imágenes basados en rayos–X, ha permitido elevar la calidad de las imágenes obtenidas por angiografía y promover su uso en la valoración de la función cardiaca de un paciente [32].

Además, la calidad de las imágenes obtenidas por angiografía exhiben un tipo de ruido de aspecto granular que puede ser modelado, aproximadamente, mediante una función de densidad de Poisson y que es reportado en la literatura como ruido cuántico [30].

2.2.5) Tomografía computarizada (CT) Cuando se aplica la modalidad de CT, en

imágenes médicas, se produce el proceso de escaneo de secciones del órgano que se desea estudiar. Dicho proceso consiste en el paso, a través del referido órgano, de un estrecho haz de rayos–X el cual es emitido por un tubo de rayos–X que rota alrededor del paciente. La atenuación a lo largo de la trayectoria de tales rayos se mide mediante detectores.

Adicionalmente, los métodos empleados para la reconstrucción de las imágenes 3-D que componen los volúmenes explorados mediante CT, son clasificados en tres grupos. Ellos son: métodos directos [33], métodos algebraicos iterativos [34] y métodos estadísticos [35].

Los métodos de reconstrucción pueden usarse para calcular el valor del coeficiente de atenuación en cada punto de la sección del cuerpo escaneado. Los valores de atenuación

relativa son expresados en unidades Hounsfield (HU) y son representados como una imagen en escala de grises. La escala HU no posee límite superior. Sin embargo, en aplicaciones médicas el rango que, típicamente, se reporta va desde -1024 HU hasta +3071 HU. En consecuencia, se dispone de 4096 niveles de gris y por tanto se requiere de una tasa de muestreo mínima de 12 bits por vóxel [36].

En el área cardiaca, la cual es de principal interés para el desarrollo de la presente investigación, existen dos requerimientos básicos para la adquisición mediante CT de imágenes del corazón de resolución aceptable. Ellos son: alta resolución temporal para prevenir los artefactos de movimiento y elevada resolución espacial que permita capturar y definir en detalle pequeñas e importantes estructuras anatómicas tales como las válvulas cardiacas, las valvas y las arterias coronarias [36,37].

Estos requerimientos han promovido un conjunto de innovaciones tecnológicas que han desembocado en diversas variantes de la CT convencional, entre los cuales se pueden mencionar: tomografía computarizada espiral, tomografía computarizada por rayo electrónico (EBCT), tomografía multi–capa sincronizada con el ECG (MSCT) y tomografía computarizada con doble fuente de rayos–X (DSCT) [37].

Adicionalmente, luego de la introducción de equipos de tomografía, denominados scaners o tomógrafos, dotados con 16, 64, 128, 256 y 320 detectores se ha logrado producir imágenes con una excelente resolución espacial y en cuanto a la resolución temporal se ha mejorado la capacidad de cobertura de secciones del cuerpo humano por rotación. Por ejemplo, en DSCT apenas se requiere de 320 milisegundos para generar imágenes del corazón representativas de un ciclo cardiaco completo [37].

2.3) Técnicas vinculadas con la etapa de pre-

procesamiento de imágenes En el contexto de la presente investigación las

técnicas de pre-procesamiento de imágenes se analizan considerando las dos categorías siguientes: a) Técnicas de filtrado y b) Técnicas para la definición de regiones de interés. Normalmente, las técnicas de filtrado se caracterizan por realizar tareas tales como: atenuar distorsiones que afectan la calidad de la imagen considerada, realzar los contornos que delimitan los objetos que se desean segmentar, uniformar la información contenida en el interior

Page 11: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

1

1 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

de tales contornos [38]; mientras que las técnicas para la definición de regiones de interés permiten excluir objetos ó estructuras no deseadas generando regiones claramente delimitadas que contienen el objeto de interés que se pretende segmentar [39].

2.3.1) Técnicas de filtrado Las técnicas de filtrado constituyen un proceso

fundamental para el posterior análisis de la información contenida en las mismas debido a que su aplicación permite minimizar el impacto, sobre la calidad de las imágenes, de las imperfecciones que se producen durante su adquisición, almacenamiento y/o transmisión [39].

2.3.2) Técnicas de filtrado vinculadas con la

estrategia E1. A continuación se describe, de manera

sintética, las técnicas de filtrado que conforman la estrategia E1. La figura 2.5, presenta un diagrama de bloques de la etapa de filtrado prevista, en E1, para atenuar el ruido y disminuir el efecto de los artefactos presentes en imágenes cardiacas de MSCT.

Figura 2.5: Etapa de pre-procesamiento desarrollado en el contexto de E1.

2.3.2.1) Filtro promediador El filtro promediador es una técnica de filtrado

espacial no lineal que ha sido usada para atenuar ruido de tipo aleatorio. Este filtro

requiere para su operacionalización de un cierto umbral (ε). Mediante esta técnica se reemplaza el nivel de gris del elemento actual de una imagen de entrada por el nivel de gris promedio de una vecindad, de radio (Rp), del elemento actual si y solo si se cumple la condición expresada mediante la ecuación 2.4 [39].

(2.4) Es importante señalar que, el radio de la

referida vecindad debe elegirse cuidadosamente pues si es muy pequeño el efecto del filtro puede ser despreciable y si es muy grande puede introducir una borrosidad inadecuada en la imagen suavizada. Este filtro requiere de 2 parámetros para su implementación (Rp y ε).

2.3.2.2) Filtro gaussiano El filtro gaussiano está caracterizado como

una técnica espacial lineal que se ha utilizado clásicamente para minimizar el ruido presente en imágenes. Existe una relación entre la cantidad de ruido que se atenúa mediante la aplicación de este filtro y el desenfoque de la imagen [6].

Este tipo de filtro emplea una distribución gaussiana discreta la cual puede expresarse mediante una máscara o kernel gaussiano, de tamaño arbitrario. Si se pretende suavizar, por ejemplo, una imagen 3-D los escalares que conforman el referido kernel pueden obtenerse de acuerdo con ecuación 2.5.

(2.5) Siendo , n el tamaño del kernel gaussiano, ,

y las desviaciones estándar para cada dimensión espacial.

En la práctica, el filtrado gaussiano se implementa mediante la convolución de la imagen original con el referido kernel gaussiano [40]. Los parámetros de este filtro son: la desviación estándar de cada una de las dimensiones espaciales y el radio (r) que define el tamaño (n) de la máscara, dado por la ecuación 2.6.

n = 2r + 1, (2.6)

Siendo r un escalar arbitrario. Una variante del filtrado gaussiano básico es

el filtro gaussiano multi–escala ( ). Este tipo de variante ya ha sido considerada en el procesamiento de imágenes médicas. En [6] se establece que para generar un volumen suavizado mediante el filtro , se pueden considerar los siguientes pasos:

1. El volumen original es filtrado, de manera independiente, con un kernel gaussiano de

Page 12: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

1

1 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

tamaño fijo pero con desviación estándar variable, es decir, se obtienen varias versiones suavizadas del volumen original.

2. Un único volumen filtrado se genera mediante la suma de los volúmenes suavizados.

3. El volumen obtenido en el paso anterior es re-escalado, aplicando la ecuación 2.7, de tal manera que la información en la imagen resultante conserve el rango de intensidad original. Este volumen re–escalado representa el volumen gaussiano multi–escala .

(2.7) siendo el nivel de gris del vóxel actual, min y

max los niveles de gris mínimo y máximo determinados sobre toda la imagen, respectivamente.

Es importante señalar que los valores óptimos de los 2 parámetros correspondientes a la desviación estándar y el tamaño del kernel gaussiano, de ambos filtros, deben establecerse heurísticamente, ya que dependen de cada aplicación particular [6].

2.3.2.3) Filtro basado en morfología matemática La morfología matemática está basada en la

teoría de conjuntos, debido a ello, los objetos presentes en una imagen pueden ser tratados como conjuntos de puntos. Generalmente, es posible definir operaciones entre dos conjuntos constituidos por elementos pertenecientes a los referidos objetos y a un conjunto denominado elemento estructurante [41].

Los elementos estructurantes pueden visualizarse como vecindades del elemento objeto de estudio las cuales poseen morfología (forma) y tamaño variable [38]. La morfología matemática se implementa, en la práctica, mediante diversos filtros morfológicos cuyos operadores básicos son la dilatación y la erosión [42]. Estos operadores son filtros espaciales no lineales que pueden ser aplicados sobre imágenes binarias, en escala de grises ó a color.

En el marco del presente trabajo, son de principal interés las imágenes en escala de grises puesto que las imágenes cardiacas de MSCT son de este tipo. Por esta razón, la descripción de los filtros morfológicos que se hace a continuación se presenta con base en imágenes en escala de grises.

La dilatación de una imagen 2–D (I) utilizando un elemento estructurante bidimensional (B) se define mediante la ecuación 2.8 [43] [44].

(2.8) donde: s y t definen el tamaño del elemento

estructurante, max representa el nivel de gris máximo contenido en B y (x,y) representa la posición del píxel objeto de estudio.

La erosión de una imagen 2–D (I) utilizando un elemento estructurante bidimensional (B) se define mediante la ecuación 2.9 [43] [44]:

(2.9) donde: s y t definen el tamaño del elemento

estructurante, min representa el nivel de gris mínimo contenido en B y (x,y) representa la posición del píxel objeto de estudio.

De acuerdo con la ecuación de la dilatación, para aplicar el operador de dilatación, se recorre la imagen de entrada con un elemento estructurante o vecindad de tamaño arbitrario, reemplazando el nivel de gris de cada uno de los elementos de tal imagen por el nivel de gris máximo contenido en la mencionada vecindad [6].

Por otra parte, el operador de erosión hace un proceso análogo al de dilatación sólo que considerando el nivel de gris mínimo.

Es importante indicar que la combinación adecuada de los operadores de dilatación y erosión permite generar una serie de filtros que se aplican, usualmente, en el procesamiento de imágenes algunos de los cuales se describen a continuación.

Una operación morfológica muy útil es la clausura morfológica ( ) o closing la cual resulta de la aplicación del operador de erosión a una imagen de entrada (I) que ha sido procesada con el operador de dilatación (⊕). El closing se utiliza para cerrar canales estrechos y rellenar pequeños orificios dentro de una imagen. La ecuación 2.10 representa la formulación matemática del closing [42].

(2.10) siendo B el elemento estructurante. La apertura morfológica u opening se utiliza

para suavizar los contornos, y suprimir pequeñas islas entre elementos de una imagen y picos dentro de ella. Se obtiene al aplicar un operador de dilatación a una imagen erosionada. La ecuación 2.11 representa la formulación matemática del opening [42].

(2.11) Otra técnica derivada de la combinación de las

operaciones morfológicas consideradas anteriormente es la transformación top hat. En [45], se afirma que la transformación top hat puede ser considerado como un filtro de gradiente morfológico, es decir, el filtro top hat

Page 13: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

1

1 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

detecta las variaciones de intensidad que se produce en una imagen considerando un elemento estructurante y operadores morfológicos. Lo anterior implica que la transformación top hat se comportan como un filtro paso alto y, por tanto, es capaz de detectar los bordes de los objetos presentes en una imagen. Este tipo de filtro puede implementarse en las versiones que se describen a continuación:

• Black top hat. El calificativo black es debido a que la aplicación de este filtro tiende a oscurecer la imagen de entrada. El modelo matemático de este filtro viene dado por la ecuación 2.12 [43].

(2.12) • White top hat. El calificativo white es

debido a que la aplicación de este filtro tiende tornar “más clara” la imagen de entrada. El modelo matemático de este filtro viene dado por la ecuación 2.12 [43].

(2.13) Para implementar computacionalmente este

filtro, en cualquiera de sus versiones, se requiere de 4 parámetros vinculados con la forma y el tamaño del elemento estructurante tanto para la dilatación como para la erosión.

2.3.2.4) Filtro basado en realce por similaridad local Esta técnica se basa en la comparación de dos

versiones pre–procesadas de una imagen original para establecer que tan similares son entre sí tales versiones. Normalmente, en una de las versiones pre-procesadas se realzan los bordes que delimitan las fronteras de los objetos que conforman la imagen original; mientras que en la otra versión se busca minimizar el efecto del ruido que caracteriza las imágenes cardiacas de MSCT y reforzar la información interna a los mencionados bordes [6].

A continuación se presentan los aspectos de tipo práctico que deben considerarse durante la aplicación de cada uno de los filtros que conforman el realce por similaridad local.

1. Imagen resultante del filtro promediador (Ip): al pre–procesar una imagen de entrada (I) mediante un filtro promediador se genera una imagen suavizada (Ip). El propósito de considerar este tipo de filtro es proporcionar un medio para disminuir el efecto del ruido Poisson en las imágenes cardiacas de MSCT. En este sentido, el umbral ε previsto en este filtro, se hace coincidir con la desviación estándar (σ) de

la imagen de entrada contaminada con ruido. Esta elección se apoya en el hecho de que tal desviación constituye una medida del nivel de ruido que posee I.

2. Imagen top hat ( ): el propósito al considerar el filtro top hat es realzar los bordes de los objetos presentes en las imágenes cardiacas de MSCT. Para generar esta imagen, se introduce una variante en las ecuaciones 2.10 y 2.11. La variante consiste en obtener una imagen filtrada ( ), reemplazando la imagen original I por una imagen suavizada usando un filtro Gaussiano multi–escala ( ). Las consideraciones hechas para los filtros de dilatación y erosión 3-D consisten en elegir, elementos estructurantes de forma arbitraria. En [6], por ejemplo, se utilizaron elementos estructurantes de forma elipsoidal con eje mayor orientado en la dirección del eje z y con los ejes menores de igual tamaño entre sí.

3. Imagen de similaridad (Is): en su formulación más común una función de similaridad pretende establecer que tan semejantes son entre sí dos imágenes de entrada. Normalmente, tales imágenes de entrada se hacen coincidir con dos versiones suavizadas de la imagen original. En este sentido, se eligen como imágenes de entrada para la función de similaridad las imágenes provenientes de los filtros: a) Top hat y b) Promediador.

La información proveniente de los niveles de gris, tanto del elemento actual como de sus vecinos directos en ambas imágenes de entrada, es considerada para generar la imagen , de acuerdo con una función de similaridad que puede modelarse, matemáticamente, mediante la ecuación 2.14.

(2.14) donde: y (con = 1, 2, . . . , 6) son los

niveles de gris de los 6 vecinos de y , respectivamente, n es el número de vecinos directos de tales elementos centrales, y son las intensidades de los elementos centrales de una vecindad de forma arbitraria considerada sobre y ., respectivamente.

La ecuación 2.14, representa una suma no ponderada de los cuadrados de las diferencias de los mencionados niveles de gris. En la mencionada ecuación, se respeta el conjunto de diferencias y el orden peculiar de los elementos que conforman dichas diferencias, tal y como fue reportado en [46].

Page 14: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

1

1 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

Adicionalmente, es importante indicar que la aplicación de tal ecuación genera una imagen de similaridad, por cada número particular de vecinos considerados, es decir, se generan en total 6 casos, ya que se considera la incorporación sistemática de cada uno de los 6 vecinos directos del elemento actual. Para determinar cuál de las imágenes de similaridad representa el caso óptimo, se recurre a un proceso de entonación de parámetros [6].

Para ilustrar la aplicación de la ecuación 2.14, en la imagen , la expresión representa el nivel de gris de un vóxel ubicado, en una vecindad en forma de cruz, en la posición (i, j, k); mientras que sus vecinos y en la mencionada vecindad, representan los niveles de gris de los vóxeles (i, j + 1, k), (i, j, k + 1),(i, j −1, k), (i, j, k−1), (i+1, j, k), (i−1, j, k), respectivamente. De igual forma, los vóxeles en la imagen son denotados con b y sus respectivos sub–índices los cuales representan la misma posición dentro de la vecindad considerada. Para efectos de la presente investigación solo se describirá el caso 6, el cual, es el más completo de todos los casos. Los demás casos están explicados detalladamente en [6]. La imagen de similaridad, se obtiene considerando los 6 vecinos directos del vóxel central que se presentan mediante la figura 2.6.

Figura 2.6: Caso 6 de Similaridad. a) Vóxeles en . b) Vóxeles en . (Tomado de [6]). 4. Imagen de similaridad suavizada: cada

imagen generada mediante la función de similaridad es procesada con un filtro Gausiano simple para obtener, finalmente, una imagen de similaridad suavizada ( ). De manera análoga a como se hizo para el filtro promediador, la desviación estándar requerida por el filtro gaussiano se hace coincidir con la desviación estándar de , debido a que este estadístico es un indicador del nivel de ruido de la imagen que se pretende suavizar. La razón por la cual, se aplica este filtro es debido a que el filtro top hat, utilizado preliminarmente, al comportarse como

un detector de bordes podría amplificar el ruido presente en las imágenes de entrada [42].

Por tanto, el filtro gaussiano es usado para minimizar el efecto del referido tipo de ruido, mientras que, eligiendo apropiadamente su desviación estándar (σ), puede preservar los bordes más fuertes.

2.3.2) Definición de una región de interés La definición de región de interés es

importante en las imágenes cardiacas ya que las mismas tienen bajo contraste como se explicó anteriormente. El bajo contraste significa que existe alta similitud de la intensidad de los niveles de gris de los vóxeles que conforman las estructuras cardiacas próximas entre sí. Ello requiere la elección de ciertos puntos de referencia los cuales dependen de la estructura que se desee segmentar. En el corazón izquierdo, por ejemplo, si se requiere segmentar el LV, de acuerdo con [6], se consideran como puntos de referencia la unión del LV con la aurícula izquierda, el ápex izquierdo y la unión del LV con la válvula aórtica.

En [6], para la colocación automática de tales planos se lleva a cabo lo siguiente: a) Las imágenes filtradas de tamaño 512 512 son llevadas al tamaño 64 64, considerando una técnica basada en transformada wavelet (WT). b) Los puntos de referencia descritos anteriormente, son localizados por un cardiólogo en las imágenes de 64 64. c) Se implementan máquinas de soporte vectorial de mínimos cuadrados (LSSVM) [47] para identificar, de manera automática, dichos puntos de referencia en imágenes no utilizadas durante el entrenamiento.

Como se aprecia la colocación de planos en [6], requirió de la combinación de dos técnicas: Transformada wavelet + LSSVM. Por ello, tales técnicas se presentan en seguida.

2.3.2.1) Transformada wavelet (WT) Los fundamentos teóricos de la transformada

wavelet fueron introducidos principalmente por Meyer [48], Daubechies [49] y Mallat [50]. Tales fundamentos son bastante sólidos y están vinculados con conceptos de algebra y análisis matemático, lo cual ha despertado el interés en la WT de una buena cantidad de investigadores pertenecientes a diversas áreas. No obstante, debido a que la WT es utilizada en [6] como una técnica auxiliar, a continuación se presenta sólo una breve descripción de la misma.

La WT se ha constituido, en la actualidad, en

Page 15: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

1

1 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

una de las técnicas de filtrado más usadas debido a que, por una parte, se comporta eficientemente durante el análisis local de funciones no estacionarias de rápida transitoriedad y, por la otra, posee la capacidad de generar representaciones tiempo-escala de la función analizada preservando su aspecto temporal [51].

Las wavelets son funciones base de la WT que se generan a partir de una función wavelet básica mediante traslaciones y cambios de escala espacial (dilataciones o contracciones) [49]. La wavelet básica recibe, usualmente, denominaciones tales como ondita, onda pequeña, ondaleta o wavelet madre. Entre las ondaletas más importantes se encuentran las siguientes: Morlet, Gaussiana compleja, Haar, Daubechies, Coiflet, sombrero mexicano, Shannon compleja y symlet.

La WT provee análisis multiresolución (técnica que permite analizar señales en múltiples bandas de frecuencia) con ventanas escaladas. Así, el análisis de las bandas de frecuencias de mayor rango, presentes en una función, se realiza usando ventanas contraídas (angostas); mientras que el análisis de las frecuencias de menor rango se hace utilizando ventanas dilatadas (anchas) [52]. En el área específica de las imágenes, la transformada wavelet permite la representación de una imagen mediante descomposiciones o coeficientes que miden el grado de correlación o similitud entre la imagen original y versiones escaladas y trasladadas de la wavelet madre [50]. Existen varias formas de obtener los mencionados coeficientes, una de ellas es mediante la aplicación de un banco de filtros (paso bajo y paso alto) sobre una imagen en su resolución original [50].

2.3.2.2) Método basado en aprendizaje estadístico La teoría de aprendizaje estadístico creada por

Vapnik [53] ha permitido la creación de métodos para desarrollar procesos de clasificación de patrones y de aproximación funcional basados en la construcción de funciones discriminantes que explotan las ventajas de los principios de minimización tanto del riesgo empírico como del riesgo estructural [53].

1. Máquinas de soporte vectorial (SVM). Las máquinas de soporte vectorial (SVM) son

paradigmas que se someten a procesos de entrenamiento y detección, y están basados tanto en la teoría de aprendizaje de Vapnik–Chervonenkis como en el principio de minimización que considera el riesgo estructural

[53]. Las SVM pueden ser consideradas como herramientas de clasificación y de aproximación funcional [54, 55].

El propósito de una SVM es trasladar los datos originales (configurados como arreglos vectoriales que contienen atributos) desde el espacio de características original (espacio de entrada) hasta un nuevo espacio de características transformado, de mayor orden e incluso de orden infinito, en el cual el problema de clasificación puede ser abordado de una manera más sencilla. Así, se puede afirmar que las SVM operan sobre vectores, de características, que han sido transformados a un espacio de dimensión mayor a la del espacio de características original [56].

Cuando las SVM son consideradas en el contexto de la clasificación binaria supervisada, los vectores de entrenamiento (que contienen los atributos que caracterizan la data original ( ∈ ) y un conjunto de etiquetas ( ∈ {−1, 1}), son usados para encontrar el hiper–plano de separación ´optimo que permite clasificar datos de prueba. Concretamente, las SVM transforman el vector m–dimensional x desde el espacio de entrada hasta el espacio de características n–dimensional, con m < n, usando una función de transformación, que puede ser o no lineal, dada por: Φ(·): → (ver figura 2.7).

Figura 2.7: Transformación de los datos del espacio de características original al espacio de características.

El hiper–plano separación o superficie de

decisión, se define mediante la ecuación 2.15. siendo w un vector desconocido en base al

cual se formula la función a optimizar y b (denominado valor de off–set) un parámetro, también desconocido, cuyo valor determina si el hiper–plano contiene ó no el origen del sistema de coordenadas considerado. La utilidad del

Page 16: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

1

1 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

hiper–plano, definido mediante la ecuación 2.15, es la asignación automática de una etiqueta (signo), negativa ó positiva, a cada vector que se presenta a la entrada de la SVM, para su clasificación. Ello puede hacerse mediante la ecuación 2.16.

La ecuación 2.16, permite la clasificación de

los vectores de entrada a la SVM, como se indica a continuación. Si x es un vector de entrada, entonces:

1) x es asignado a la clase 1, si se cumple que:

2) x es asignado a la clase 2, si se cumple que:

Un aspecto crucial para la referida clasificación

es determinar tanto el parámetro b como el vector w. Este aspecto se desarrolla en el resto de la presente sección.

De acuerdo con [57], las SVM consideran el principio de margen máximo para construir un hiper-plano con máxima distancia entre las dos clases mencionadas. Adicionalmente, el problema de optimización que se genera al considerar máquinas de soporte de vectorial puede formularse como un problema de optimización cuadrática tal y como lo indican las ecuaciones 2.17 y 2.18. En la ecuación 2.17, ζ1(w, ξ) representa la función a optimizar, en este caso, tal función seria sometida a un proceso de minimización. Además, la ecuación 2.18 representa el conjunto de restricciones que condicionan el mencionado proceso de optimización.

siendo N el número de vectores de entrenamiento, C una constante de regularización positiva que establece el equilibrio entre un margen de clasificación amplio y el error de clasificación. Además, es el conjunto de etiquetas dado por: ∈ {−1, 1}.

En las ecuaciones 2.17 y 2.18, el parámetro permite establecer, durante el entrenamiento, la distancia de con respecto al hiper-plano o superficie de decisión. Pudiéndose presentar los siguientes casos:

• Si , entonces se clasifica correctamente y se encuentra fuera del margen ó en el límite del margen de clasificación.

• Si entonces es clasificado correctamente y se encuentra dentro del margen.

• Si , entonces se clasifica incorrectamente debido a que el signo de la superficie de decisión y el signo (etiqueta) de

son distintos. Por otra parte, debido a que las ecuaciones

2.17 y 2.18 plantean un problema de optimización cuadrática, tiene sentido formular tal problema considerando un método que combina multiplicadores de Lagrange [57] y las condiciones de Karush–Kuhn–Tucker. Tal método, permite generar un sistema de ecuaciones cuya solución resuelve el mencionado problema de optimización. Para ello, se introducen ciertos escalares positivos, denominados multiplicadores de Lagrange. La cantidad de multiplicadores de Lagrange introducida, es igual al número de restricciones que posea el problema de optimización considerado. Además, la implementación del mencionado método puede llevarse a cabo de la siguiente manera:

• Generación del lagrangiano en el espacio primal ( ).

En términos sencillos, el lagrangiano es un funcional que representa una formulación equivalente a la que plantea el problema de optimización original. Para obtenerlo, se resta aritméticamente la función a optimizar y el producto aritmético de los multiplicadores de Lagrange con aquellas restricciones, presentes en la formulación original, basadas en inecuaciones. De esta manera, considerando las ecuaciones 2.17 y 2.18, el viene dado por la ecuación 2.19.

siendo y multiplicadores de Lagrange. • Condiciones de optimalidad vinculadas

con . Las condiciones de optimalidad pueden

establecerse en función de los puntos críticos de . Para obtener tales puntos críticos, se calculan y se igualan a cero las derivadas parciales de , respecto a las variables que aparecen en la formulación original. Una descripción detallada del proceso matemático que se sigue para calcular tales puntos críticos puede consultarse en [57, 47]. Como resultado final de tal proceso se genera un hiper-plano que le permite a la SVM clasificar los vectores de entrada a ella. El mencionado hiper-plano, viene dado por la ecuación 2.20.

siendo el número de vectores de soporte. Es importante señalar que, el cálculo explícito

de las transformaciones y , que se aprecian en la ecuación 2.20, puede resultar ineficiente si se está en presencia en espacios de dimensión

Page 17: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

1

1 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

elevada [57]. Debido a ello, se implementan alternativas para evitar la realización del mencionado cálculo. Una de esas alternativas, es el uso de las denominadas funciones kernels (K( )). Estos kernels permiten calcular productos escalares de la forma , mediante la ecuación 2.21 la cual se genera de las condiciones del teorema de Mercer.

Usando las ecuaciones 2.20 y 2.21 la solución

general por la SVM se expresa mediante la ecuación 2.22:

f(x)=signo��αiyiK(xi,x)+b

Ns

i=1

� 𝐹 2.22 Adicionalmente, es conocido que existe una

amplia variedad de funciones kernel. Una de ella, cuyo uso se ha popularizado, es la denominada función de base radial (RBF) [57]. A manera de ejemplo, la expresión matemática de una RBF se presenta mediante la ecuación 2.23.

siendo un kernel de base radial gaussiana,

cuya selectividad es controlado por el escalar positivo .

Finalmente, para implementar la fase de validación se consideran vectores de entrada no utilizados durante el entrenamiento y se verifica el desempeño de la SVM entrenada, la cual clasifica tales vectores considerando la ecuación 2.22. Lógicamente que, en ambas fases, el se podría hacer coincidir con el kernel gaussiano presentado mediante la ecuación 2.23.

1. Máquinas de soporte vectorial de mínimos cuadrados (LSSVM).

Una variante de las SVM, denominada máquina de soporte vectorial de mínimos Cuadrados (LSSVM), puede obtenerse utilizando estadística robusta, análisis discriminante de Fisher y reemplazando el sistema de inecuaciones que rigen a las SVM, dado por la ecuación 2.18, por un sistema equivalente de ecuaciones lineales, que puede ser resuelto más eficientemente [57, 47]. Adicionalmente, a diferencia de otros sistemas de clasificación basados en aprendizaje como las redes neurales artificiales (NN), las LSSVM utilizan el criterio de minimización del riesgo estructural, que eleva a niveles óptimos la capacidad de generalización de las referidas máquinas, haciendo posible que las LSSVM se desempeñen adecuadamente en el proceso de validación superando en este aspecto a las NN, las cuales utilizan el riesgo empírico [58].

A continuación se presentan los fundamentos matemáticos de las LSSVM los cuales son análogos a los descritos para las SVM.

El problema de optimización que se genera al implementar una LSSVM, puede plantearse inicialmente así:

min𝑤,ξ,b

ζ1(w, ξ)

=12𝑤𝑇𝑤 + 𝛾

12�ξ𝑖

2𝑁

𝑖=1

(2.24)

Sujeto a las siguientes restricciones:

𝑦𝑖[𝑤𝑇Ф(𝑥) + 𝑏] = 1 − ξ𝑖, 𝑖

= 1, 2, … ,𝑁. (2.25)

El lagrangiano, en el espacio primal, tiene la expresión

matemática dada por la ecuación 2.26.

𝑳𝑃(𝑤, 𝑏, ξ,𝛼) =12𝑤𝑇𝑤 + 𝛾

12�ξ𝑖

2𝑁

𝑖=1

−�𝛼𝑖{𝑦𝑖[𝑤𝑇Ф(𝑥) + 𝑏]− 1𝑁

𝑖=1

+ ξ𝑖}. (2.26)

siendo multiplicadores de Lagrange. Las condiciones de optimalidad vienen dadas

por:

Page 18: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

1

1 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

siendo v = 1, 2, ..., l., l el número de

componentes ó dimensión de los vectores de entrenamiento, i = 1, 2,

De tal forma que el problema de optimización puede formularse en el espacio primal así:

Minimizar: 𝑳𝑃(𝑤, 𝑏, ξ,𝛼) Sujeto a: El conjunto de restricciones

establecidas en la ecuación 2.27. En [47], se establece que, el anterior problema

de minimización puede abordarse mediante un sistema de ecuaciones lineales dado por:

(2.28)

siendo I una matriz identidad; mientras que Z, Y, , y , viene dados por las expresiones que se presentan en la ecuación 2.29.

𝒁 = [Ф(𝑥1)𝑇𝑦1, … ,Ф(𝑥𝑁)𝑇𝑦𝑁] 𝒀 = [𝑦1, … ,𝑦𝑁]

𝜶 = [𝛼1, … ,𝛼𝑁] (2.29) 𝛏 = [ξ1, … , ξ𝑁] 1�⃗ = [1, … ,1]

Los valores óptimos para las variables w, b, y , pueden obtenerse mediante validación cruzada [59]. Sin embargo, en lugar de resolver el sistema de ecuaciones lineales, presentado mediante la ecuación 2.28, usualmente se eliminan algebraicamente w y para generar el sistema de ecuaciones, menos complejo y equivalente al original, dado por:

(2.28)

siendo Ω =𝒁𝒁𝑇.

Ahora, recurriendo al teorema de Mercer [57],

se tiene que: 𝛺𝑖,𝑣 = 𝑦𝑖𝑦𝑣Ф(𝑥𝑖)𝑇 .Ф(𝑥𝑣) =

𝑦𝑖𝑦𝑣𝐾(𝑋𝑖 ,𝑋𝑣). (2.29). Si 𝐾(𝑋𝑖,𝑋𝑣) se reemplaza por una RBF

Gausiana se obtiene una formulación para las LSSVM que depende entonces de variables γ y σ a las cuales usualmente se les denomina hiper–parámetros.

Debido a ello, las LSSVM ameritan de un proceso de entonación de tales hiper–parámetros los cuales están asociados con: a) el factor de penalización del error (γ) propio de los paradigmas de aprendizaje; b) la selectividad de la LSSVM [57, 47], la cual depende del kernel considerado para construir la superficie de decisión y que en este caso se está haciendo coincidir con una RBF gaussiana con parámetro σ. Teóricamente, ambos parámetros pueden asumir valores pertenecientes al intervalo de números reales comprendidos en 0 e infinito [57, 47].

El referido proceso de entonación se hace necesario debido a que es muy díficil conocer de ante-mano la combinación de valores que generará resultados óptimos cuando las LSSVM realicen los procesos para los cuales fueron concebidas (clasificación o aproximación).

Los valores óptimos para b y se obtienen luego de aplicar validación cruzada. A partir de tales valores y considerando las condiciones de optimalidad correspondientes (ver ecuación 2.27) se puede obtener y w. Finalmente, el proceso de validación se hace de manera análoga al descrito para la SVM.

2.3.3) Técnicas de pre-procesamiento

complementarias. A continuación se presenta un conjunto de

técnicas de pre-procesamiento adicionales que serán consideradas, integralmente, para generar una variante de E1.Tal variante permite la implementación de la estrategia que se propone mediante la presente investigación. En lo sucesivo, para hacer referencia con más fluidez a tal estrategia se utilizará la abreviatura Esg que significa Estrategia basada en similaridad global, término éste que se refiere a la aplicación de una función (modelo matemático) basada en la consideración simultanea de todos los niveles de gris de un par de imágenes completas [60].

Page 19: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

1

1 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

2.4.1.1) Filtro de magnitud del gradiente La magnitud del gradiente se utiliza

ampliamente en el análisis de imágenes, principalmente para ayudar en la determinación de los contornos de objetos y la separación de regiones homogéneas. La detección de bordes es la identificación de discontinuidades significativas en el nivel de gris o color de la imagen [38]. Esta técnica calcula la magnitud del gradiente de una imagen, usando las primeras derivadas parciales direccionales ( , , ) de una imagen. El modelo matemático 3-D clásico, para obtener una imagen filtrada por magnitud del gradiente (IGM) se presenta mediante la ecuación 2.30.

siendo: la imagen de magnitud del gradiente

e i, j, k las cuales representan las direcciones en las que se calcula el gradiente.

En la práctica, la magnitud del gradiente de la imagen en cada posición del vóxel, objeto de estudio, se calcula utilizando un enfoque basado en diferencias finitas. Teóricamente, el filtro de magnitud del gradiente basado en los valores de intensidad es muy susceptible al ruido [38], por ello, se recomienda filtrar la imagen inicialmente para mejorar el rendimiento del detector con respecto al ruido.

2.4.2) Filtro binomial Los filtros binomiales son considerados como

una versión discreta de los filtros gaussianos. En ese sentido, un filtro binomial es de tipo lineal y los coeficientes para su vecindad, cuyo tamaño debe ser entonado, se calculan considerando el binomio de newton cuyo modelo matemático se presenta mediante la ecuación 2.31 [61]. Al constituir una variante del filtro gaussiano, usualmente, hereda las propiedades de éste.

donde: n es el grado del binomio de newton, a

y b son las variables del binomio de newton. 2.4.3) Filtro de mediana El filtro de mediana clásico, es una técnica de

filtrado no lineal, que se utiliza para reducir el ruido presente en las imágenes considerando los valores de intensidad de los vecinos, del elemento objeto de estudio, contenidos en una

vecindad de tamaño arbitrario [38]. A tal vecindad, también se le conoce como ventana de observación. Para generar el nuevo valor del elemento de la imagen, objeto de estudio, los valores de intensidad mencionados son colocados en un arreglo vectorial ordenado al cual se le determina el estadístico denominado mediana. Así, la intensidad del elemento actual se hace coincidir con el valor de tal mediana, repitiéndose este proceso, iterativamente, para cada elemento presente en la imagen de entrada [62].

Este tipo de filtro tiende a preservar, de manera moderada, los bordes de los objetos presentes en una escena y mantiene la información relevante de la imagen atenuando las variaciones impulsivas aleatorias [39].

2.4.4) Sub-muestreo de imágenes La reducción del tamaño o de la resolución

espacial de una imagen se conoce, usualmente, como submuestreo (undersampling). El submuestreo en una imagen 3-D se lleva a cabo reemplazando un grupo de niveles de gris, pertenecientes a vóxeles de interés, aplicando procesos de interpolación entre valores de vóxeles vecinos entre si ó por un nivel de gris escogido de forma arbitraria de entre los que forman parte de ese grupo. La interpolación puede ser del tipo: vecino más próximo, lineal, cuadrática, cúbica, bilineal, cubic spline, entre otras [60].

De los tipos de interpolación mencionados la

cúbica es la que exhibe el mejor desempeño presentando un excelente compromiso entre eficiencia y mínima pérdida de información. Por esta razón, diversos programas comerciales para el tratamiento digital de imágenes, como por ejemplo GIMP, utilizan por defecto este tipo de interpolación al reducir el tamaño de una imagen.

Uno de los aspectos a considerar al momento de requerir procesos que imponen la reducción de tamaño de una imagen es que tales técnicas pueden introducir perdida de información relevante en imágenes que no han sido preprocesadas preliminarmente. Por otra parte, en el contexto del procesamiento digital de imágenes, al aplicar una reducción de las dimensiones físicas de una imagen se parte de la premisa de que las imágenes submuestreadas exigen menos recursos computacionales al momento de procesarlas que su versión en tamaño original [6].

Page 20: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

2

2 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

2.5) Técnicas de segmentación consideradas en la

estrategia E1. La segmentación de imágenes se puede

definir como la descomposición de la imagen en regiones homogéneas, que comparten ciertas características de proximidad y similaridad [39]. Para efectos de la presente investigación solo se hará una breve revisión de los métodos de segmentación vinculados con crecimiento de regiones y un método variacional basado en levet set, considerados en la estrategia E1.

2.4.5) Método crecimiento de regiones (RG) Son técnicas de agrupamiento no supervisada,

la cual realiza un proceso iterativo que intenta caracterizar cada una de las clases, de acuerdo a la similitud existente entre los píxeles que integran cada una de las clases y de esta forma realizar la segmentación [48]. El método de crecimiento de regiones permite agrupar los píxeles o vóxeles pertenecientes a los objetos que conforman una imagen de acuerdo a un criterio predefinido. Requieren un punto semilla el cual puede ser seleccionado, manual o de forma automática, para extraer todos los píxeles conectados a dicha semilla [49].

Para aplicar el método de RG 3-D, se debe seleccionar:

a) La forma y el tamaño óptimo de la vecindad inicial que se construye a partir de la semilla. A tal vecindad se le asignará una forma cúbica y su tamaño dependerá de un escalar arbitrario r, suministrado usualmente por el usuario, que determina el lado del cubo.

b) Un criterio predefinido que permita evaluar si un elemento de la imagen, que se está analizando, es agregado ó no a una región.

Como se aprecia en los literales a) y b), el desempeño del RG depende, operativamente, de 2 parámetros. Ellos son: aquel que controla el tamaño de la vecindad inicial (r) y el parámetro (m) que controla la amplitud del rango de intensidades considerado para aceptar o rechazar un vóxel en una región. En esta sección, para r y m se considera el rango de valores establecido en [50], para aplicaciones prácticas que consideran imágenes médicas.

2.2.4.6 Método level set con inicialización sintética

Para segmentar el corazón derecho, usando level set, se utiliza la aplicación informática de código abierto denominada Itk-Snap. Debido a que la presentación detallada de cómo opera el Itk Snap no constituye un objetivo, de la

presente investigación, se recomienda consultar la descripción completa del Itk-Snap para la segmentación de objetos de interés, presentada en [ItkSnap][46] [51].

En el Itk-Snap, se implementan 3 versiones de level set que consideran algoritmos numéricos cuya finalidad es elevar la eficiencia de las formulaciones clásicas de técnicas de segmentación basadas en level set. Tales algoritmos son: el ITK sparse field level set algorithm (SFA), el ITK narrow band level set algorithm y el ITK dense level set algorithm. De acuerdo con [52], el SFA basado en la uniformidad de las regiones a segmentar, es la implementación computacional más eficiente respecto a los otros 2 algoritmos.

Adicionalmente, es importante indicar que el enfoque de level set basado en SFA tiene la propiedad de permitir que la iso–superficie de referencia pueda contraerse ó expandirse, de acuerdo con lo requerido por la estructura a segmentar [51]. Por estas razones, para segmentar el ventrículo izquierdo presente en las imágenes pre–procesadas se utiliza una técnica de level set, inicializada con una iso–esfera, basada en el algoritmo SFA.

La segmentación del corazón derecho, considerando las imágenes 3-D pre–procesadas, se realiza siguiendo el procedimiento que se describe a continuación según [6]:

1. Inicialización del level set mediante una iso–superficie.

2. Generación de una imagen de atributos basada en regiones, usando una técnica de umbralización.

3. Proceso de evolución. 4. Criterio de parada. 2.4.7) Técnica híbrida de segmentación: level set

con inicialización generada por RG. En E1, la técnica híbrida de segmentación

utiliza segmentaciones preliminares del LV, generadas por RG, para inicializar el método de level set considerado. Este enfoque tiene la ventaja de disminuir el tiempo de cómputo del proceso de segmentación ya que las mencionadas segmentaciones preliminares sólo requieren de un proceso de optimización el cual, usualmente, requiere de un menor esfuerzo computacional [6].

Es importante señalar que para determinar la calidad del desempeño de las técnicas de segmentación descritas, en [6] se consideró la métrica denominada Coeficiente de Dice [63].

Page 21: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

2

2 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

Por esa razón, se describe dicha métrica a continuación.

2.6) Coeficiente de Dice. El coeficiente de Dice (Dc) es una métrica que

permite comparar las segmentaciones de una misma imagen 3-D obtenida por diversas metodologías. En el contexto cardiaco, usualmente, el Dc es considerado para establecer que tan similares son espacialmente la segmentación manual (RD) y la segmentación automática (RP) que genera computacionalmente la morfología de cualquier estructura cardiaca.

Adicionalmente, el Dc es máximo cuando se alcanza un perfecto solapamiento entre RD y RP pero es mínimo cuando RD y RP no se solapan en absoluto. El máximo valor del mencionado coeficiente es 1 y su mínimo valor es 0. Además, los valores esperados para el coeficiente de Dice son números reales comprendidos entre 0 y 1. Entre más cercano a 1 se encuentre el valor del mencionado coeficiente, mejor será el desempeño de un procedimiento que no es manual. El modelo matemático que define el Dc, viene dado por la ecuación 2.32:

(2.32) En el presente trabajo, la importancia de este

coeficiente recae en el hecho que la mayoría de investigaciones sobre segmentación de imágenes cardiacas, reportadas en la literatura, reportan el uso de este coeficiente. Por tanto, en el contexto cuantitativo, se puede establecer si los resultados de varias investigaciones son ó no comparables entre sí.

Figura 2.8: Imagen ilustrativa del coeficiente de Dice. La región

de color rojo corresponde a RD, la azul representa RP y la verde es RD ∩ RP.

b. Marco Metodológico 1) Modelo de la investigación La presente investigación se enmarca en las

ciencias formales en particular en la matemática aplicada ya que, se hace uso de una gran cantidad de modelos matemáticos en los que se basan las técnicas de pre-procesamiento y segmentación que se prevee utilizar. El paradigma de la investigación se considera positivista, ya que, un elevado porcentaje de la investigación que se pretende desarrollar responde a una estructura algorítmica que va a manejar y arrojar datos cuantitativos, lo cual justifica que la metodología de la investigación sea cuantitativa.

2) Nivel de la investigación La investigación a desarrollar, según la

profundidad es de tipo aplicada exploratoria. Se refiere a una investigación aplicada porque consiste en desarrollar una técnica para dar alternativa de solución a un problema real. Mientras que la investigación exploratoria se refiere a un tema u objeto desconocido o poco estudiado, por lo que sus resultados constituyen una visión aproximada de dicho objeto, es decir, un nivel superficial de conocimientos [64].

3) Diseño de la investigación Para el desarrollo de la presente investigación

se tiene previsto utilizar el lenguaje de programación C++ y las librerías VTK e ITK.

La librería de clases VTK (Visualization Toolkit), disponible desde 1990, es un conjunto de funciones de código abierto multiplataforma (Win32, Linux, OsX y Unix). Tales funciones son encapsuladas y permiten la manipulación de datos tridimensionales. VTK tiene su núcleo de programación desarrollado en Visual C++ y cuenta con extensiones para lenguajes de programación tales como tcl/tk, Phyton, Java y ActiveX. Contiene un número importante de clases de objetos, cada una con propiedades, métodos y eventos, y a excepción de unas pocas clases patentadas, se encuentra bajo el esquema de licencia libre (GPL) [65].

El VTK permite usar una técnica basada en representación volumétrica con información de todo un espacio tridimensional del cuerpo humano y alpha blending (nivel de transparencia de un objeto) de tejidos u órganos, permitiendo aumentar drásticamente la eficiencia y velocidad del diagnóstico médico en diferentes patologías, particularmente, las de tipo cardiológicas [66].

Por otra parte, el ITK (Insight Toolkit),

Page 22: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

2

2 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

disponible de manera libre desde 2002, es una librería de software de código abierto orientada a objetos para procesamiento, segmentación y puesta en correspondencia (registro) multidimensional de imágenes [67, 68].

Por otra parte, en cuanto a la información que servirá como datos, se cuenta con 7 bases de datos (DB) de MSCT cardiaca en formato DICOM, las cuales fueron suministradas por el laboratorio de tomografía de imágenes digitales, perteneciente al centro de especialidades médicas de occidente (CEMOC), en San Cristóbal, Venezuela, y por el laboratorio de tratamientos de señales e imágenes de la Universidad de Rennes I en Francia (LTSI).

Además, se dispone de las segmentaciones manuales (ground truth), generadas por un experto cardiólogo, de todos los instantes que conforman el ciclo cardiaco completo de un paciente. Adicionalmente, se dispone de las segmentaciones manuales de los instantes diástole y sístole para el resto de bases, las cuales serán consideradas durante la validación del proceso de segmentación.

Cada instante cardiaca posee las características numéricas que se presentan en

la Tabla 1.

Características numéricas de las bases de datos de MSCT cardiaca.

Base de

Datos

Dimensiones de los vóxeles

Espacio entre vóxeles (mm)

DB1 512× 512 ×326

0.484×0.484 ×0.393

DB2 512× 512 ×201

0.350×0.350×0.625

DB3 512× 512 ×190

0.334×0.334×0.625

DB4 512× 512 ×159

0.391×0.391×0.625

DB5 512× 512 ×206

0.338×0.338×0.625

DB6 512× 512 ×191

0.344×0.344×0.625

DB7 512× 512 ×163

0.293×0.293×0.625

El desarrollo de la investigación se estructura

en tres fases: I. Fase de diseño • Con el propósito de acondicionar,

adecuadamente, las imágenes de MSCT cardiacas que contienen las estructuras del

corazón derecho, se diseñarán las siguientes etapas de pre-procesamiento: • A las DB originales se les aplica la fase

de filtrado prevista en la figura 2.6. o Una vez filtradas las imágenes se procederá a diseñar los grupos de entrenamiento, validación y pruebas que permitirán a las técnicas de aprendizaje definir una región de interés mediante la colocación de un plano denominado tricúspide. La colocación automática de tales planos facilitará el proceso de segmentación (Etapa para la definición de una región de interés) • Considerando las DB pre-procesadas se aplican la técnica de agrupamiento, basada en crecimiento de regiones, para generar la morfología 3-D de las estructuras anatómicas, más importante, que conforman el corazón derecho. II. Fase experimental • Se realizarán las pruebas experimentales que permitan la entonación y ejecución de las etapas de filtrado, definición de una región de interés y segmentación de las principales estructuras anatómicas vinculadas con el corazón derecho. III. Fase de validación • La calidad de la estrategia que se pretende desarrollar será cuantificada mediante el siguiente procedimiento: o Comparar las segmentaciones manuales, generadas por un cardiólogo, y las obtenidas automáticamente mediante la técnica a diseñar. Para ello se considerará como métrica el Coeficiente de Dice [63]. Este coeficiente es uno de los que más se reporta en los trabajos de segmentación realizados por otros investigadores. C Análisis E Interpretación De Los Resultados En este capítulo se presenta, por una parte, la estrategia que se propone para generar la morfología de las estructuras del corazón derecho y, por la otra, los resultados relativos a la obtención de un conjunto de parámetros que garantiza un desempeño óptimo de la estrategia desarrollada. 4.1 Segmentación de estructuras del corazón derecho En esta sección se analizan los aspectos que

Page 23: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

2

2 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

permiten implementar la estrategia Esg, a partir del análisis sintético de E1. Esg es la estrategia que se entona, en el contexto de la presente investigación, para poder segmentar las estructuras anatómicas del corazón derecho. Una descripción de Esg y el proceso de entonación que permite generar sus parámetros óptimos se presenta a continuación. 4.1.2 Descripción de la estrategia Esg para la segmentación del ventrículo derecho. Un análisis exhaustivo de la estrategia E1, descrita en el capítulo 2, arrojó los siguientes hallazgos: 1.- E1 es una estrategia que contempla una etapa de pre-procesamiento (fase de filtrado + fase para la definición de una región de interés) y una etapa de segmentación. 2.- La fase de filtrado, prevista como fase inicial del pre-procesamiento, combina un filtro que minimiza el ruido (filtro promediador), un detector de bordes (filtro black top hat), una función de similaridad (de tipo local) y una función de densidad (filtro Gausiano) para generar imágenes con bordes bien definidos y con información interna agrupada adecuadamente. Esta fase de filtrado requiere un total de 18 parámetros que deben ser entonados para obtener resultados óptimos. 3.- La fase de pre-procesamiento denominada definición de una región de interés, basada en máquinas de soporte vectorial de mínimos cuadrados (LSSVM), aísla el ventrículo izquierdo de otras estructuras cardiacas, lo cual facilita la posterior segmentación del LV. Esta fase de pre-procesamiento requiere un total de 4 parámetros que deben ser entonados para obtener resultados óptimos. 4.- En la etapa de segmentación, se consideran tres técnicas de segmentación denominadas: a) Crecimiento de regiones, b) Conjuntos de nivel (level set) y c) Una técnica híbrida que optimiza, usando level set, las segmentaciones generadas por crecimiento de regiones. Esta fase de segmentación requiere un total de 10 parámetros que deben ser entonados para obtener resultados óptimos. 5.- Si se consideran todas las etapas de E1 se puede establecer que tal estrategia requiere de un total de 32 parámetros los cuales deben ser sometidos a un proceso de entonación. 6.- Adicionalmente, la estrategia E1 considera el coeficiente de Dice para estimar la calidad de su desempeño. El mencionado coeficiente

permite comparar un considerable número de segmentaciones automáticas, obtenidas mediante E1, con las segmentaciones manuales generadas por un cardiólogo. En atención a los aspectos señalados en los seis numerales anteriores y con el propósito de generar una estrategia que genere resultados comparables, con los producidos por E1, considerando un número de parámetros más reducido, se implementó en el contexto de la presente investigación la estrategia Esg, cuyo diagrama de bloques se presenta mediante la figura 4.1.

Figura 4.1: Diagrama de bloques de la estrategia Esg la cual constituye una variante de E1.

Como se observa, en la figura 4.1, Esg conserva la estructura de E1 pero mediante ella se establece una serie de modificaciones e incorporaciones en las etapas y fases que la conforman, las cuales se presentan en seguida. I.- Etapa de pre-procesamiento correspondiente a Esg. Teóricamente, en Esg se implementa la etapa de pre-procesamiento con la finalidad de: a) Reducir el ruido Poisson. b) Disminuir el impacto (sobre la calidad de las imágenes de tomografía) de los artefactos. c) Abordar, adecuadamente, el problema de bajo contraste presente en las imágenes consideradas. Las fases que conforman esta etapa se describen a continuación: Fase de filtrado En la figura 4.1, esta fase se ha destacado mediante un recuadro gris. De manera comparativa con E1 se puede afirmar que en Esg: • Se ha eliminado el filtro promediador. Una de las razones que motivó la eliminación de este filtro es el excesivo tiempo de cómputo que requiere su aplicación en bases de datos de gran resolución espacial (por ejemplo: 512x512x326), como las que se consideran en

Page 24: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

2

2 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

la presente investigación. • El filtro top hat ha sido reemplazado por un filtro denominado magnitud del gradiente, el cual fue descrito en el capítulo 2. El top hat es uno de los filtros que requiere de un mayor número de parámetros y por ello se reemplaza por uno que, en teoría, también detecta bordes con la ventaja de que existen versiones para la magnitud del gradiente que no requieren parámetros de entonación. Entre tales versiones se encuentra la magnitud del gradiente basada en diferencias finitas. Para efectos de la presente investigación se eligió, de forma arbitraria, un enfoque basado en diferencias finitas centrales 3-D debido a su sencilla implementación computacional y a que, en la mayoría de situaciones reales, las diferencias tanto progresivas como regresivas arrojan resultados similares a las diferencias centrales. Debido a esta elección, la técnica de magnitud del gradiente considerada queda libre de parámetros de entonación. • En E1 la similaridad se establecía mediante un enfoque basado en la incorporación progresiva de los 6 vecinos locales de cada vóxel considerado y, por tanto, se trata de una similaridad de tipo local. En la presente propuesta, este enfoque es sustituido por uno en el cual la función de similaridad es de tipo global ya que genera una imagen (Isg) cuyos niveles de gris se hacen coincidir con el valor absoluto de la resta aritmética de todos los niveles de gris del volumen original (Io) y del volumen obtenido mediante magnitud del gradiente (Ig). De forma que la similaridad global puede expresarse mediante el modelo matemático presentado en la ecuación 4.1. Isg(i,j,k) =|𝐼𝐼(𝑖, 𝑗,𝑘) − 𝐼𝐼(𝑖, 𝑗, 𝑘)| (4.1) Este enfoque de similaridad global elimina los 6 casos que requería la función de similaridad local considerada en E1. Así que la similaridad global no presenta parámetros de entonación. • En el bloque denominado filtro suavizador se utilizan, de manera independiente y a la vez comparativa, tres filtros que tienen la propiedad teórica de disminuir el impacto del ruido sobre la calidad de una imagen. Ellos son: filtro Gausiano, filtro de mediana y filtro binomial. Tales filtros fueron descritos en el capítulo 2. La presencia de un filtro suavizador al final de la fase de filtrado se justifica por el hecho de que las imágenes de tomografía,

consideradas en la presente investigación, son portadoras de ruido Poisson. Además, la incorporación de un filtro que reforza bordes (magnitud del gradiente), lógicamente, puede realzar componentes de alta frecuencia vinculadas con ruido lo cual exige la consideración de un filtro suavizador. Fase de definición de una región de interés La similitud de los niveles de gris de los vóxeles que conforman la arteria pulmonar, la válvula pulmonar, la aurícula derecha y el ventrículo derecho, por lo general, requieren la colocación de planos que permitan la segmentación exitosa de tales estructuras. En E1, esta fase requiere de 4 parámetros de entonación. Ellos son: a) Tipo de “ondaleta” y factor de reducción correspondientes al proceso de reducción de la dimensionalidad espacial, usando WT. b) El factor de penalización ( ) y fa cto correspondientes al proceso de entrenamiento de las máquinas de soporte vectorial de mínimos cuadrados (LSSVM). Es importante señalar que las técnicas WT y LSSVM fueron descritas en el capítulo 2. Además, en E1, la WT se implementó considerando una ondaleta tipo Haar y los hiperparámetros de la LSSVM fueron sometidos a un proceso de entonación. Por otra parte, en Esg, la fase de definición de una región de interés consiste en: • En primer lugar, reemplazar la WT por una técnica de reducción de tamaño (submuestreo) cuyos parámetros fueron fijados utilizando como factor de reducción el valor óptimo obtenido en [6], el cual fue establecido en 8 veces menor el tamaño de la imagen original. Esto implica que a partir de imágenes de tamaño 512x512, filtradas con Esg, se obtienen imágenes submuestreadas con una resolución espacial de 64x64. Esto reduce, significativamente, el tiempo de cómputo que requieren las LSSVM en sus procesos de entrenamiento y validación. Además, la reducción espacial propiamente dicha se desarrolla mediante un proceso denominado interpolación cúbica. Este tipo de interpolación ha demostrado ser más robusta que otras técnicas, como por ejemplo, la interpolación lineal y, además, en el ámbito cardiaco la interpolación cúbica ha generado excelentes resultados (ver por ejemplo: [69] [70] [71]). Debido a lo anterior, de manera arbitraria, se seleccionó la interpolación cúbica

Page 25: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

2

2 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

como proceso para llevar a cabo el submuestreo. Es importante señalar que la técnica de submuestreo se aplica sobre imágenes que han sido filtradas, fuertemente, lo cual disminuye de manera substancial el riesgo de pérdida significativa de la información contenida en las imágenes consideradas. Así, en el contexto de Esg, como consecuencia de lo expuesto anteriormente, el uso de este tipo de submuestreo no va a requerir entonación. • En segundo lugar, considerando las imágenes submuestreadas un cardiólogo selecciona, cuidadosamente, ciertos puntos de referencia. En el presente trabajo, tales puntos de referencia vienen dados por: la unión de la válvula tricúspide con el RV (P1) y un punto adicional ubicado en el ápex del RV (P2). Estos puntos permiten la construcción de un plano denominado tricúspide. Los puntos de referencia descritos y son útiles para la localización, mediante coordenadas tridimensionales, del plano tricúspide en las bases de datos consideradas. Una representación 3D de tales puntos se muestra en la figura 4.2.

Figura 4.2: Superficie volumétrica construida para recrear la forma del RV en la cual se representan los puntos de referencia,

P1 (unión aurículo-ventricular derecha) y P2 (ápex), considerados para el plano tricúspide.

• Por último, se considera la implementación de LSSVM para reconocer y detectar los mencionados puntos de referencia. Para ello se desarrollan los procesos de: a) Entrenamiento: En cada uno de los imágenes 3D submuestreadas, perteneciente a la base de datos considerada, se selecciona una única imagen de 64x64 por cada punto de referencia. Por tanto se genera

un total de 3 LSSVM para cada volumen. El entrenamiento de las LSSVM requiere del respectivo proceso de entonación de parámetros cuya descripción se hace posteriormente. b) Validación: Una vez que las LSSVM han sido entrenadas se utilizan para detectar a P1 y P2, en imágenes no usadas durante el entrenamiento. Los puntos de referencia detectados permiten la construcción del plano tricúspide cuya colocación en las imágenes filtradas establece las regiones de interés que facilitan la segmentación de las estructuras del corazón derecho. Como se observa, en la fase de definición de una región de interés, el número de parámetros a entonar ha pasado de 4 a 2 correspondientes a los parámetros de la LSSVM. Para finalizar la descripción de esta fase se presenta mediante la figura 4.3 un diagrama que pretende sintetizar la metodología que rige la operatividad de las LSSVM en la presente investigación. Figura 4.3: Diagrama sintético de la operatividad de las LSSVM.

En la figura 4.3, los atributos vienen datos por los estadísticos identificados como media (μ), varianza (σ2), desviación estándar (σ) y mediana (me). Tales atributos son calculados considerando los niveles de gris, de las imágenes seleccionadas, contenidos en círculos de radio 10 píxeles. Estos círculos son construidos tomando en

Page 26: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

2

2 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

cuenta: a) Las estructuras anatómicas vinculadas con los puntos P1 y P2 (denominados marcadores anatómicos). b) Las estructuras anatómicas que no corresponden a los puntos P1 y P2 (denominados no marcadores). II.- Etapa de segmentación correspondiente a Esg. De manera comparativa con E1, la etapa de segmentación se redujo de tres métodos (RG, level set y método híbrido) a uno solo, en Esg, basado en crecimiento de regiones. La justificación de por qué se decidió utilizar solamente RG, es que se tiene previsto segmentar estructura cardiacas tales como las válvulas del corazón derecho. Para tales estructuras es clave establecer si sus valvas están abiertas o cerradas aspecto éste que no puede ser visualizado si se utiliza el método de level set, inicializado con esfera sintética. Además el level set emplea un tiempo de cómputo muy elevado para segmentar estructuras cardiacas cuando se compara con el tiempo que emplea el RG para segmentar la misma estructura. En esta etapa se ha pasado de 10 parámetros a tan sólo 2 lo cual implica una disminución importante en el número de parámetros a entonar. Es importante señalar que tanto para E1 como para Esg, la detección del vóxel semilla, requerido para la inicialización del RG, se realiza considerando LSSVM. En el capítulo 2, se establece que los parámetros del RG son vóxel semilla, m (multiplicador) y r (tamaño de la vecindad 3-D). En síntesis, como se puede apreciar, la estrategia Esg requiere de un total de 6 parámetros de entonación que es un número muy inferior a los 32 parámetros requeridos por la estrategia E1. Como se mostrará en las secciones subsiguientes, de este capítulo, la estrategia Esg puede generar resultados comparables tanto con E1 como con otras investigaciones reportadas en la literatura especializada en las cuales también se han segmentado estructuras cardiacas propias del corazón derecho. Es importante destacar que, a partir de la segmentación del RV y de la aurícula derecha, se pueden estimar los siguientes descriptores cardiacos: volumen diastólico final, volumen sistólico final, volumen latido, fracción de eyección y gasto cardíaco. Tales descriptores fueron descritos en el capítulo 2 y son útiles al momento de determinar en qué condición se

encuentra la función cardiaca de un sujeto y/o apuntalar planes de acción en la rutina clínica tendientes a monitorear la mencionada función. 4.2 Descripción del proceso de entonación de parámetros en el contexto de Esg. En el capítulo 3, se identificaron los parámetros que controlan el desempeño de las técnicas involucradas en la estrategia propuesta, en la presente investigación, para segmentar las estructuras cardiacas más importantes del corazón derecho. Tales parámetros, requieren la ejecución de un cuidadoso proceso de ajuste o entonación porque se hace imposible conocer, a priori, los valores óptimos que deben ser asignados a tales parámetros para que las técnicas consideradas desarrollen un trabajo adecuado. Además, la importancia de desarrollar este proceso de entonación estriba en el hecho de que la estrategia Esg pueda aplicarse con parámetros fijos, durante los procesos de validación previstos en la presente investigación. 4.2.1 Rangos de valores considerados para la entonación de la estrategia Esg. Para efectuar la serie de experimentos conducentes a entonar los parámetros de las técnicas vinculadas con la estrategia Esg, en el dominio 3–D, sus parámetros se modifican, sistemáticamente, considerando ciertos rangos para los valores que controlan el desempeño de las técnicas que conforma la mencionada estrategia. Tales rangos fueron discriminados para cada filtro y se presentan a continuación. • Rangos para los filtros suavizadores Como ya se indicó en el capítulo 2, los parámetros para el filtro basado en suavizado gaussiano, en el dominio 3–D, son: a) Las desviaciones estándar de cada dirección en las que se pretende realizar el filtrado. b) El tamaño del kernel gaussiano. Durante el suavizado, para disminuir el número de parámetros del filtro gaussiano el tamaño de su vecindad se hace coincidir con el tamaño óptimo obtenido en [6], es decir, la vecindad 3-D del filtro gaussiano se fijó en un tamaño (3x3x3); mientras que a su desviación estándar se le asigna, de manera arbitraria, todos los valores comprendidos en el intervalo [1,4], con un tamaño de paso de 0.25. Por tanto, en el contexto de Esg, el filtro gaussiano sólo requiere entonar su desviación estándar. En el caso de los filtros de mediana y binomial el único parámetro a entonar es el tamaño de

Page 27: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

2

2 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

la vecindad para el cual, en la presente investigación, se consideraron los tamaños de vecindad sugeridas en [39] y extendidos en [6] al dominio 3D. Tales tamaños son (3x3x3), (5x5x5), (7x7x7) y (9x9x9). De acuerdo con [39], el uso de tamaños de vecindad mayores a los mencionados implica un tiempo de cómputo más elevado y, probablemente, una difuminación importante de los bordes que delimitan las imágenes. Como se observa, en la fase de filtrado, el número de parámetros a entonar ha pasado de 18 (en E1) a tan sólo 3, en el contexto de Esg, correspondientes a la desviación estándar del filtro gaussiano y al tamaño de vecindad de los filtros mediana y binomial. • Rangos para la definición de una región de interés Como se estableció en el Capítulo 2, los hiper–parámetros de una LSSVM se hacen coincidir con: a) El factor de penalización del error γ propio de los paradigmas de aprendizaje; b) El factor de selectividad el cual se identifica con una RBF gaussiana con parámetro σ. Teóricamente, ambos parámetros pueden asumir valores pertenecientes al intervalo de números reales comprendidos en 0 e infinito [57, 47]. Sin embargo, en aplicaciones prácticas, los rangos de valores típicos considerados para tales hiper-parámetros [47], son los siguientes: a) Rango para σ: números reales contenidos en el intervalo [0,50]. b) Rango para : núme ros re a le s conte nidos en el intervalo [0,100]. • Rangos para la técnica de segmentación En [45], se establece que los rangos apropiados para los parámetros r y m del RG son los siguientes: a) m considera valores entre 0 y 10, con tamaño de paso igual a 0.1. b) r considera valores enteros entre 1 y 20. Por esta razón, para efectos de esta investigación, se utilizan los mencionados rangos al momento de ejecutar la etapa de segmentación. 4.2.2 Proceso de entonación de Esg La entonación de los parámetros, identificados en la sección anterior, se ejecuta mediante la aplicación del siguiente esquema de trabajo: 1.- En la fase de filtrado: • Se selecciona una única imagen 3–D

correspondiente a la fase de diástole final de la base de datos identificada como DB1 (ver Tabla 3.1). La mencionada fase constituye, junto con la sístole, una de las fases más importantes del ciclo cardiaco. Esta imagen es procesada aplicando la estrategia Esg (ver figura 4.1) utilizando, de manera independiente, los filtros suavizadores: gaussiano, binomial y mediana. • Para el filtro que se desea entonar se modifican sus parámetros recorriendo, sistemáticamente, los valores establecidos en su respectivo rango, tal y como se indica a continuación: a) Para entonar el filtro gaussiano se hace coincidir, sistemáticamente, el parámetro identificado como desviación estándar con todos y cada uno de los casos establecidos para tal filtro, es decir, su parámetro se hace variar considerando, de menor a mayor, todos los valores comprendidos en el intervalo [1,4] con un tamaño de paso de 0.25. b) Para entonar el filtro binomial se hace coincidir, sistemáticamente, el parámetro denominado tamaño de vecindad con todos y cada uno de los casos establecidos para tal filtro, es decir, su parámetro se hace variar considerando los tamaños: (3x3x3), (5x5x5), (7x7x7) y (9x9x9). c) Para entonar el filtro de mediana se repite el proceso descrito en el literal anterior. 2.- Durante la definición de la región de interés (ROI): • Las imágenes suavizadas mediante los filtros gaussiano, binomial y mediana son reducidas de tamaño físico mediante una técnica de submuestreo basada en interpolación cúbica con un factor de reducción de 8 unidades, generándose imágenes de tamaño 64x64. • Se implementan los procesos de entrenamiento y detección necesarios para generar las LSSVM que identifican las coordenadas necesarias para la incorporación del plano tricúspide, en la base de datos considerada. Para ello, se desarrollan los procesos que se describen a continuación: a) Proceso de entrenamiento: Se selecciona como conjunto de entrenamiento vecindades circulares de radio 10 píxeles, trazadas por un cardiólogo, que contienen tanto los puntos P1 y P2 (marcadores), como regiones que no contienen los referidos puntos (no marcadores). Tales vecindades son representados vectorialmente sobre la vista

Page 28: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

2

2 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

axial de una única imagen 2-D, perteneciente a cada volumen de resolución espacial 64x64, obtenido por interpolación cúbica. La principal razón por la cual se elige una única imagen, es porque se desea generar una LSSVM con alto grado de selectividad que detecte sólo aquellos píxeles que posean un alto grado de correlación con el patrón de entrenamiento. Para cada vecindad vectorizada, se calculan como atributos: la media (µ), la varianza ( ), la desviación estándar (σ) y la mediana (me). Así, cada marcador se describe mediante un vector (Va) de atributos estadísticos, dado por: Va = [µ, , σ, me]. Este enfoque, basado en atributos, permite que la LSSVM realice su trabajo con mayor eficiencia que cuando se utiliza el enfoque clásico, basado en vectores de mayor tamaño que consideran de manera directa sólo el nivel de gris, de los elementos de una imagen. El conjunto de entrenamiento se construye con una relación de 1:10, lo cual significa que por cada marcador se incluyen 10 no marcadores. La etiqueta +1 se asigna a la clase conformada por los marcadores; mientras la etiqueta -1 se asigna a la clase correspondiente a los no marcadores, es decir, el trabajo de entrenamiento se hace con base a una LSSVM binaria. Durante el entrenamiento, se debe generar un clasificador dotado de una frontera de decisión para detectar los patrones de entrada a la LSSVM como marcadores ó no marcadores. Posteriormente, debido a la presencia de falsos positivos y negativos, se aplica un proceso, denominado boostraping, que permite incorporar al conjunto de entrenamiento los patrones que la LSSVM clasifica, inicialmente, de manera inapropiada. En este sentido, se consideró, un toolbox denominado LS-SVMLAB para implementar un clasificador LSSVM basado en un kernel gaussiano de base radial con hiperparámetros σ y . Ta le s hipe rpa ráme tros s e e ntona n, suponiendo que la función de costo es convexa y tomando en cuenta la totalidad de imágenes de entrenamiento como los rangos de valores para ambos parámetros ya mencionados. Para ello, se desarrollan ensayos basados en los siguientes pasos: i) Para entonar el hiperparámetro , s e a s igna un valor fijo, arbitrario, a σ y se asignan sistemáticamente valores al hiperparámetro . El valor de σ se fija inicialmente en 25. Ahora, se varía cons ide ra ndo e l ra ngo [0,100] y un tamaño de paso de 0.25. El valor óptimo para

s e ha ce coincidir con a que l valor para el cual se obtiene la mayor tasa de aciertos al detectar los marcadores considerados durante el entrenamiento. ii) Un proceso análogo se aplica para entonar el hiperparámetro σ, es decir, se le asigna a Y el valor óptimo obtenido en el literal a) y, se considera un tamaño de paso de 0.25 para asignarle a σ el rango de valores contenidos en el intervalo [0,50]. El valor óptimo para σ corresponde al que produce la mayor tasa de aciertos, al momento de clasificar los marcadores durante el entrenamiento. iii) Los valores óptimos para los hiperparámetros son aquellos derivados de los literales i) y ii). Así, por ejemplo, para una de las LSSVM entrenadas se obtuvieron como parámetros óptimos para y σ los 10.00 y 1.50, respectivamente. b) Proceso de validación: I) Reconocimiento de la unión válvula tricúspide–RV (P1): Una LSSVM entrenada busca este punto de referencia, en el plano axial, desde la primera imagen (ubicada en la base del corazón) hasta la imagen que representa la mitad del volumen considerado. II) Reconocimiento del ápex (P2): Una LSSVM entrenada empieza a buscar el ápex desde la imagen que representa la mitad de la base de datos (aproximadamente el ecuador del corazón) hasta la última imagen que conforma dicha base. III) El proceso de validación efectuado con LSSVM permite identificar las coordenadas para P1 y P2 las cuales son multiplicadas por un factor de 8 unidades, a fin de poder ubicarlas, en las imágenes de tamaño original. De esta forma, las referidas coordenadas se utilizan para establecer la dirección (normal) del plano tricúspide. IV) La coordenada de P1 define la colocación del referido plano en la base del RV. Luego, mediante un proceso de discriminación, se seleccionan o se excluyen los puntos de las bases de datos procesadas que sean de interés, de acuerdo con la estructura anatómica del corazón derecho que se desee segmentar. 3.- Durante la etapa de segmentación: Considerando las imágenes pre-procesadas, descritas en los apartados anteriores, se segmenta el RV aplicando crecimiento de regiones. Para ello: • La ubicación de la semilla, para inicializar el RG, fue calculada usando LSSVM,

Page 29: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

2

2 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

empleándose un proceso análogo al descrito para la detección de los puntos de referencia, que definen el plano tricúspide. Tal proceso se presenta, brevemente, a continuación. a) Tomando en cuenta la vista axial, un cardiólogo elige como imagen de entrenamiento, por inspección visual, aquella imagen en la cual el RV contiene la mayor cantidad de sangre. Los marcadores se obtienen haciendo coincidir el centro de una vecindad circular (de radio establecido arbitrariamente en 20 píxeles) con el centroide del RV, presente en las imágenes de entrenamiento. Considerando los niveles de gris de tal vecindad circular se calculan los atributos: media (µ), varianza ( ), desviación estándar (σ) y mediana (me). b) Cada marcador se describe mediante un vector de atributos dado por: Va = [ µ, , σ,me ]. Por otra parte, los no marcadores son representados por vectores Va cuantificados sobre vecindades circulares, seleccionadas en las imágenes de entrenamiento, que no contienen información acerca del centroide del RV. Durante el entrenamiento de cada LSSVM, los parámetros óptimos se obtienen de una manera análoga a la empleada durante la detección de los puntos P1 y P2. Además, el reconocimiento de la semilla sobre el conjunto de imágenes de validación, se efectúa utilizando una LSSVM ya entrenada que busca la semilla desde la imagen que representa la mitad o ecuador de la DB hasta el ápex. c) Si durante la fase de validación un vector de atributos es identificado como marcador el centro de la vecindad circular, a la cual pertenece tal vector, se hace corresponder con su posición en la imagen original. De esta forma, se obtiene la localización de la semilla para la segmentación del LV • Segmentación del RV basada en crecimiento de regiones (RG): Para aplicar el método de crecimiento de regiones, en el dominio 3–D, a todas las imágenes pre-procesadas se debe seleccionar: a) La forma y el tamaño óptimo de la vecindad inicial que se construye a partir de la semilla. A tal vecindad se le asignó forma cúbica y su tamaño depende de un escalar arbitrario r, suministrado usualmente por el usuario, que determina el lado del cubo. b) Un criterio predefinido que permita evaluar si un elemento de la imagen, que se está analizando, es agregado ó no a una región. En

la presente investigación, tal criterio viene dado por la ecuación 4.2. |I(x) − µ| < mσ, (4.2) Siendo: I(x) el nivel de gris del vóxel objeto de estudio (vóxel actual), µ y σ la media aritmética y la desviación estándar de los niveles de gris de la vecindad seleccionada alrededor del vóxel semilla y m un parámetro suministrado por el usuario. Como se aprecia, el desempeño del RG depende, operativamente, de 2 parámetros. Ellos son: aquel que controla el tamaño de la vecindad inicial (r) y el parámetro m que controla la amplitud del rango de intensidades considerado para aceptar o rechazar un vóxel en una región. Los valores óptimos de r y m, se obtienen considerando un procedimiento análogo al descrito para las LSSVM. El proceso de entonación del RG genera una cantidad considerable de segmentaciones las cuales se analizan, considerando la métrica denominada Coeficiente de Dice, el cual se describió en el capítulo 2. • Obtención de parámetros óptimos Para determinar la calidad de las segmentaciones del RV generadas anteriormente, es necesario realizar un proceso de comparación que involucra el ground truth (segmentación manual), trazado por un cardiólogo, correspondiente al instante de diástole seleccionado y cada una de las segmentaciones del RV obtenidas mediante crecimiento de regiones. El indicador que se considera para cuantificar el referido proceso de comparación, es la métrica denominada el coeficiente de Dice. El proceso de entonación, para un filtro particular, se detiene cuando se obtiene el valor óptimo para sus parámetros, es decir, cuando se identifican los valores para los cuales se genera la mejor segmentación. Tal valor óptimo, Así, para entonar el crecimiento de regiones cada una de las segmentaciones del RV generadas por Esg, se compara con la segmentación manual del RV, generada por un cardiólogo, considerando el Dc. Los valores óptimos para los parámetros del RG (r y m), se hacen coincidir con aquel experimento que genera el valor más alto para el coeficiente de Dice. De tal manera que, los valores óptimos que se obtuvieron para r y m fueron 20 y 3.0,

Page 30: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

3

3 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

respectivamente, y corresponden a un Dc máximo de 0.9126. Tales valores, permitieron generar un cubo de lado 20 píxeles y realizar la segmentación del RV, considerando 3 veces la desviación estándar de la imagen a segmentar (ver la ecuación 4.2). Luego, al analizar cuál de las imágenes pre-procesadas correspondía a tal combinación de parámetros, del RG, se identificó que la imagen pre-procesada con el filtro de mediana con tamaño de vecindad (7x7x7) fue la que correspondía a los parámetros que generaron el más alto Dc y por tanto la mejor segmentación. Finalmente, se puede establecer que para el resto de procesos previstos en la presente investigación, tales como segmentación del RV y de la aurícula derecha en el contexto del desempeño intra e inter-sujeto, se aplicará la estrategia Esg considerando como filtro suavizador el de mediana con tamaño de vecindad fijado en (7x7x7). Los filtros suavizadores binomial y mediana quedan descartados.

REFERENCIAS

[1] J. Guyton. Textbook of Medical Physiology. USA: Elsevier Saunders, 2006. [2] World Health Organization (WHO). Global status report on non communicable diseases.Tech. Rep. 2010. Geneva, 2011. [3] Ministerio del Poder Popular para la Salud (MPPS). Anuario de mortalidad. Reporte técnico 2008 Caracas, 2008. [4] Ministerio del Poder Popular para la Salud (MPPS). Anuario de mortalidad. Reporte técnico 2010 Caracas, 2010. [5] N. Galié. Guidelines for the diagnosis and treatment of pulmonary hypertension, European Heart Journal 30 (20): pp 2243–2278, 2004. [6] M. Vera. “Segmentación de estructuras cardiacas en imágenes de tomografía computarizada multi-corte," Ph.D. dissertation, Universidad de los Andes, Mérida-Venezuela, 2014. [7] J. Tazar y M. Álvarez. “Quantification of Right Ventricular Function in Pulmonary Hypertension”, Rev. Fed. Arg. Cardiol. 41(2): pp 89–95, 2012. [8] S. Chen, T. Kohlberger y K. Kirchberg. “Advanced level set segmentation of the right atrium in magnetic resonance” in: Proceedings of the SPIE The International Society for Optical

Engineering, Volume 7964, (SPIE Homepage). New York, USA. pp 89-92, 2011. [9] X. Zhuang, K. Rhode, R. Razavi y D. Hawkes. A Registration Based Propagation Framework for Automatic Whole Heart Segmentation of Cardiac MRI. IEEE Transactions on Medical Imaging, 29(9), 1612 – 1625, 2010. Recuperado desde: http://ieeexplore.ieee.org/xpl/abstractKeywords.jsp?tp=&arnumber=5444972&url=http%3A%2F%2Fieeexplore.ieee.org%2Fxpls%2Fabs_all.jsp%3Farnumber%3D5444972 [10] H. Kirisli, M. Schaap, S. Klein, L. Neefjes y A. Weustink. Walsum y W. Niessen. Fully automatic cardiac segmentation from 3D CTA data: a multi-atlas based approach. Proceedings of SPIE Medical Imaging, vol. 7623, no. 1, pp. 5-9, 2010. [11] Z. Liangjia. Automatic segmentation of wall structures from cardiac images. (Ph.D. dissertation, Georgia Institute of Technology), 2012. Recuperado desde: http://hdl.handle.net/1853/47727 [12] P. Neher, H. Barschdorf, S. Dries, F. Weber, M. Krueger, O. Dössel y C. Lorenz. Functional Imaging and Modeling of the Heart. Automatic Segmentation of Cardiac CTs Personalized Atrial Models Augmented with Electrophysiological Structures, Lecture Notes in Computer Science, Springer Berlin Heidelberg, pp. 80–87, 2011. [13] M. Latarjet y A. Ruíz. Anatomía Humana. Volumen 2. Buenos Aires, Argentina: Editorial Panamericana, 1983. [14] F. Faletra, N. Pandian y S. Ho. Anatomy of the Heart by Multislice Computed Tomography. Chichester, West Sussex, UK: Wiley Blackwell, 2008. [15] K. Barrett, S. Brown, S. Biotano y H. Brooks. Fisiología Médica. Mexico: Mac GrawHill, 1986. [16] P. Janssen. “Kinetics of cardiac muscle contraction and relaxation are linked and determined by properties of the cardiac sarcomere,” American Journal of Physiology Heart and Circulation Physiology, vol. 299, no. 4, pp. H1092–H1099, 2010. [17] M. Marcus y K. Dellsperger. “Determinants of systolic and diastolic ventricular function”, in Cardiac Imaging. A Companion to Braunwald’s Heart Disease, M. Marcus, H. Schelbert, D. Skorton, y G. Wolf, Eds. Philadelphia, USA: W.B. Saunders Company, pp. 24–38, 1991. [18] H. Christine. S. Lorenz, E. Walker, L. Morgan, S. Klein y P. Graham. Normal human right and left ventricular mass, systolic function and gender diferences by cine magnetic resonance imaging. Journal of Cardiovascular Magnetic Resonance, 1, 1999. [19] Y. Bentivoglio y M. Goldeerg. From Cardiac Catheterization Data to Hemodynamic Parameters. Philadelphia: Davis Company, 1978.

Page 31: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

3

3 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

[20] A. Frangi, W. Niessen, y M. Viergever. “Three-dimensional modeling for functional analysis of cardiac images: A review,” IEEE Transactions on Medical Imaging, vol. 20, no. 1, pp. 2–25, 2001. 21] E. Folland, G. Hamilton, S. Larson, y J. Kennedy. “The radionuclide ejection fraction: a comparison of three radionuclide techniques with contrast angiography,” Diagnostic nuclear medicine, vol. 18, no. 1, pp. 1159–1166, 1997. [22] A. Guyton y J. Hall. Textbook of Medical Physiology. USA: W. B. Saunders, 2006. [23] A. Frangi, D. Rueckert, y J. Duncan. “Three–dimensional cardiovascular image analysis,” IEEE Transactions on Medical Imaging, vol. 21, no. 9, pp. 1005–1010, 2002. [24] M. Yamamuro, E. Tadamura, S. Kubo, H. Toyoda, T. Nishina, y M. Ohba. “Cardiac functional analysis with multidetector row CT and segmental reconstruction algorithm: comparison with echocardiography, SPECT, and MR imaging,” Radiology, vol. 234, no. 1, pp. 381–390, 2005. [25] O. Rabit. “Quantitative analysis of cardiac function,” in Handbook of Medical Imaging: Processing and Analysis, I. N. Bankman, Ed. San Diego: Academic Press, pp. 359–374, 2000. [26] J. Hajnal, D. Hill y D. Hawkes. Medical Image Registration. USA: CRC Press LLC, 2001. [27] R. Reba. “Nuclear medicine," The Journal of the American Medical Association, vol. 270, no. 2, pp. 230-233, 1993. [28] E. Garcia, T. Faber, J. Galt, C. Cooke y R. Folks. “Advances in nuclear emission pet and spect imaging," IEEE Engineering in Medicine and Biology Magazine, vol. 19, no. 5, pp. 21-33, 2000. [29] A. Macovski, J. Pauly, J. Schenck, K. Kwong, D. Chesler, X. Hu, W. Chen, M. Patel, K. Ugurbil y S. Olly. “Magnetic resonance imaging," in The Biomedical Engineering Handbook: Second Edition, Volume 1, J. D. Bronzino, Ed. Boca Raton: CRC Press LLC, pp. 1174-1215, 2000. [30] D. Baim. Grossman’s Cardiac Catheterization, Angiography and Intervention. USA: Lippincott Williams and Wilkins, 2006. [31] A. Cournand. “Cardiac catheterization. Development of the technique, its contributions to experimental medicine, and its initial application in man”. Scandinavic Supplement Medical Record, vol. 32, no. 1, pp. 579–592, 1975. [32] H. Hermann y S. Bartle. “Left ventricular volumes by angiocardiography: Comparison of methods and simplification of

techniques,” Cardiovascular Research, vol. 2, no. 4, pp. 404–414, 1968. [33] J. Gore y J. Orr. “Image formation by back–projection: A reappraisal,” Physics in Medicine and Biology, vol. 24, no. 4, pp. 793–801, 1979. [34] R. Gordon, R. Bender, G. Herman, “Algebraic reconstruction techniques (ART) for three dimensional electron microscopy and X-ray photography,” Journal of Theoretical Biology, vol. 29, no. 9, pp. 471–482, 1970. [35] K. Lange y R. Carson. “EM reconstruction algorithms for emission and transmission tomography”, Journal of Computed Assited Tomography, vol. 8, no. 3, pp. 306–316, 1984. [36] W. Kalender. Computed Tomography: Fundamentals, System Technology, Image Quality, Applications. Munich, Germany: Publicis MCD Verlag, 2000. [37] M. Thelen, R. Erbel, K. Kreitner y J. Barkhausen. Cardiac Imaging. A Multimodality Approach. New York, USA: Thieme Medical, 2009. [38] W. Pratt. Digital Image Processing. USA: John Wiley & Sons Inc, 2007. [39] G. Passarielo y F. Mora. Imágenes Médicas, Adquisición, Análisis, Procesamiento e Interpretación. Venezuela: Equinoccio Universidad Simón Bolivar, 1995. [40] H. Meijering. “Image en hancement in digital X ray angiography” Tesis de Doctorado, Utrecht University, Netherlands, 2000. [41] J. Serra. Image Analysis Using Mathematical Morphology. London, England: Academic Press, 1982. [42] S. Mukhopadhyay y B. Chanda. “A multiscale morphological approach to local contrast enhancement”, Signal Processing, vol. 80, no. 4, pp. 685–696, 2000. [43] Z. Yu, G. Wei, C. Zhen, T. Jing y L. Ling. “Medical images edge detection based on mathematical morphology,” en Proceedings of the IEEE Engineering in Medicine and Biology 27th Annual Conference, Shanghai China. pp. 6492–6495, September 2005. [44] T. Chen, Q. Wu, R. Rahmani y J. Hughes. “A pseudo top-hat mathematical morphological approach to edge detection in dark region”. Pattern Recognition, vol. 35, no. 1, pp. 199–210, 2002. [45] J. Rivest, P. Soille y S. Beucher. “Morphological gradients,” Electronic Imaging, vol. 2, no. 4, pp. 326–336, 1993.

Page 32: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

3

3 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

[46] R. Haralick y L. Shapiro. Computer and Robot Vision. USA: Addison–Wesley, vol. I, 1992. [47] J. Suykens, T. Van Gestel y J. De Brabanter. Least Squares Support Vector Machines, World Scientific Publishing Co., UK, 2002. [48] Y. Meyer. Wavelets and Operators. USA: Cambridge University Press, 1999. [49] I. Daubechies. Ten lectures on wavelets. Philadelphia, PA, USA: Society for Industrial and Applied Mathematics, 1992. [50] S. Mallat. “A theory for multiresolution signal decomposition: the wavelet representation,” IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 11, pp. 674–693, 1989. [51] M. Vetterli y C. Herley. “Wavelets and filter banks: Theory and design,” IEEE Transactions on Signal Processing, vol. 40, no. 9, pp. 2207–2232, 1992. [52] Y. Sheng. “Wavelet transform,” en The Transforms and Applications Handbook, A. Poularikas, Ed. Boca Raton: CRC Press LLC, pp. 747–827, 1995. [53] V. Vapnik. Statistical Learning Theory. New York: John Wiley & Sons, 1998. [54] E. Osuna, R. Freund, y F. Girosi. “Training support vector machines: an application to face detection.” en Conference on Computer Vision and Pattern Recognition (CVPR ’97), San Juan, Puerto Rico, pp. 130–136, 1997. [55] A. Smola. “Learning with kernels,” Tesis de Doctorado, Technische Universitt Berlin, Germany, 1998. [56] S. Gunn. “Support vector machines for classification and regression,” Southampton University, Reporte Técnico Hampshire, England, 1998.

[57] B. Scholkopf y A. Smola. Learning with Kernels: Support Vector Machines, Regularization, Optimization, and Beyond. Cambridge, MA , USA: The MIT Press, 2002. [58] M. Oren, C. Papageorgiou, P. Sinha, E. Osuna, y T. Poggio, “Pedestrian detection using wavelet templates,” en CVPR ’97: Conference on Computer Vision and Pattern Recognition (CVPR ’97). Washington, DC, USA: IEEE Computer Society, pp. 193–200, 1997. [59] H. Zhu y R. Rohwer, “No free lunch for cross-validation,” en Neural Computation vol. 8, USA, pp. 1421–1426, 1996. [60] R. Gonzalez, P. Woods. Digital Image Processing, Addison

Wesley, 2002. [61] P. Burt. Fast filter transforms for image processing. Computer Graphics, Image Processing, 16(1), 20–51, 1981. [62] M. Fischer, J. Paredes, y G. Arce. “Image sharpening for the world wide web,” IEEE Transactions on Image Processing, vol. 11, no. 3, pp. 717–727, 2002.

[63] L. Dice, “Measures of the amount of ecologic association between species", Ecology, vol. 26, no. 3, pp. 297-302, 1945. [64] F. Arias. El proyecto de investigación. Introducción a la metodología científica. Caracas: Episteme, 2012. [65] W. Schroeder, K. Martin, B. Lorensen. The Visualization Toolkit, An Object-Oriented Approach to 3D Graphics. New York: Prentice Hall, 2001. [66] A. Marciales. Segmentación semiautomatizada de la cavidad ventricular izquierda a partir de tomografía multicorte cardiaca 4D. Tesis de Maestría, Universidad de Los Andes-Mérida, Venezuela, 2007.

[67] H. Johnson, M. McCormick y L. Ibáñez. Insight Software Consortium. Insight Segmentation and Registration Toolkit (ITK). http://www.itk.org/, 3 ed. Updated for ITK version 4.5. (2009).

[68] L. Ibañez. “The ITK Software Guide," Kitware Inc., Tech. Rep., July 2005.

[69] M. Vera, R. Medina, A. Bravo, A. Del Mar, O. Acosta, M. Garreau. Cuantificación de la Función Cardiaca en Imágenes de Tomografía Multi-corte. En memorias del VIII Panamerican Health Care Exchanges Conference (Pahce–2013) y del V Congreso Colombiano de Bioingeniería e Ingeniería Biomédica (Ccbio–2013), Medellín-Colombia, pp. 20-25, 2013.

[70] M. Vera, R. Medina, A. Bravo, F. Durán. Estimación de descriptores de la función ventricular derecha en imágenes de tomografía cardiaca. XII Congreso Internacional de Métodos Numéricos en Ingeniería y Ciencias Aplicadas. CIMENICS 2014, Isla de Margarita, Venezuela, pp.1-6, 2014.

[71] Y. Huérfano, M. Vera, A. Bravo, A. Del Mar, R. Medina. Estrategia para la segmentación de la aurícula derecha en tomografía cardíaca. Memorias del V Congreso Venezolano de Bioingeniería. (BIOVEN 2015). Mérida, Venezuela, del 20 al 22 de mayo de 2015.

Page 33: DETECCIÓN DE PATOLOGÍAS VINCULADAS CON …service.udes.edu.co/eisi/memorias/ponencias/ep6.pdf · corazón derecho en imágenes 3D cardiacas, – de tomografía computarizada multi–corte

3

3 Universidad Simón Bolívar, Huérfano. Vera. Chacón. Bautista, Detección de patologías vinculadas al corazón en imágenes tomográficas

NOTA ACLARATORIA El documento no ha sido publicado previamente, o no presenta ninguna restricción previamente declarada o certificada en otro medio de publicación. Es un trabajo original. Se autoriza así su Publicación en cualquier medio, digital o impreso.