Deteccion de microcalcificaciones mamarias
agrupadas
Presentado por
Alvaro Andres Sandino Garzon
Dirigido por
Ing. Rodrigo Javier Herrera Garcıa
Universidad Distrital Francisco Jose de Caldas
Facultad de Ingenierıa
Proyecto curricular en ingenierıa electronica
2017
Indice general
Introduccion 5
Estado del arte 6
1. Marco Conceptual 8
1.1. Aspectos medicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.1.1. Cancer de seno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.1.2. Cancer de seno en Colombia . . . . . . . . . . . . . . . . . . . . . . . 8
1.1.3. Imagen mamografica . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.1.4. Tipos de proyecciones . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.1.5. Bases de datos de imagenes mamograficas . . . . . . . . . . . . . . . 11
1.1.6. Hallazgos en imagenes mamografıcas . . . . . . . . . . . . . . . . . . 11
1.2. Procesamiento de imagenes . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.2.1. Transformada Wavelet . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.2.2. Analisis multirresolucion . . . . . . . . . . . . . . . . . . . . . . . . . 17
2. Metodologıa 20
2.1. Captura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.2. Preprocesamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.3. Segmentacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.4. Extraccion de caracterısticas e identificacion de objetos . . . . . . . . . . . . 29
3. Resultados 32
4. Discusion 38
5. Conclusiones 41
Bibliografıa 42
2
Indice de figuras
1.1. Proyecciones craneo caudal y medio lateral oblicua de una imagen mamografica. 10
1.2. Microcalcificaciones mamarias . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3. Tipos de distribucion de microcalcificaciones mamarias . . . . . . . . . . . . 13
1.4. Familia de funciones wavelet Daubechies . . . . . . . . . . . . . . . . . . . . 15
1.5. Piramide de descomposicion wavelet . . . . . . . . . . . . . . . . . . . . . . . 18
1.6. Esquema del banco de filtros para la descomposicion wavelet bidimensional . 19
1.7. Descomposicion wavelet de una imagen a escala de grises . . . . . . . . . . . 19
2.1. Esquema general de la metodologıa propuesta. . . . . . . . . . . . . . . . . . . . . . 21
2.2. Imagen mamografica con extension .PNG . . . . . . . . . . . . . . . . . . . . 22
2.3. Segmentacion de la glandula mamaria . . . . . . . . . . . . . . . . . . . . . . 24
2.4. Esquema para el metodo de realce 1 . . . . . . . . . . . . . . . . . . . . . . . 25
2.5. Comparacion de los metodos de realce 1 y 2 . . . . . . . . . . . . . . . . . . 26
2.6. Esquema para el metodo de realce 2 . . . . . . . . . . . . . . . . . . . . . . . 27
2.7. Histograma de niveles de gris de los pıxeles de una imagen realzada . . . . . 27
2.8. Elementos de la imagen umbralizada clasificados por longitud . . . . . . . . 28
2.9. Seleccion de candidatos a microcalcificaciones mamarias . . . . . . . . . . . . 29
2.10. Segmentacion de candidatos a microcalcificaciones mamarias agrupadas . . . 31
3.1. Curva ROC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.2. Resultados de la deteccion de candidatos a microcalcificaciones mamarias agru-
padas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.1. Segmentacion de elementos que no son microcalcificaciones . . . . . . . . . . 38
4.2. Tejido denso con microcalcificaciones agrupadas . . . . . . . . . . . . . . . . 39
3
Indice de cuadros
3.1. Especificidad de la prueba del algoritmo . . . . . . . . . . . . . . . . . . . . 33
3.2. Sensibilidad y valor predictivo positivo de la prueba del algoritmo . . . . . . 34
3.3. Valores de SE, PPV y D de la prueba con las funciones wavelet db8 y db16 . 35
3.4. Valores de SE, PPV y D de la prueba con las funciones wavelet sym8, sym16
y coif5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4
Introduccion
El cancer de seno es considerado como la segunda causa de muerte por cancer en mujeres
en el mundo [4]. En el paıs, es el cancer mas comun. Se estima que anualmente fallecen
mas de 2.000 mujeres por esta causa y se reportan mas de 7 mil nuevos casos [5]. Por es-
te motivo, se ha convertido en un problema de gran magnitud en la poblacion femenina
y debido a la tendencia creciente, se requiere que sean implementadas estrategias para la
prevencion, deteccion temprana, control y un tratamiento adecuado de la enfermedad [6].
La mamografıa o mamograma es una imagen radioglogica del seno que sirve para detectar
cancer en sus primeras etapas. Es el unico metodo de diagnostico no invasivo que ha demos-
trado una reduccion en las tasas de mortalidad por cancer mamario hasta en un 30 % [28] [10].
En las imagenes mamograficas los hallazgos mas comunes en el tejido mamario son las mi-
crocalcificaciones. Son lesiones no palpables en la mama que se caracterizan por ser pequenos
depositos de calcio, estan presentes aproximadamente en el 55 % de los casos de cancer de
mama no palpable [1]. Aunque pueden ser benignas o malignas, esto depende de algunas
caracterısticas como el tamano, la forma, la distribucion y la densidad [18]. Por ejemplo, son
consideradas de alta sospecha de malignidad si la longitud de cada una es menor a 0.5 mm
y se agrupan mas de tres en 1 cm2 de area [20] [17].
La interpretacion de mamografıas es una tarea que requiere tiempo y esfuerzo ademas de
la experiencia y la habilidad del medico especialista. El diagnostico asistido por computador
(CAD) sirve como soporte para esta labor, por ejemplo, mediante el mejoramiento de la
calidad de la imagen, el realce de regiones sospechosas y la identificacion de elementos de
interes, entre otras.
La deteccion de microcalcificaciones en el tejido mamario ha sido un gran reto para los
investigadores, puesto que al no ser elementos palpables y que por su reducido tamano, entre
el 10 % y el 40 % de microcalcificaciones pasan desapercibidas por los especialistas [26].
5
Estado del arte
La deteccion de microcalcificaciones en el tejido mamario ha sido un gran reto para los inves-
tigadores. Algunos aportes en investigacion en el area de imagenes mamograficas y deteccion
de patologıas mamarias se han hecho en Colombia, por ejemplo Madrigal et al [14] presentan
un metodo para la deteccion automatica de microcalcificaciones basado en un filtrado gaus-
siano e identificacion de microcalcificaciones con un clasificador basado en K-vecinos mas
cercanos (KNN). Por otro lado, Santamarıa [23] en su tesis de maestrıa de la Universidad
Tecnologica de Pereira realizo la construccion de una base de datos de imagenes de mamo-
grafıa para la identificacion de microcalcificaciones mamarias.
A nivel internacional, algunos grupos de investigacion han puesto un gran esfuerzo para
realizar constantes aportes en la deteccion de microcalcificaciones mamarias. Por ejemplo
Vivona et al [29] emplean algoritmos de agrupamiento difuso como C-means (FCM) para
la deteccion de agrupaciones de microcalcificaciones conociendo previamente su localizacion.
Lagzouli et al [12] utilizan algunos operadores de morfologıa matematica para detectar mi-
crocalcificaciones en mamografıas.
Otros trabajos publicados se basan en analisis multirresolucion y wavelet para la deteccion de
microcalcificaciones. Por ejemplo Song et al. [25] usan la transformada wavelet y morfologıa
matematica para la segmentacion de las imagenes. Por otra parte Hamad et al. [2] exploran el
uso de la transformada wavelet en una dimension para delimitar la region de interes usando
diferentes familias wavelet en la descomposicion y reconstruccion de las imagenes. Mina et
al. [18] presentan un metodo basado en descomposicion wavelet y redes neuronales para la
clasificacion de tejidos normales y anormales, ası como masas y microcalcificaciones. Mustra
et al. [21] elaboran un metodo para mejorar el contraste de las imagenes mamograficas y
resaltar microcalcificaciones suprimiendo el fondo de la imagen, y lo logran a traves de la
combinacion entre el analisis multirresolucion y morfologıa en escala de grises [20]. Por su
parte Hashemi [8] plantea el uso de analisis estadıstico de orden superior (HOS 1) en los coefi-
1HOS es la sigla de las palabras en ingles High Order Statistics.
6
Estado del arte 7
cientes wavelet, en donde los puntos de cruce entre filas y columnas asociados a un alto sesgo
y curtosis determinan las regiones con agrupaciones de microcalcificaciones. En contraste,
Khalaf et al. [11] utilizan descomposicion wavelet y analisis mediante estadıstica de orden
superior(HOS) y prueba t-Student para la evaluacion de caracterısticas, utilizando maquinas
de soporte vectorial (SVM2) como clasificadores. Bharadwaj et al. [3] utilizan segmentacion
de las imagenes mamograficas mediante la transformada top-hat para la localizacion de re-
giones de interes a traves del analisis multirresolucion basado en la transformada wavelet y
el uso de campos aleatorios de Gibbs (GRF) 3.
En este trabajo se describe un metodo para la deteccion de microcalcificaciones agrupa-
das que a diferencia de otros trabajos, realizan la deteccion de microcalcificaciones de forma
individual y con conocimiento previo de su localizacion. En el desarrollo de esta metodologıa
se mostraran los algoritmos para el realce de candidatos a microcalcificaciones utilizando
analisis multirresolucion a traves de la transformada wavelet, su respectiva segmentacion
y clasificacion. Luego, se presentaran y discutiran los resultados obtenidos y se haran las
conclusiones correspondientes.
2SVM es la sigla de las palabras en ingles Support Vectorial Machines3GRF es la sigla de las palabras en ingles Gibbs Random Fields
Capıtulo 1
Marco Conceptual
1.1. Aspectos medicos
1.1.1. Cancer de seno
El cancer de seno se origina por el crecimiento descontrolado de celulas en el tejido mamario.
Se puede localizar en diferentes partes y puede afectar los lobulos mamarios (carcinoma lo-
bular) o en su mayorıa a los conductos lacteos (carcinoma ductual) [24]. Es la segunda causa
de muerte por cancer en mujeres en el mundo y la primera en occidente. Esto ha conducido
a que los paıses industrializados adoptaran desde hace mas de dos decadas la instauracion
de programas de prevencion, diagnostico temprano y tratamiento adecuado del cancer. Todo
esto sumado a los avances tecnologicos han logrado una tendencia decreciente en la tasa anual
de mortalidad.
Las causas exactas de la enfermedad aun no se conocen completamente, por ese motivo, la
gran mayorıa de las personas afectadas desarrolla la enfermedad sin presentar sıntomas evi-
dentes. Sin embargo, se conocen algunos factores de riesgo que favorecen la enfermedad, estos
pueden ser los antecedentes familiares, el tabaquismo, la obesidad, el consumo de bebidas
alcoholicas o algun problema asociado al sistema endocrino. [6]
1.1.2. Cancer de seno en Colombia
En el paıs, es el cancer mas comun entre las mujeres, superando al cancer de cuello uterino,
de estomago y el de pulmon. Se estima que anualmente fallecen aproximadamente mas de
2.000 mujeres por esta enfermedad y aparecen mas de 7 mil casos nuevos, lo que se perfila
como un problema de salud publica. [5] La distribucion geografica de la mortalidad por este
tipo de cancer presenta una mayor incidencia en ciudades principales como Bogota, Medellın,
8
Capıtulo 1. Marco Conceptual 9
Cali, Barranquilla. Pese a que estas ciudades disponen de una mayor capacidad para realizar
el diagnostico, presentan tambien un mayor aumento en los factores de riesgo como lo son el
sedentarismo, el aumento en el ındice de masa corporal, una baja tasa de fecundidad y el uso
de hormonas exogenas [6]. Por ese motivo, el cancer de seno se ha convertido en un problema
de gran magnitud en la poblacion femenina en el paıs y que por su tendencia creciente requiere
que sean implementadas estrategias para la prevencion, deteccion temprana y control y un
tratamiento adecuado de la enfermedad.
Deteccion temprana
La deteccion temprana es la identificacion del cancer de seno en sus primeras fases de desa-
rrollo, en este punto puede ser tratado con tecnicas que tienen un menor impacto en la
paciente[6] aumentando la posibilidad de curacion y supervivencia al cancer de seno.
La tendencia al aumento de nuevos casos ha llevado a la instauracion de estrategias para la
deteccion temprana del cancer de mama a traves del tamizaje. Esto consiste en realizar un
conjunto de pruebas cuyo objetivo es detectar tempranamente la enfermedad y los resultados
se obtienen de forma rapida y economica. Algunas de las pruebas para la deteccion frecuen-
temente utilizadas son: el autoexamen de mama, el examen clınico y la mamografıa. Esta
ultima se establece como la modalidad de examenes de deteccion no invasivo que mas se usa
en mujeres entre 40 y 70 anos.
1.1.3. Imagen mamografica
La mamografıa es una imagen radiologica de las glandulas mamarias que se obtiene a traves
de un mamografo. Este dispositivo permite irradiar rayos X en bajas dosis y de forma con-
trolada, que al interactuar con los tejidos blandos de la mama, pueden ser absorbidos en
distintos grados, dando como resultado la formacion de la imagen y permitiendo el diagnosti-
co de lesiones no palpables, lo que la hace fundamental en la deteccion precoz de cancer de
seno [6].
El uso de imagenes mamograficas se considera como el unico metodo no invasivo que ha
demostrado una reduccion en las tasas de mortalidad por cancer mamario [28]. Algunos estu-
dios senalan que ha logrado disminuir la mortalidad hasta en un 30 %[10]. Este examen tiene
un riesgo de irradiacion bajo, que sin embargo la exposicion continua a estas a radiaciones
ionizantes, que en dosis acumulativas puede ser potencialmente peligroso. Por este motivo, se
realiza este examen con un periodo lo suficientemente largo para no exponer a las pacientes
a los riegos, pese a que el mejoramiento de las tecnologıas en los equipos y el control de cali-
dad logran reducir de manera significativa la dosis de radiacion promedio de la mamografıa.
Capıtulo 1. Marco Conceptual 10
Ademas el bajo costo de las mamografıas, justifican su uso generalizado [28].
1.1.4. Tipos de proyecciones
Para el estudio radiologico de las glandulas mamarias se deben realizar dos proyecciones, que
en algunas ocasiones pueden complementarse con proyecciones adicionales para mejorar la
valoracion de zonas dudosas. [23] Las dos proyecciones que mas se utilizan son la proyeccion
medio lateral oblicua (MLO) y craneo caudal (CC). (Fig. 1.1).
Al tomar estas dos proyecciones desde diferentes angulos, se evitan los efectos de superpo-
sicion de estructuras mamarias y por consiguiente, el riesgo de enmascaramiento de alguna
anormalidad se reduce de forma significativa. Durante el proceso de toma de la imagen
radiografica se realiza una compresion controlada de la mama, lo cual reduce la radiacion
dispersa y brinda la inmovilizacion que separa los tejidos superpuestos disminuyendo el grosor
de la mama para obtener un buen contraste en la imagen, logrando que aumente la proba-
bilidad de detectar lesiones pequenas, puesto que el tejido mamario denso puede enmascarar
algunos canceres palpables, sobre todo aquellos que se presentan en la mamografıa como
masas o distorsiones [4].
Figura 1.1: Proyeccion craneo caudal (Fig. izquierda) y medio lateral oblicua (Fig. derecha) de la mamaizquierda.
Capıtulo 1. Marco Conceptual 11
1.1.5. Bases de datos de imagenes mamograficas
Los bancos de registros mamograficos son una recopilacion de imagenes de las glandulas
mamarias. La base de datos con mayor cantidad de imagenes mamograficas disponible en
la red es se denomina DDSM y es la que dispone la Universidad del Sur de la Florida.
Esta organizada en volumenes y casos. Cada caso posee cuatro imagenes que pertenecen a
dos proyecciones de cada seno (Medio Lateral Oblicuo y Craneo Caudal). Si en la imagen
se visualizan anomalıas en el tejido mamario estas son descritas y claramente demarcadas.
Todos estan clasificados segun el sistema BI-RADS5 (American College of Radiology -ACR-
1998). Cada imagen cuenta con informacion tecnica como la resolucion, la densidad del tejido
y el grado de sutileza del hallazgo. Ademas tiene informacion del paciente como la edad, la
clasificacion e identificacion de la anomalıa y su respectivo diagnostico[23].
El proposito principal de las bases de datos de este tipo es permitir el acceso a quienes deseen
realizar investigaciones sobre las mamografıas, por ejemplo en el desarrollo de herramientas
para la deteccion de anomalıas o regiones sospechosas que ayuden en el diagnostico.
1.1.6. Hallazgos en imagenes mamografıcas
Microcalcificaciones mamarias
Los hallazgos mas frecuentes en la mamografıa son las microcalcificaciones. Son pequenos
depositos de calcio en el interior del tejido mamario que tienen un diametro menor a 2
mm. En las imagenes mamograficas son agrupaciones de pıxeles relativamente brillantes
comparados con los pıxeles vecinos como se ve en la figura 1.2. Las microcalcificaciones
son una patologıa benigna, sin embargo el 55 % de los casos de cancer de seno no palpable
presentan microcalcificaciones visibles. Para clasificar las microcalcificaciones se debe tener
en cuenta la forma, el tamano, la densidad, la cantidad, la distribucion y ubicacion dentro de
la mama. Por ejemplo las microcalcificaciones benignas son generalmente mas grandes y mas
gruesas con contornos redondos y suaves con respecto a las microcalcificaciones malignas
que tienden a ser pequenas, numerosas y agrupadas[17]. Se considera de alta sospecha de
malignidad si en un area menor a 1 cm2 hay tres o mas microcalcificaciones presentes [13].
Capıtulo 1. Marco Conceptual 12
Figura 1.2: (a) Imagen mamografica con microcalcificaciones mamarias. (b) Magnificacion de la regiondemarcada con rojo. (c) Magnificacion de la region demarcada con amarillo.
Distribucion de microcalcificaciones agrupadas
Cuando las microcalcificaciones se encuentran agrupadas deben ser estudiadas con detalle
en proyecciones craneo caudal y medio lateral oblicua. Para que esto se realice de forma
adecuada se requiere de altos estandares de calidad para la adquisicion del examen y tiempos
de exposicion a la radiacion relativamente cortos, ademas de una adecuada compresion de
la mama para obtener un buen contraste [1]. Cualquier lesion significativa debe localizarse
mediante triangulacion, de manera que su ubicacion pueda ser reconocida.[27].
Las diferentes distribuciones de microcalcificaciones se pueden ver en la figura 1.3 y se des-
criben a continuacion:
Distribucion difusa: Son microcalcificaciones distribuidas de forma aleatoria dentro del
tejido y por lo general son benignas.
Distribucion regional: Las microcalcificaciones estan en un area extensa o en mas de
un cuadrante de tejido mamario sin presentar una distribucion ductal. Generalmente
son benignas, pero se debe considerar la morfologıa para descartar malignidad.
Capıtulo 1. Marco Conceptual 13
Distribucion segmentaria: Las microcalcificaciones por lo general se distribuyen en los
ductos y sus ramas, siguiendo la forma anatomica de un lobulo mamario, es decir, en
forma de triangulo cuyo vertice se dirige hacia el pezon.
Distribucion lineal: Las microcalcificaciones se distribuyen en una lınea que puede ra-
mificarse, siguiendo una distribucion ductal. Generalmente advierte alguna malignidad
con un valor predictivo positivo entre 50-70 % .[1]
Cumulo: Son almenos tres microcalcificaciones agrupadas en un area pequena de tejido.
Figura 1.3: Tipos de distribucion de microcalcificaciones mamarias
Capıtulo 1. Marco Conceptual 14
1.2. Procesamiento de imagenes
1.2.1. Transformada Wavelet
La transformada wavelet (TW) es una herramienta matematica que permite representar de
una funcion en versiones desplazadas y escaladas de una funcion wavelet. En terminos de
senalaes logra de forma simultanea una buena representacion de una senal tanto en tiempo
como en frecuencia [19]. Las transformada wavelet en el analisis multirresolucion se puede
aplicar para la compresion de informacion, la reduccion de ruido, la deteccion de objetos, el
analisis de texturas de una imagen, entre otros. [16].
La transformada wavelet (TW) de una funcion f(t) es la expansion en terminos o coefi-
cientes del producto interno entre f(t) y la version trasladada y dilatada de una wavelet
madre. La transformada wavelet se define de la siguiente manera:
〈f(t), ψs,τ (t)〉 = W (s, τ) =
∞∫−∞
f(t)ψs,τ (t)∗dt (1.1)
La wavelet madre es ψt; ψs,τ (t) son las versiones escaladas y desplazadas de la wavelet que
expresan de la siguiente manera:
ψs,τ (t) =1√sψ(t− τs
) (1.2)
donde el parametro s ocasiona que la funcion se dilate o se contraiga; para el caso s > 1 la
funcion wavelet se dilata y cuando s < 1 se contrae. El parametro τ indica la traslacion de
la funcion.
Existen tres tipos posibles de transformada wavelet: la continua (CWT), la discreta (DWT)
y la expansion en series wavelet. Ademas se pueden aplicar a funciones bidimensionales, au-
mentando la dimension de la transformada en una unidad. Por ejemplo para una funcion
I(x, y) la transformada wavelet bidimensional continua se expresa como:
W (s, τx, τy) =
∞∫−∞
∞∫−∞
I(x, y)ψs,τx,τy(x, y)dxdy (1.3)
donde s causa que la funcion wavelet se dilate. El parametro τx y τy indican las traslaciones
en las dos dimensiones.
Capıtulo 1. Marco Conceptual 15
La transformada wavelet permite obtener una buena representacion de una senal tanto en
tiempo como en frecuencia de forma simultanea, logrando determinar el intervalo de tiempo
en el cual aparecen determinadas componentes espectrales [19]. Ademas permite filtrar una
senal en el dominio del temporal mediante filtros pasabajo y pasaalto que eliminan compo-
nentes de alta o baja frecuencia.
Funcion Wavelet
Una funcion wavelet es una forma de onda de duracion limitada que esta contraida en el
origen y tiene un valor promedio igual a cero. Esta funcion decrece rapidamente a cero con-
forme aumenta la variable independiente (t→∞). Por tratarse de una funcion de duracion
limitada su energıa esta concentrada alrededor de un punto, lo que la hace una herramienta
adecuada para el analisis de fenomenos transitorios [19].
Existen muchas funciones wavelets agrupadas en familias segun su utilidad. Por ejemplo,
la familia Daubechies (Fig. 1.4) es un conjunto de wavelets ortonormales en la cual la norma
de cada elemento que la compone es unitaria, esto las hace muy apropiadas para aplicarse
en el analisis de senales discretas.
Figura 1.4: Familia de wavelets Daubechies. La wavelet Daubechies 1 tambien es conocida como waveletHaar.
Capıtulo 1. Marco Conceptual 16
Transformada Wavelet Discreta
La discretizacion de la transformada wavelet permite representar una funcion f(t) en terminos
de funciones elementales acompanadas de coeficientes, pasando de un mapeo continuo a un
conjunto finito de valores. La integral de la transformada (Ec. 1.1) es cambiada por una
aproximacion discreta a traves sumatorias [15], es posible representar a f(t) como la suma
de funciones wavelet y funciones de escala como se muestra en la siguiente expresion:
f(t) =∑k
∑j
cj,kϕ(t) +∑k
∑j
dj,kψ(t) (1.4)
donde ϕ(t) es la funcion escala, ψ(t) es la funcion wavelet y cj,k y dj,k son los respectivos
coeficientes de la serie.
Una forma de discretizar los parametros de escala y desplazamiento es mediante el mues-
treo exponencial, es decir, se toma s = a−j y τ = kna−j y se obtiene una familia de funciones
discretizadas que constituye las bases wavelet ortonormales como expresa a continuacion:
ψ(t)j,k = aj/2ψ(ajt− kn) (1.5)
Para obtener una mejor aproximacion de la funcion en niveles de resolucion muy finos, es
necesario que las wavelet sean dilatadas por un factor a = 2 de tal forma que se tiene
2−j, logrando ası una resolucion 2j. A estas funciones se le denomina wavelets diadicas y se
representan ası:
f(t) =∑k
∑j
cj,k2j/2ϕ(2jt− kn) +
∑k
∑j
dj,k2j/2ψ(2jt− kn) (1.6)
Transformada Wavelet discreta en dos dimensiones
La transformada wavelet se puede extender para el caso de funciones en bidimensionales
redefiniendo las funciones wavelet y de la siguiente manera:
ϕ(x, y)j,m,n = 2j/2ϕ(2jx−m, 2jy − n)
ψi(x, y)j,m,n = 2j/2ψi(2jx−m, 2jy − n)
Por lo tanto la trasnformada wavelet discreta para una funcion bidimensional I(x, y) o para
una imagen de tamano MxN se define ası:
Capıtulo 1. Marco Conceptual 17
Wϕ(j,m, n) =1√MN
M−1∑x=0
N−1∑y=0
I(x, y)ϕ(x, y)j,m,n (1.7)
W iψ(j,m, n) =
1√MN
M−1∑x=0
N−1∑y=0
I(x, y)ψi(x, y)j,m,n (1.8)
donde j es el nivel de resolucion, la funcion Wϕ representa los coeficientes de aproximacion.
La funcion W iψ(j,m, n) cuyo exponente i corresponde a los valores H,V y D, dando lugar a
WHψ , W V
ψ , WDψ que representan los coeficientes de detalle horizontal, vertical y diagonal.
1.2.2. Analisis multirresolucion
El analisis multirresolucion (MRA) consiste en la descomposicion multiescala de una fun-
cion en terminos de sus componentes de frecuencia. Dentro del analisis multirresolucion las
funciones son sometidas a operaciones de interpolacion y muestreo que para el caso de una
imagen provoca un cambio en la resolucion y escala.
Algoritmo de Mallat
El Algoritmo de Mallat es muy utilizado en el analisis multirresolucion, puesto que representa
la descomposicion de una imagen en terminos de coeficientes wavelet como si fuera una
piramide. La base de esta piramide es la imagen original y en cada nivel de descompsicion
(n) se generan una matriz de coeficientes de aproximacion y tres matrices de coeficientes de
detalles (horizontales, verticales y diagonales). Conforme el nivel de la piramide aumenta, las
aproximaciones de la imagen original cada vez tienen una menor resolucion espacial como se
ilustra en la figura 1.5.
El algoritmo de Mallat utiliza las funciones wavelet madre y escala como un banco de filtros
de espejo en cuadratura (QMF) pasa alto y pasa bajo, dividiendo la imagen en dos bandas
de frecuencia. Puesto que las funciones wavelet son ortonormales se asegura que la imagen
en cada nivel de descomposicion tiene una representacion independiente, es decir, no se ge-
nera informacion redundante evitando la aparicion de informacion erronea [19]. Dado que la
transformada wavelet discreta utiliza funciones diadicas (Ec. 1.6), las matrices son submues-
treadas por un factor de dos, causando una reduccion en la resolucion espacial en un factor
de 2n filas y columnas, donde n es el nivel de descomposicion [22]. La figura 1.6 muestra el
esquema de descomposicion wavelet hasta el primer nivel de la funcion I(x, y) para obtener
los coeficientes de aproximacion y de detalles horizontales, verticales y diagonales, y la figura
1.7 muestra la implementacion hasta el primer nivel de descomposicion sobre una una ima-
Capıtulo 1. Marco Conceptual 18
Figura 1.5: Piramide de descomposicion wavelet hasta el tercer nivel, donde cAn son los coeficientes deaproximacion y cHn, cVn, cDn son los de detalle vertical, horizontal y diagonal en el nivel n
gen a escala de grises. Cuando el proceso se invierte, la imagen original podra reconstruirse
exactamente a partir de las matrices de coeficientes de aproximacion y detalle pero las filas
y columnas seran sobremuestreadas.
Capıtulo 1. Marco Conceptual 19
Figura 1.6: Esquema del banco de filtros para la descomposicion wavelet en dos dimensiones hasta el primernivel.
Figura 1.7: La figura de la izquerda muestra la imagen original a escala de grises y las imagenes de laderecha corresponden a las matrices de coeficientes de aproximacion (cA1) y de detalles horizontales (cH1),verticales (cV1) y diagonales (cD1) del primer nivel de descomposicion.
Capıtulo 2
Metodologıa
En esta seccion, se describe el procedimiento para la deteccion de candidatos a microcalcifi-
caciones agrupadas en imagenes mamograficas. En la primera parte se expone la obtencion
de la imagen, seguido de la segmentacion del tejido mamario. Luego se describen las tecni-
cas para la segmentacion, empleando realce, umbralizacion y la clasificacion por longitud.
Por ultimo, la deteccion de microcalcificaciones agrupadas se realiza mediante un metodo de
agrupamiento por densidad. En la Figura 2.1 se muestra la metodologıa general utilizada en
este trabajo.
2.1. Captura
Para el desarrollo de este trabajo se emplearon las imagenes mamograficas que dispone la
Universidad del Sur de la Florida denominada DDSM 1. Esta base de datos se constituye por
mas de 2620 casos, donde cada uno posee cuatro imagenes correspondientes a dos proyecciones
de cada seno: Medio Lateral Oblicua (MLO) y Craneo Caudal (CC) [7]. Todas las imagenes
tienen una resolucion espacial en un rango de 50 a 80 µm por pıxel con una profundidad
de 12 bits. Cabe resaltar que la base de datos esta validada, por consiguiente se conoce la
localizacion y el contorno de de las agrupaciones de microcalcificaciones para poder contrastar
con los resultados obtenidos por el algoritmo.
Conversion del formato LJPEG
El formato ((.ljpeg)) se puede visualizar en sistemas operativos de tipo “Unix”, si se requiere
visualizar en otros sistemas operativos, es necesario convertir el formato a otro que sea legi-
ble. Las imagenes de las mamografıas obtenida en la base de datos DDSM tiene extension
1DDSM es la sigla de las palabras en ingles Digital Database for Screening Mammography
20
Capıtulo 2. Metodologıa 21
Figura 2.1: Esquema general de la metodologıa propuesta.
es “.ljpeg”, por ese motivo no se pueden visualizar directamente de forma correcta, como se
muestra en la figura 2.2. Para ello es necesario convertirla a una imagen de extension ((PNG)).
El software DDSM, publicado en la pagina web del Dr. Chris Rose de la Universidad de
Manchester, cuyo uso es con fines investigativos, permite la conversion de imagenes de ex-
tension ((ljpeg)) a un formato legible. Para realizar dicha conversion es necesario instalar un
software que emule a los sistemas operativos tipo Unix bajo otro sistema operativo; para
este fin se utiliza el software “Cygwin”. A continuacion se describe como convertir la imagen
((A 0005 1.LEFT CC.LJPEG)) a formato ((.PNG)) en Cygwin:
− Abrir el software Cygwin y cambiar la carpeta raız a la carpeta ((ddsm-software)).
− Escribir el comando “./jpeg.exe -d -s A 0005 1.LEFT CC.
LJPEG”, este debe encontrarse dentro de la carpeta ((ddsm-software)).
− Dentro de la carpeta se crea un archivo
“A 0005 1.LEFT CC.LJPEG.1”
Capıtulo 2. Metodologıa 22
Figura 2.2: La imagen de la izquierda corresponde al caso A 0005 1.LEFT CC convertida correctamente ala extension .PNG. La figura de la derecha muestra la imagen convertida de manera incorrecta
− Es necesario convertir esta la extencion ((.LJPEG.1)) a ((.PNM)). Para ello se debe es-
cribir el comando
“./ddsmraw2pnm.exe A 0005 1.LEFT CC.LJPEG.1
4680 2736 lumisys”. Donde 4680 son las filas y 2736 son las columnas de la imagen
original y “lumisys” es el digitalizador; sin embargo este puede ser ”dba”, ”howtek-
mgh”, ”howtek-ismd.o ”lumisys”. La informacion de cada una de las imagenes para
la correcta conversion se encuentra dentro del archivo ((.ICS)) disponible en la base de
datos DDSM.
− Una vez hecho esto, se obtiene el archivo
“A 0005 1.LEFT CC.LJPEG.1-ddsmraw2pnm.pnm”
− Finalmente se debe escribir el comando “convert.exe -depth 16 A 0005 1.LEFT CC.LJPEG.1-
ddsmraw2pnm.pnm”. Como resultado se adquiere correctamente la imagen en formato
((.PNG)) como se muestra en la figura 2.2.
2.2. Preprocesamiento
Para analizar con detalle el tejido mamario en las mamografıas y aminorar el gasto compu-
tacional, es indispensable restringir el area de interes, reduciendo el fondo de la imagen y el
Capıtulo 2. Metodologıa 23
rotulo que indica el tipo de proyeccion en que fue realizada la mamografıa. Un tecnica muy
utilizada para diferenciar los objetos y el fondo es la binarizacion a traves de umbral. Esto
consiste en transformar una imagen en escala de grises a una con dos niveles de intensidad
mediante un umbral. Cuando los niveles de gris superan este valor se convierten en blanco;
en el caso opuesto en negro. El procedimiento anterior se define formalmente en la siguiente
expresion:
B(x, y) =
1 si I(x, y) ≥ µTh
0 si I(x, y) < µTh
(2.1)
donde I(x, y) es la imagen original, B(x, y) es la imagen binarizada y µTh es el promedio de
niveles de gris de la imagen y corresponde al umbral.
El resultado es una imagen binaria que muestra el fondo en color negro, el rotulo y la mama
en color blanco (Figura 2.3). Despues, se realiza el etiquetado de los objetos de la imagen
binaria; allı se calcula el area de cada elemento blanco y se selecciona unicamente el que
tiene mayor area; en este caso es el tejido mamario. Por ultimo, la imagen original se reduce
al tamano de un rectangulo que circunscribe la silueta de la mama, como se observa en la
Figura 2.3 d.
2.3. Segmentacion
Las microcalcificaciones en las imagenes mamograficas se caracterizan por ser agrupaciones
de pıxeles relativamente brillantes comparados con los pıxeles cercanos. A causa de las bajas
dosis y corto tiempo de exposicion a la radiacion a la que son sometidos los pacientes, las
imagenes presentan bajo contraste, provocando que entre el 10 y el 40 % de estas lesiones
pasen desapercibidas [26]. Por esta razon, realzarlas podrıa ser un paso significativo para la
segmentacion, porque producirıa buenos resultados tanto en la segmentacion manual como
automatica [20].
En esta seccion, se presentan dos metodos para el realce de microcalcificaciones a traves
del analisis multirresolucion: la supresion sub-banda y la segmentacion mediante umbraliza-
cion.
En primer lugar, la imagen original se divide en regiones cuadradas no superpuestas de 1 cm2
para analizar detalladamente el tejido mamario (Figura 2.5 a). Posteriormente, se aplican los
Capıtulo 2. Metodologıa 24
Figura 2.3: (a) Imagen mamografica original. (b) Imagen mamografica binarizada. c) Seleccion del elementocon mayor area de la imagen binaria. (d) Imagen mamografica original recortada.
metodos para el realce de candidatos a microcalcificaciones que se describen a continuacion:
Metodo de realce 1
Se presenta un metodo que a partir del analisis multirresolucion (MRA2) y la supresion
sub-banda realza los detalles finos y brillantes de las mamografıas reduciendo la densidad
del tejido mamario. El analisis multirresolucion empieza con la descomposicion de la imagen
inicial en diferentes niveles de resolucion mediante la transformada discreta wavelet (DWT3)
[26], proporcionando una jerarquıa simple para la interpretacion de la informacion de la
imagen [15]. En la descomposicion se obtienen cuatro matrices de coeficientes wavelet o sub-
bandas en cada nivel (n), a medida que el nivel n aumenta, el numero de filas y columnas
de las matrices se reducen en un factor de 2n [21]. La primera matriz son los coeficientes de
aproximacion (imagen aproximada) y las tres restantes estan compuestas de coeficientes de
2MRA es la sigla de las palabras en ingles Multiresolution analysis3DWT es la sigla de las palabras en ingles Discrete wavelet transform
Capıtulo 2. Metodologıa 25
detalles verticales, horizontales y diagonales, respectivamente [18].
En este metodo, la imagen inicial se normaliza y se descompone hasta el cuarto nivel, en
donde los coeficientes de aproximacion tan solo muestran una representacion tosca de la
mama. Posteriormente, se realiza la reconstruccion de la imagen desde el cuarto hasta el
segundo nivel a traves de la transformada discreta wavelet inversa (IDWT4). En este proceso
se suprimen las sub-bandas correspondientes a los coeficientes de detalle horizontal, vertical
y diagonal, reconstruyedo la imagen solo con los coeficientes de aproximacion de cada nivel.
Este proceso se muestra en el esquema de la Figura 2.4.
Figura 2.4: Esquema de descomposicion y reconstruccion de la imagen para el realce de microcalcificaciones.Donde cAn son los coeficientes de aproximacion, cDH,V,D
n , son los coeficientes de detalle horizontal, verticaly diagonal del nivel de descomposicion y reconstruccion n
Una vez se alcanza el segundo nivel de reconstruccion, se obtiene una imagen aproximada
sin detalles finos. En vista de que las matrices de coeficientes wavelet de aproximacion en la
reconstruccion y descomposicion tienen el mismo tamano y su correlacion es lineal, se realiza
una sustraccion entre ambas, dando origen a una imagen en la que se observa una reduccion
considerable del brillo y densidad del tejido mamario, logrando resaltar las microcalcificacio-
nes y tambien otros elementos pequenos y brillantes, como se aprecia en la Figura 2.5 d. Por
ultimo, se reconstruye la imagen hasta su tamano original.
Metodo de realce 2
En este metodo la imagen inicial es normalizada e invertida. A traves del analisis multirre-
solucion y mediante la transformada wavelet (DWT) se descompone hasta el quinto nivel.
4IDWT es la sigla de las palabras en ingles Inverse discrete wavelet transform
Capıtulo 2. Metodologıa 26
Figura 2.5: (a) Imagen original. (b) Region seleccionada en color rojo de la imagen a. (c) Imagen b invertida.(d) Realce de microcalcificaciones con el metodo 1. (e) Realce de microcalcificaciones con el metodo 2.
Desde allı se reconstruye la imagen eliminando las sub-bandas correspondientes a los coe-
ficientes de aproximacion; esto se hara hasta el segundo nivel. Como resultado, se obtiene
una imagen aproximada con algunos elementos difusos, que son reducidos eliminando algunos
coeficientes wavelet de detalle a traves de un umbral establecido con la desviacion estandar
de su distribucion [9]. Posteriormente, se procede a reconstruir la imagen hasta su tamano
original como muestra el esquema de la Figura 2.6. El resultado es una imagen en donde se
resaltan las microcalcificaciones y se disminuye el brillo del tejido mamario como se aprecia
en la Figura 2.5 e.
Segmentacion por umbralizacion
En las imagenes realzadas, los histogramas de coeficientes presentan una distribucion normal
(gaussiana) (Figura 2.7). Para lograr la segmentacion de estos elementos, se parte de las
siguientes hipotesis: La primera, sugiere que las microcalcificaciones pueden ser segmentadas
utilizando un umbral cercano a los coeficientes de valor mas alto, es decir, los niveles de gris
de mayor magnitud en la imagen. La segunda hipotesis se basa en la baja presencia de mi-
crocalcificaciones en las imagenes. Por consiguiente se plantea que la probabilidad de que un
pıxel conforme una microcalcificacion sea baja. Esto ultimo permite relacionar el histograma
con la funcion de densidad de probabilidad normal.
Capıtulo 2. Metodologıa 27
Figura 2.6: Esquema de descomposicion y reconstruccion de la imagen para el metodo 2 de realce demicrocalcificaciones.
Para relacionar ambas hipotesis, se plantea la umbralizacion para la segmentacion de candi-
datos a microcalcificaciones con la siguiente expresion:
U(x, y) =
{0 si µ− 3σ ≤ R(x, y) ≤ µ+ 3σ
1 para otros casos(2.2)
donde U(x, y) es la imagen umbralizada, R(x, y) es la imagen realzada, µ es el valor medio
y σ es la desviacion estandar de la distribucion de niveles de gris. El intervalo en el que los
pıxeles se vuelven cero en la funcion U(x, y) son aquellos en los que la probabilidad de no
hacer parte de una microcalcificacion es cercana al 98 % (Figura 2.7) o visto de otra manera,
este intervalo corresponde a los pıxeles con un nivel de intensidad relativamente bajo.
Figura 2.7: Histograma de niveles de gris de los pıxeles de una imagen realzada. El intervalo de colorrojo corresponde a la cantidad de pıxeles que en una probabilidad cercana al 98 % no corresponden a unamicrocalcificacion. El intervalo de color azul son los valores que tienen una probabilidad de conformar unamicorcalcificacion y tienen un nivel de intensidad alto
Capıtulo 2. Metodologıa 28
Clasificacion por longitud
Una vez que se logra la segmentacion de las imagenes, muchos objetos que no son de interes
logran ser clasificados como candidatos, lo que elevan el numero de falsos positivos. Para
reducir esto, se propone clasificarlos a partir de su longitud.
Para el desarrollo de este metodo, se realiza el etiquetado de objetos de la imagen binaria y se
evalua la longitud de cada uno. Considerando que una microcalcificacion es sospechosamente
maligna cuando tiene una longitud menor a 1 mm [20], por consiguiente, se descartan los
elementos que esten por fuera de este lımite, como se evidencia en la figura 2.8.
Para poder realizar la medicion adecuada de la longitud de los elementos es imprescindi-
ble conocer su tamano en pıxeles. Se debe tener en cuenta que las imagenes son tomadas con
una resolucion espacial entre 50 y 80µmpix
[26], en consecuencia, se utiliza la siguiente expresion
para conocer la longitud en pıxeles de los candidatos a microcalcificaciones:
Lpix =LmRe
(2.3)
donde Lpix es la longitud en pixeles, Lm es la longitud en µm de las microcalcificaciones y
Re es la resolucion espacial de la imagen. Por ejemplo, para una microcalcificacion de 1 mm
de longitud en una imagen de resolucion espacial de 50µmpix
se tiene que:
Lpix =1000µm
50µmpix
= 20 pix (2.4)
Figura 2.8: (a) Imagen original. (b) Realce con el metodo 2. (c) Imagen umbralizada. (d) Elementos de laimagen umbralizada clasificados por longitud.
Capıtulo 2. Metodologıa 29
Interseccion de imagenes binarias
Despues de la clasificacion por longitud de los candidatos a microcalcificaciones, se procede
a realizar la operacion de interseccion entre las imagenes binarias. Esto ocasiona que se
segmenten los elementos que en los dos metodos de realce coinciden como candidatos a
microcalcificaciones, como se ve en la Figura 2.9 c.
Figura 2.9: (a) Imagen realzada con el metodo 1. (b) Umbralizacion del metodo 1. (c) Interseccion entrelas umbralizaciones. (d) Imagen realzada con el metodo 2. (e) Umbralizacion del metodo 2. (f) Seleccion decandidatos a microcalcificalcificaciones.
2.4. Extraccion de caracterısticas e identificacion de
objetos
Las microcalcificaciones se consideran de alta sospecha de malignidad cuando tres o mas se
agrupan en un area menor a 1 cm2. En vista de esto, se propone identificar las agrupacio-
nes utilizando un algoritmo de agrupamiento basado en densidad (DBC5). Esto consiste en
conectar los objetos de la imagen binaria dentro de un umbral de distancia, logrando definir
las areas de mayor densidad dentro de la imagen. Para el desarrollo de esto, inicialmente se
5Es la sigla de las palabras en ingles density based clustering
Capıtulo 2. Metodologıa 30
calcula la distancia euclidiana entre los objetos de la imagen binaria y se organiza en una
matriz de distancias como se muestra a continuacion:
D =
C1 C2 C3 Cj
C1 0 d1,2 d1,3 . . . d1,j
C2 d2,1 0 d2,3 . . . d2,j
C3 d3,1 d3,2 0 . . . d3,j...
......
. . ....
Ci di,1 di,2 di,3 . . . 0
(2.5)
donde los elementos di,j de la matriz corresponden a la distancia euclidiana entre los centroi-
des de los objetos Ci y Cj de la imagen binaria (Fig. 2.10).
A partir de la matriz D de la expresion 2.5 se genera una nueva matriz D∗, en donde los ele-
mentos di,j son anulados cuando superan el umbral de distancia RTh , pero en el caso contrario
tomaran valor de uno, como se muestra en la siguiente expresion:
pi,j =
{0 si dij > RTh
1 si dij ≤ RTh
i 6= j (2.6)
D∗ =
C1 0 p1,2 p1,3 . . . p1,j
C2 p2,1 0 p2,3 . . . p2,j
C3 p3,1 p3,2 0 . . . p3,j...
......
. . ....
Ci pi,1 pi,2 pi,3 . . . 0
(2.7)
Cuando la suma de los elementos de cada fila de la matriz D∗ es mayor o igual a tres, el
objeto Ci se considera como un candidato a microcalcificacion agrupada como se demuestra
en la siguiente exrpresion:
Fi =∑n
j=1 pi,j
Si Fi ≥ 3⇒ Ci es un candidato
(2.8)
donde Fi es la sumatoria de los elementos pi,j de la fila i de la matriz D∗.
Este metodo, visto de otra manera, consiste en fijar una distancia radial o umbral fijo (RTh)
que para este caso sera de 0,5 cm o 20 pıxeles desde el centroide de cada objeto Ci, y se
Capıtulo 2. Metodologıa 31
evalua el numero de vecinos dentro de este radio. Si cumple con la condicion de tener 3 o
mas vecinos, sera clasificado como candidato a microcalcificacion agrupada, pero en el caso
contrario, el elemento sera descartado como se muestra en la Figura 2.10.
Figura 2.10: La imagen de la izquierda muestra el tejido mamario con una agrupacion de microcalcifica-ciones. La imagen de la derecha muestra la segmentacion de los candidatos a microcalcificaciones. El cırculode color azul corresponde a la region radial de un candidato a microcalcificacion con 3 vecinos. El cırculocolor rojo corresponde a la region de un elemento que se descarta como candidato a microcalcificacion porno tener vecinos dentro de la region radial
Capıtulo 3
Resultados
En esta seccion se presentan los resultados experimentales obtenidos con el algoritmo desa-
rrollado. Para evaluar la efectividad del algoritmo propuesto, se valido con la base de datos
DDSM. Cada una de las imagenes tiene la descripcion del contorno del hallazgo marcado
como anormal. Ademas se califica el nivel de sutileza en 5 niveles, en donde el primer nivel
indica que las microcalcificaciones son sutilmente evidentes y el quinto nivel denota que la
presencia de microcalcifiacaciones es evidente en la imagen. Las pruebas del algoritmo se
realizaron con imagenes desde el segundo hasta el quinto nivel de sutileza.
La evaluacion del algoritmo de deteccion de microcalcificaciones se hizo empleando el analisis
de sensibilidad y especificidad de las curvas ROC1. En una imagen mamografica que con-
tenga microcalcificaciones agrupadas, aquellas que sean detectadas se consideran verdaderos
positivos (VP), mientras que las que no son detectadas se estiman como falsos negativos
(FN). Cuando la imagen no tiene microcalcificaciones agrupadas y el algoritmo indica alguna
deteccion, esta clasifica como falso positivo (FP) y en caso contrario como verdadero negativo
(VN).
1ROC es la sigla de las palabras en ingles Receiver Operating Characteristic
32
Capıtulo 3. Resultados 33
Resultados de la clasificacion de tejido mamario sin microcalcifica-
ciones agrupadas
Se analizaron 84 imagenes de la base de datos DDSM. La mitad de estas imagenes presentan
microcalcificaciones agrupadas. Para medir los resultados de las pruebas realizadas con el
algoritmo se utilizan las siguientes variables:
ES =V N
V N + FP(3.1)
donde ES es la probabilidad de clasificar correctamente una imagen mamografica sin micro-
calcificaciones como tejido mamario sano, es conocida como especificidad de la prueba.
En el Cuadro 3.1 se muestran los valores de la especificidad de la prueba en la clasifica-
cion de las mamografıas sin microcalcificaciones agrupadas, utilizando diferentes familias de
funciones wavelet:
Funcion Es
db4 0,71db8 0,66db12 0,63db16 0,68sym4 0,63sym8 0,71sym12 0,76sym16 0,78coif3 0,60coif5 0,66
Cuadro 3.1: Especificidad de la prueba comparando el desempeno del algoritmo con diferentes funcioneswavelet
En el Cuadro 3.1, db hace referencia a la familia de funciones wavelet daubechies, Sym
corresponde a la familia de wavelet Symlet y Coif es la familia de wavelets coiflet. El numero
que las acompana es el orden de cada funcion.
Capıtulo 3. Resultados 34
Resultados de la segmentacion de candidatos a microcalcificaciones
agrupadas en mamografıas
Se realizaron pruebas con 42 imagenes que contienen microcalcalcificaciones agrupadas en
distribuiciones segmentarias, lineales y ramificadas desde el segundo hasta el quinto nivel de
sutileza. Para evaluar la prueba se utilizan las siguietnes variables.
PPV =V P
V P + FP(3.2)
SE =V P
V P + FN(3.3)
D =√
(1− SE)2 + (1− PPV )2 (3.4)
PPV2 hace referencia al valor predictivo positivo. SE es la sensibiliad de la prueba, que indica
la probabilidad de clasificar correctamente las microcalcificaciones acumuladas, es decir que
una agrupacion sea clasificada correctamente con presencia de dichos elementos.
En el Cuadro 3.2 se muestran los resultados de la clasificacion de candidatos a microcal-
cificaciones mamarias agrupadas en imagenes mamograficas con presencia de agrupaciones
de microcalcificaciones en distribuciones acumuladas, segmentarias y lineales:
db8 db16 sym8 sym16 coif5
SE 0,718 0,774 0,687 0,681 0,667PPV 0,667 0,725 0,711 0,727 0,651D 0,437 0,376 0,525 0,420 0,482
Cuadro 3.2: SE , PPV y D de la prueba comparando el desempeno del algoritmo con diferentes funcioneswavelet.
La clasificacion correcta se logra cuando el valor de SE y PPV es uno, correspondiendo a un
100 % de sensibilidad y un 100 % de razon de exitos. En otras palabras, sin falsos positivos.
La variable D es la distancia euclidiana desde un punto ubicado en la curva ROC sobre la
curva hasta la coordenada (1,1). La figura 3.1 muestra la curva ROC de las funciones wavelet
evaluadas en el Cuadro 3.2.
2PPV es la sigla de las palabras en ingles Predictive Positive Value
Capıtulo 3. Resultados 35
En los Cuadros 3.3 y 3.4 se presentan los resultados de la deteccion de candidatos a micro-
calcificaciones mamarias agrupadas, en imagenes mamograficas con niveles de sutileza desde
el segundo hasta el quinto:
db8 db16
Sutileza SE PPV D SE PPV D2 0,500 0,417 0,768 0,556 0,500 0,6693 0,545 0,667 0,429 0,586 0,700 0,5834 0,733 0,733 0,377 0,833 0,667 0,3735 0,875 0,667 0,356 0,923 0,706 0,304
Cuadro 3.3: Valores de SE , PPV y D con las funciones wavelet db8 y db16, en imagenes con niveles desutileza del 2 al 5.
sym8 sym16 coif5
Sutileza SE PPV D SE PPV D SE PPV D2 0,556 0,556 0,385 0,538 0,583 0,62 0,467 0,481 0,7433 0,636 0,635 0,467 0,583 0,636 0,553 0,538 0,609 0,6054 0,688 0,647 0,471 0,750 0,706 0,386 0,667 0,636 0,4935 0,824 0,636 0,404 0,882 0,682 0,339 0,737 0,700 0,339
Cuadro 3.4: Valores de SE , PPV y D con las funciones wavelet sym8, sym16 y coif5, en imagenes conniveles de sutileza del 2 al 5.
Capıtulo 3. Resultados 36
Figura 3.1: Curvas ROC. Comparacion de la relacion entre PPV y la sensibilidad en la deteccion demicrocalcificaciones agrupadas utilizando diferentes funciones wavelet.
Capıtulo 3. Resultados 37
Figura 3.2: Deteccion de candidatos a microcalcificaciones mamarias agrupadas utilizando para la etapade realce la funcion wavelet daubechies 16 a)Proyeccion CC derecha con microcalcificaciones agrupadasseleccionadas en color verde b) Proyeccion MLO derecha con microcalcificaciones agrupadas seleccionadasen color verde c) Proyeccion CC izquierda sin microcalcificaciones agrupadas d) Proyeccion MLO izquierdasin microcalcificaciones agrupadas. Los cırculos de color rojo representan la segmentacion manual, que secontrasta con la segementacion en color verde realizada por el algorıtmo.
Capıtulo 4
Discusion
La presencia de falsos positivos en la segmentacion de microcalcificaciones en las imagenes
mamograficas ocasiona que se reduzca la especificidad del algoritmo. Ciertos factores como
el realce de los ductos mamarios y regiones de tejido denso aumentan el ındice de falsos po-
sitivos. Tambien es causado por la presencia de artefactos y algunos errores en la captura de
la imagen. Por ejemplo, en el borde del tejido mamario la iluminacion no es uniforme y pre-
senta una alta variacion en los niveles de gris, que con los dos metodos de realce propuestos
producen la segmentacion de algunos elementos que no son de interes, de modo que aumenta
el numero de falsos positivos. Esto se puede ver en la Figura 4.1
Figura 4.1: (a) Imagen original del borde del tejido mamario. (b) Imagen a realzada con el metodo uno. (c)Segmentacion de la imagen. En la imagen c) se segmentan algunos elementos que no son microcalcificacionesaumentando el numero de falsos positivos.
Debido a la eliminacion subbanda en los metodos de realce basados en analisis multirresolu-
cion, algunos candidatos a microcalcificaciones desaparecen en la reconstruccion de la imagen,
38
Capıtulo 4. Discusion 39
por lo tanto no son segmentadas, causando una reduccion en la prueba de sensibilidad del
algoritmo. Tambien algunas funciones wavelet causan una reduccion en este indice, esto se
debe a la baja correlacion que hay entre la funcion y las formas de las microcalcificaciones.
Por ejemplo, en este trabajo, la funcion coiflet presenta el valor mas bajo de especificidad,
pues la funcion tiene poca similitud con las microcalcificaciones.
En algunas regiones del tejido mamario, la densidad es muy alta, presentando poca variacion
en los niveles de gris con respecto a las microcalcificaciones, ocasionando que estas no puedan
ser realzadas y disminuyen el acierto en las detecciones, lo cual provoca una reduccion en la
sensibilidad de la prueba. Esto se hace evidente, en los casos en los que el grado de sutileza
es mas bajo, como lo demuestran los resultados presentados en los cuadros 3.1 y 3.2. Entre
mas bajo sea el nivel de sutileza son menos evidentes las microcalcificaciones. Esto se puede
ver en la Figura 4.2.
Figura 4.2: (a) Imagen original que muestra el tejido denso con microcalcificaciones demarcadas en loscırculos rojos. (b) Realce de la imagen original. (c) Segmentacion de la imagen original.
En los cuadros 3.1 y 3.2 se muestran los valores de las pruebas de sensibilidad, especificidad y
valor predictivo positivo del algoritmo, en donde los resultados utilizando distintas funciones
wavelet muestran que la funcion coiflet tiene los valores mas bajos en las pruebas, presen-
tando una mayor cantidad de falsos positivos y falsos negativos en la segmentacion de las
imagenes.
Este trabajo, a diferencia de otros, no se requiere de un conocimiento previo de la locali-
zacion de las agrupaciones de micocalcificaciones, ni etapas de entrenamiento del algoritmo.
Capıtulo 4. Discusion 40
Ademas este detecta agrupaciones de microcalcificaciones en diferentes distribuciones: linea-
les, segmentarias y ramificadas.
Algunos metodos descritos lograron una taza de deteccion superior al 90 %, pero en imagenes
con regiones de interes previamente adecuadas, en donde las microcalcificaciones son identifi-
cadas con antelacion para entrenar los algoritmos que las segmentaran. El metodo propuesto
para este trabajo obtuvo una taza de deteccion cercana al 78 % para imagenes mamograficas
completas, cuyo grado de incertidumbre con respecto a la ubicacion de las agrupaciones de
microcalcificaciones es muy alto, por lo tanto es un factor determinante en las tasas de acierto.
Para futuros trabajos se recomienda que se evaluen algunas caracterısticas de las micro-
calcificaciones como: la densidad, la textura, los patrones de distribucion y otros.
Capıtulo 5
Conclusiones
Para el realce y segmentacion de microcalcificaciones se implementaron las familias de funcio-
nes wavelet daubechies, symlet y coiflet para la descomposicion y la reconstruccion wavelet
de las imagenes mamograficas. Con respecto a las diferentes funciones wavelet en el cuadro
3.1 se evidencia que la sensibilidad no varıa significativamente entre ellas. En el cuadro 3.2
se muestra que la especificidad y el valor predictivo positivo de la prueba tambien varıa muy
poco entre las diferentes funciones wavelet. Sin embargo, la funcion daubechies 16 se destaca
por que presenta las mejores tasas de deteccion de microcalcificaciones mamarias agrupadas.
En el metodo propuesto en este trabajo, los ındices de sensibilidad, especificidad y valor
predictivo positivo se reducen a medida que el grado de sutileza tambien disminuye. En el
grado mas bajo, el nivel dos, la funcion que presenta los ındices mas bajos de especificidad,
sensibilidad y valor predictivo positivo es coiflet. Por consiguiente, no se recomienda para el
realce y segmentacion de microcalcificaciones mamarias agrupadas.
Las funciones con mayores tasas de deteccion en los diferentes grados de sutileza son symlet
16 y daubechies 16, inclusive en los niveles mas bajos.
41
Bibliografıa
[1] Patricia Arancibia, T Taub, y Karen De Grazia. Microcalcificaciones mamarias: revision
de los descriptores y categorıas BI-RADS. Revista Chilena de Obstetricia y Ginecologıa.,
78(5):383–394, 2013.
[2] Nizar Ben Hamad y Khaled Taouil. Exploring wavelets subband decomposition toward
a computer aided detection of micro calcification in breast cancer. En Proceedings of
DFMA 2006 - 2nd International Conference on Distributed Frameworks for Multimedia
Applications, pags. 229–236. 2007.
[3] Akshay S. Bharadwaj y Mehmet Celenk. Detection of microcalcification with top-hat
transform and the Gibbs random fields. Proceedings of the Annual International Confe-
rence of the IEEE Engineering in Medicine and Biology Society, EMBS, pags. 6382–6385,
2015.
[4] Rosana Buffa, Susana Gamarra, y Marıa Viniegra. Manual operativo para el uso de
mamografıa en tamizaje. Inf. tec., 2015.
[5] Ministerio de Salud y Proteccion Social. Cancer de mama, una enfermedad en ascenso en
colombia. https://www.minsalud.gov.co/Paginas/-Cancer-de-mama,-una-enfermedad-
en-ascenso-en-Colombia.aspx, 2014.
[6] Sandra Dıaz, Marion Pineros, y Oswaldo Sanchez. Deteccion temprana del cancer de
mama : aspectos crıticos para un programa de tamizaje organizado en Colombia. Revista
colombiana de cancerlogıa, (528):93–105, 2005.
[7] Pedro Jose Garcıa. Mejora en la deteccion de microcalcificaciones en mamografıas digi-
talizadas mediante la aplicacion de arquitecturas neuronales. 2004.
[8] Eliza Hashemi. Microcalcification Detection in Mammography using Wavelet Transform
and Statistical Parameters. 2012.
42
Bibliografıa 43
[9] Pankaj Hedaoo y Ss Godbole. Wavelet Thresholding Approach for Image Denoising.
International Journal of Network Security & Its Applications (IJNSA), 3(4):16–21, 2011.
doi:10.5121/ijnsa.2011.3402.
[10] Karen Junemann. Patologıa mamaria e imagenes. Rev. Obstet. Ginecol.- Hospital San-
tiago Oriente, 4(3):189–194, 2009.
[11] Aya Khalaf y Inas Yassine. Novel features for microcalcification detection in digital
mammogram images based on wavelet and statistical analysis. En ICIP, pags. 1825–
1829. 2015.
[12] Mohamed Lagzouli y Youssfi Elkettani. A New Morphology Algorithm for Microcalcifi-
cations Detection in Fuzzy Mammograms Images. International Journal of Engineering
Research & Technology (IJERT), 3(1):729–733, 2014.
[13] N. Karssemeijer M. J. McLoughlin, P. J. Bones. Noise equalization for detection of mi-
crocalcification clusters in direct digital mammogram images. IEEE Trans. On Medical
Imaging, 23, 2004.
[14] Carlos Madrigal, Ronny Prada, y David Fernandez. Deteccion Automatica de Micro-
calcificaciones en una Mamografıa Digital, Usando Tecnicas de Inteligencia Artificial.
Tecno Logicas, pags. 743–756, 2013. ISSN 2256-5337.
[15] Stephane Mallat. A Theory for Multiresolution Signal Decomposition : The Wave-
let Representation. IEEE Transactions on pattern analysis and machine intelligence,
I(7):674–693, 1989.
[16] M. Martinez. Analisis de la teorıa de ondıculas orientada a las aplicaciones en ingenierıa.
2002.
[17] A Mencattini, G Rabottino, M Salmeri, y R Lojacono. A study on the automatic
detection of clustered microcalcifications in mammograms. International Symposium on
Applied Sciences in Biomedical and Communication Technologies, 2010.
[18] Luqman Mahmood Mina y Ashidi Mat. Microcalcification Diagnosis in Digital Mam-
mograms Based On Wavelet Analysis and Neural Networks. 2015 IEEE International
Conference on Control System, computing and Engineering, 1(November):27–29, 2015.
[19] H. Mirzaalian. Various applying of wavelet transform in digital mammograms detecting
masses and microcalcifications. Conference on Machine Vision Applications, 2007.
Bibliografıa 44
[20] Mario Mustra y Mislav Grgic. Detection of Areas Containing Microcalcifications in
Digital Mammograms. En lWSSIP 2014, 21st International Conference on Systems,
Signals and Image Processing, May, pags. 12–15. 2014.
[21] Mario Mustra, Mislav Grgic, y Kresimir Delac. Enhacement of microcalcifications in
digital mammograms. IWSSIP 2012, (April):11–13, 2012.
[22] Rosa Perez y Pablo Martınez. Bondad de los algoritmos de descomposicio wavelet de
mallat y ‘ a trous ’para la fusio de imagenes quickbird. Teledeteccion y Desarrollo
Regional X Congreso de Teledeteccion, pags. 295–300, 2003.
[23] Claudia Santamarıa. Construccion de una base de datos de imagenes de mamografıa
para la identificacion de microcalcificaciones. 2014.
[24] American Cancer Society. ¿que es el cancer de seno?
https://www.cancer.org/es/cancer/cancer-de-seno/acerca/que-es-el-cancer-de-
seno.html, 2016.
[25] Lixing Song, Qi Wang, y Jie Gao. Microcalcification detection using combination of
wavelet transform and morphology. pags. 694–697. 2006. ISBN 0780397371.
[26] T. Balakumaran, I. Vennila, y C.G. Shankar. Detection of Microcalcification in Mam-
mograms Using Wavelet Transform and Fuzzy Shell Clustering. International Journal
of Computer Science and Information Security, 7(1):121–125, 2010.
[27] Juana Maria Vallejo. El diagnostico estandarizado en mamografıa. Radiologa. Profesora
Departamento de Radiologıa e Imagenes Diagnosticas.
[28] Laura Aibar Villan. Clasificacion radiologica de las lesiones mamarias y manejo. Servicio
de Obstetricia y Ginecologıa Hospital Universitario Virgen de las Nieves, pags. 1–19,
2010.
[29] Letizia Vivona, Donato Cascio, Francesco Fauci, y Giuseppe Raso. Fuzzy technique for
microcalcifications clustering in digital mammograms. BMC medical imaging, 14(1):23,
2014.