Upload
others
View
9
Download
0
Embed Size (px)
Citation preview
DEPARTAMENTO DE ELÉCTRICA Y ELECTRÓNICA
CARRERA DE INGENIERÍA EN ELECTRÓNICA Y
TELECOMUNICACIONES
TRABAJO DE TITULACIÓN PREVIO A LA OBTENCIÓN DEL
TÍTULO DE INGENIERO EN ELECTRÓNICA Y
TELECOMUNICACIONES
TEMA: DIAGNÓSTICO DE GASTRITIS BASADO EN
IRIDOLOGÍA MEDIANTE EL PROCESAMIENTO DIGITAL DE
IMÁGENES
AUTORA:
SRTA. MAYA MEDINA, JENNIFER ELIZABETH
DIRECTOR: ING. CARRERA VINICIO PHD.
SANGOLQUÍ
2017
i
DEPARTAMENTO DE ELÉCTRICA Y ELECTRÓNICA
CARRERA DE INGENIERÍA EN ELECTRÓNICA,
Y TELECOMUNICACIONES
CERTIFICACIÓN
Certifico que el trabajo de titulación: “DIAGNÓSTICO DE GASTRITIS BASADO
EN IRIDOLOGÍA MEDIANTE EL PROCESAMIENTO DIGITAL DE
IMÁGENES”, ha sido revisado en su totalidad y analizado por el software anti-plagio,
el mismo cumple con los requisitos teóricos, científicos, técnicos, metodológicos y
legales establecidos por la Universidad de Fuerzas Armadas ESPE, por lo tanto, me
permito acreditarlo y autorizar a la señorita MAYA MEDINA JENNIFER
ELIZABETH para que lo sustente públicamente.
Sangolquí, 10 de agosto del 2017
ii
DEPARTAMENTO DE ELÉCTRICA Y ELECTRÓNICA
CARRERA DE INGENIERÍA EN ELECTRÓNICA,
Y TELECOMUNICACIONES
AUTORÍA DE RESPONSABILIDAD
Yo, MAYA MEDINA JENNIFER ELIZABETH, con cédula de identidad N°:
1722946645, declaro que este trabajo de titulación “DIAGNÓSTICO DE
GASTRITIS BASADO EN IRIDOLOGÍA MEDIANTE EL PROCESAMIENTO
DIGITAL DE IMÁGENES” ha sido desarrollado considerando los métodos de
investigación existentes, así como también se ha respetado los derechos intelectuales
de terceros considerándose en las citas bibliográficas.
Consecuentemente declaro que este trabajo es de mi autoría, en virtud de ello me
declaro responsables del contenido, veracidad y alcance de la investigación
mencionada.
Sangolquí, 10 de agosto del 2017
iii
DEPARTAMENTO DE ELÉCTRICA Y ELECTRÓNICA
CARRERA DE INGENIERÍA EN ELECTRÓNICA,
Y TELECOMUNICACIONES
AUTORIZACIÓN
Yo, MAYA MEDINA JENNIFER ELIZABETH, autorizo a la Universidad de las
Fuerzas Armadas ESPE publicar en la biblioteca virtual de la institución el presente
trabajo de titulación “DIAGNÓSTICO DE GASTRITIS BASADO EN
IRIDOLOGÍA MEDIANTE EL PROCESAMIENTO DIGITAL DE IMÁGENES”,
cuyo contenido, ideas y criterios son de nuestra autoría y responsabilidad.
Sangolquí, 10 de agosto del 2017
iv
DEDICATORIA
El presente trabajo de titulación se lo dedico a mi mamá Rosalía Paquita Medina por
ser el pilar fundamental en todo lo que soy, en toda mi educación, tanto académica,
como de la vida, por su incondicional apoyo perfectamente mantenido a través del
tiempo, por siempre ayudarme con una palabra de aliento, un abrazo sincero, una
oración encomendándome siempre a Dios y el inmenso amor que me ha entregado en
cada momento de mi vida.
A mi hermana María Fernanda Maya por sus constantes palabras de apoyo, creer
firmemente en mí, y darme el mejor regalo que una hermana puede entregar, que son
dos maravillosos sobrinos Julián y Valentina a quienes también dedico este trabajo de
titulación.
Ustedes siempre serán mi motivación de ir más allá y salir de lo convencional, dando
lo mejor de mí. Siempre intentando marcar una diferencia. Espero que ustedes estén
tan orgullosas de mí como yo lo estoy de ustedes. Siempre juntas.
Jennifer Maya Medina
v
AGRADECIMIENTO
Agradezco a Dios, por cuidarme, bendecirme, demostrarme que el camino muchas
veces no es como se quisiera, pero que a pesar de todo siempre se podrá sacar algo
positivo, por ayudarme a mantener la fe y poner en mi camino a las personas adecuadas
para alcanzar este objetivo.
A mis padres por sus sacrificios, trabajo y principalmente su paciencia. A mi madre
por su bondad, inculcarme valores, recordándome constantemente que para ser un
buen profesional es necesario ser una buena persona, por corregirme cuando cometo
algún error y felicitarme por cada logro alcanzado, su constante preocupación por mí
y por toda la dedicación que tuvo con mi hermana y conmigo. A mi padre por ser
ejemplo de lo que debo lograr superar en mi vida académica y por su apoyo en muchas
etapas de la vida.
A mi hermana por siempre estar pendiente de mí, regalarme ese abrazo de consuelo,
ese silencio que muchas veces es necesario para reflexionar, su confianza, experiencia
y principalmente por su comprensión en cada momento.
A mis amigos por formar parte de esta maravillosa etapa donde compartimos buenos
y malos momentos, pero siempre nos tuvimos el uno al otro para salir adelante.
Al Dr. Telmo de la Torre por creer en este trabajo de titulación y ayudarme durante el
desarrollo de la base de datos con su experiencia y conocimientos sobre iridología.
De manera especial quiero agradecer al Dr. Vinicio Carrera, por brindarme su
paciencia, conocimientos, tiempo y dedicación. Gracias por confiar en este tema poco
convencional y ayudarme a mejorarlo.
Jennifer Maya Medina
vi
ÍNDICE DE CONTENIDO
CERTIFICACIÓN .......................................................................................................... i
AUTORÍA DE RESPONSABILIDAD ........................................................................ ii
AUTORIZACIÓN........................................................................................................ iii
DEDICATORIA ............................................................................................................ iv
AGRADECIMIENTO ................................................................................................... v
ÍNDICE DE CONTENIDO .......................................................................................... vi
RESUMEN ...................................................................................................................xii
ABSTRACT................................................................................................................ xiii
CAPÍTULO I .................................................................................................................. 1
INTRODUCCIÓN ........................................................................................................... 1
1.1. Antecedentes ............................................................................................................. 1
1.2. Justificación e importancia ........................................................................................ 2
1.3. Alcance del proyecto ................................................................................................. 4
1.4. Objetivos ................................................................................................................... 5
1.4.1. Objetivo general ............................................................................................... 5
1.4.2. Objetivos específicos ........................................................................................ 5
CAPÍTULO II ................................................................................................................ 7
MARCO TEÓRICO......................................................................................................... 7
2.1. Introducción .............................................................................................................. 7
2.2. Enfermedades del sistema digestivo .......................................................................... 7
2.3. Anatomía del ojo ....................................................................................................... 9
2.4. Medicina alternativa ................................................................................................ 10
2.4.1. Iridología ........................................................................................................ 11
2.5. Imagen digital ......................................................................................................... 17
2.6. Procesamiento Digital de Imágenes ........................................................................ 18
2.6.1. Procesamiento digital basado en pixeles ......................................................... 18
2.6.2. Procesamiento basado en zonas de la imagen ................................................. 20
2.6.3. Metodologías para localización de áreas circulares ........................................ 21
2.7. Aprendizaje de máquina .......................................................................................... 25
2.7.1. Clasificadores ................................................................................................. 26
2.7.2. Árboles de decisión ........................................................................................ 28
2.7.3. Máquinas de soporte vectorial (SVM) ............................................................ 29
2.7.4. K-Vecinos más cercanos (K-Nearest Neighbors) ........................................... 32
vii 2.7.5. Redes Neuronales ........................................................................................... 33
2.8. Evaluación de clasificadores ................................................................................... 34
2.8.1. Validación cruzada ......................................................................................... 35
2.8.2. Matriz de confusión ........................................................................................ 36
2.8.3. Curvas ROC (Receiver Operating Characteristic) .......................................... 37
2.9. Lenguajes de programación .................................................................................... 38
2.9.1. OpenCV (Open Source Computer Vision) ..................................................... 38
2.9.2. Python ............................................................................................................ 39
CAPÍTULO III ............................................................................................................. 40
PROCEDIMIENTO ....................................................................................................... 40
3.1. Introducción ............................................................................................................ 40
3.2. Base de datos .......................................................................................................... 41
3.2.1. Iriso ................................................................................................................ 41
3.2.2. Imágenes adicionales ...................................................................................... 43
3.3. Descripción general del algoritmo........................................................................... 44
3.4. Preprocesamiento .................................................................................................... 45
3.4.1. Redimensión de imagen .................................................................................. 46
3.4.2. Localización del área de interés ...................................................................... 47
3.4.3. Segmentación del área de interés .................................................................... 50
3.4.4. Transformación de coordenadas ..................................................................... 53
3.5. Extracción de características ................................................................................... 55
3.5.1. Media de color ................................................................................................ 55
3.5.2. Desviación estándar ........................................................................................ 56
3.5.3. Intensidad de color según el nivel de afectación ............................................. 56
3.5.4. Densidad de anomalías ................................................................................... 57
3.5.5. Detección del anillo de absorción ................................................................... 57
3.5.6. Máxima intensidad de color ............................................................................ 57
3.5.7. Mínima intensidad de color ............................................................................ 57
3.6. Clasificador ............................................................................................................. 58
CAPÍTULO IV ............................................................................................................. 60
RESULTADOS ............................................................................................................. 60
4.1. Introducción ............................................................................................................ 60
4.2. Definición de 𝑳 ....................................................................................................... 60
4.3. Resultados con la base de datos de 100 imágenes ................................................... 61
viii 4.3.1. Árbol de decisión ............................................................................................ 61
4.3.2. Vecino más cercano KNN .............................................................................. 63
4.3.3. SVM ............................................................................................................... 63
4.3.4. Redes Neuronales ........................................................................................... 64
4.3.5. Comparativa del rendimiento de clasificadores .............................................. 65
4.3.6. Matriz de confusión ........................................................................................ 65
4.3.7. Curvas ROC ................................................................................................... 67
4.4. Resultados con 77 imágenes de Iriso ....................................................................... 67
4.4.1. Comparativa del rendimiento en los clasificadores ......................................... 67
4.4.2. Matriz de confusión ........................................................................................ 68
4.1 Curvas ROC .................................................................................................. 69
CAPÍTULO V .............................................................................................................. 71
CONCLUSIONES Y RECOMENDACIONES ............................................................. 71
5.1. Conclusiones ........................................................................................................... 71
5.2. Recomendaciones.................................................................................................... 72
5.3. Trabajos Futuros ..................................................................................................... 72
BIBLIOGRAFÍA ......................................................................................................... 73
ix
ÍNDICE DE TABLAS
Tabla 1 Inserción de la medicina alternativa dentro de los servicios de salud (2003). .. 11
Tabla 2 Incidencia de enfermedades gástricas en 2014 ................................................... 14
Tabla 3 Comparativa de metodologías con la base de datos UBIRIS v1........................ 25
Tabla 4 Ejemplo de matriz de confusión .......................................................................... 36
Tabla 5 Características del computador empleado para las pruebas del prototipo ...... 47
Tabla 6 Rango de intensidad según el nivel de afectación ............................................... 56
Tabla 7. Nombre de parámetros y número de atributos extraídos (implementados). .. 58
Tabla 8 Desempeño de los clasificadores según la distancia optima .............................. 60
Tabla 9 Rendimiento del clasificador árbol de decisión .................................................. 61
Tabla 10 Desempeño de SVM según el kernel empleado ................................................ 64
Tabla 11 Eficiencia de clasificadores ................................................................................ 65
Tabla 12 Matriz de confusión árbol de decisión. .............................................................. 65
Tabla 13 Matriz de confusión vecino más cercano ........................................................... 66
Tabla 14 Matriz de confusión SVM ................................................................................... 66
Tabla 15 Matriz de confusión redes neuronales ............................................................... 66
x
ÍNDICE DE FIGURAS
Figura 1 Anatomía del ojo .................................................................................................... 9
Figura 2 Mapa de Jensen ojo derecho ............................................................................... 12
Figura 3 Mapa de Jensen ojo izquierdo............................................................................. 13
Figura 4 Muertes por enfermedades gástricas .................................................................. 15
Figura 5 Signos iridologicos en el iris humano.................................................................. 16
Figura 6 Etapas progresivas del reflejo tisular ................................................................. 17
Figura 7 Representación matricial del modelo RGB ........................................................ 18
Figura 8 Histograma de las componentes RGB de la imagen segmentada ..................... 19
Figura 9 Mascara de una imagen ....................................................................................... 20
Figura 10 Transformada de Hough circular ..................................................................... 23
Figura 11 Técnicas de aprendizaje de máquina ................................................................ 26
Figura 12 Selección de algoritmo en el aprendizaje de máquina ..................................... 27
Figura 13 Estructura de árbol de decisión ........................................................................ 28
Figura 14 Ejemplo de los hiperplanos de sepación para el conjunto de datos ................ 30
Figura 15 Margen de separación óptimo que define el hiperplano se serpación ............ 31
Figura 16 Uso del kernel para la división de clases .......................................................... 31
Figura 17 Distribución de tres grupos de datos con KNN ................................................ 32
Figura 18 Ejemplo de red neuronal completamente conectada ....................................... 34
Figura 19 Descrpción de validación cruzada .................................................................... 35
Figura 20 Representación gráfica de las curvas ROC ...................................................... 38
Figura 21 Imágenes del Iris: (a) Imagen con luz infrarroja, (b) Imagen a color ............ 41
Figura 22 Tipos de iluminaciones disponibles en la base de datos Iriso .......................... 42
Figura 23 Imágenes adicionales con diferente resolución, iluminación y detalle ........... 43
Figura 24 Proceso para la detección y diagnóstico de enfermedades gástricas. ............. 45
Figura 25 Localización de un mapa de Jensen en un iris real.......................................... 45
Figura 26 Preprocesamiento de imagen ............................................................................ 46
Figura 27 Algoritmo de localización para el área de interes en la imagen ...................... 49
Figura 28 Reultado del proceso de localización de area de interes .................................. 50
Figura 29 Algoritmo para segmentación del area de interes ........................................... 51
Figura 30 Máscara resultante para la imagen 1 de la base de datos ............................... 52
Figura 31 Máscara final implementada para la segmentación del iris............................ 52
Figura 32 Imagen resultante de la segmentación .............................................................. 52
Figura 33 Ejemplo de normalización por el método de Daugman .................................. 53
Figura 34 Algoritmo para la transformación de coordenadas ......................................... 54
Figura 35 Imagen realizada la transformación de coordenadas ...................................... 55
xi Figura 36 Imagen resultante del proceso de cambio de coordenadas ............................. 55
Figura 37 Densidad de anomalías en base al color medio y desviación estándar ........... 56
Figura 38 Imagen de segmentación binarizada ................................................................ 57
Figura 39 Algoritmo para los cuatro clasificadores .......................................................... 58
Figura 40 Grafica de ajuste del árbol de decisión con el criterio de entropía ................ 61
Figura 41 Árbol de decisión con umbrrales por característica ........................................ 62
Figura 42 Ajuste KNN en función del número de vecinos que considera ....................... 63
Figura 43 Desempeño de SVM según el kernel empelado ................................................ 64
Figura 44 Curva ROC de SVM con un Kernel RBF ........................................................ 67
Figura 45 Curva ROC para el sistema con 77 imágenes .................................................. 69
xii
RESUMEN
El procesamiento digital de imágenes (PDI) ha adquirido un papel importante en el
desarrollo tecnológico actual, debido a la posibilidad de automatizar procesos cuando
se trabaja conjuntamente con el aprendizaje de máquina. Una aplicación importante
del PDI son los sistemas CAD (Computer Aided Diagnosis), los cuales se encargan de
facilitar el diagnóstico de patologías en función a una mejora en la imagen donde se
resalta cierta área de interés para el especialista. Los sistemas CAD se encuentran
generalmente aplicados a la medicina tradicional, aunque en estudios recientes han
sido aplicados a medicina alternativa como, por ejemplo, la iridología; la cual se
encarga de localizar posibles alteraciones en la salud en base a características
mostradas en el iris. Por la distribución del mapa del iris, se optó por detectar anomalías
gástricas, concretamente la gastritis, ya que gran parte de la población presenta esta
patología en algún momento de su vida. Basado en esto, el presente trabajo tiene como
objetivo diseñar e implementar un prototipo para generar un diagnóstico preventivo de
la gastritis de forma automática; utilizando el procesamiento digital de imágenes,
plantillas iridológicas y aprendizaje de máquina. El sistema implementado trabaja con
100 imágenes en una base de datos de donde se extraen 12 características de color por
imagen, las cuales ayudan al sistema a detectar la presencia de gastritis. El prototipo
debe realizar un diagnóstico preventivo automático por lo que debe aprender a
discernir entre la información obtenida; en otras palabras, debe clasificar los pacientes.
Por esta razón, se emplea métodos de aprendizaje supervisado como son: árbol de
decisión, vecinos más cercanos, máquinas de soporte y redes neuronales. Los
resultados de la evaluación del mejor clasificador son 94% y 92% los cuales
representan los valores de exactitud y capacidad predictiva del sistema
respectivamente.
PALABRAS CLAVES:
• IRIDOLOGÍA
• PROCESAMIENTO DIGITAL DE IMÁGENES
• APRENDIZAJE DE MÁQUINA SUPERVISADO
xiii
ABSTRACT
The digital image processing (DIP) has acquired an important role in the current
technological development, due to the possibility of automating processes when
working in conjunction with machine learning. An important application of the DIP is
CAD (Computer Aided Diagnosis) systems, which are responsible of facilitating the
diagnosis of pathologies in function of an improvement that consists in highlighting
an area of the image that the specialist has interest on. CAD systems are generally
applied to traditional medicine, but also in recent studies they have been applied to
alternative medicine, such as iridology; which is responsible for locating possible
alterations in health, based on characteristics shown on the iris. It was decided to detect
gastric anomalies, specifically gastritis because of the distribution of the iris map and
that large part of the population has this pathology at some point in their life. Based
on this, the present work aims to design and implement a prototype to generate an
preventive diagnosis of gastritis; using digital image processing, iridological templates
and machine learning. The implemented system works with 100 images in a database
from which 12 characteristic colors per image are extracted, which help the system to
detect the presence of gastritis. The prototype must perform an automatic preventive
diagnosis so it must learn to discern the information obtained; it sorts patients. For this
reason, we use supervised learning methods such as: decision tree, nearest neighbors,
support vector machines and neural networks. The results of the evaluation of the best
classifier are 94% and 92% which represent the values of accuracy and predictive
capacity of the system respectively.
KEYWORDS:
• IRIDOLOGY
• DIGITAL IMAGE PROCESSING
• SUPERVISED MACHINE LEARNING
1
CAPÍTULO I
INTRODUCCIÓN
1.1. Antecedentes
Actualmente el procesamiento digital de imágenes (PDI) es ampliamente utilizado
por múltiples disciplinas, ya que permite extraer características importantes de los
elementos que componen una imagen; como, por ejemplo: color, patrones
geométricos, presencia de objetos, etc. Adicionalmente, con el aprendizaje de máquina
se puede automatizar procesos iterativos aplicando el reconocimiento de objetos en
base a las características obtenidas con PDI (Monar, 2014).
Las dos áreas de conocimiento previamente mencionadas, forman gran parte de lo
que generalmente se conoce como visión artificial. La visión artificial se encuentra
presente en varias verticales de mercado como por ejemplo en el sector industrial,
transporte, gubernamental e incluso en la medicina.
La visión artificial consigue identificar objetos mediante la aplicación de técnicas
derivadas del procesamiento digital de imágenes (PDI), las cuales permiten mejorar la
calidad de las mismas (Leal, 2010), o incluso presentar particularidades que se
encuentran fuera del rango de visión del observador, para esta característica se puede
tener como ejemplo, los sistemas de diagnóstico asistido por computador (Computer
aided diagnosis), que se encargan de procesar una imagen por completo y dar realce a
cierta área de interés del médico tratante.
El sistema CAD (Computer Aided Diagnosis) es una tecnología interdisciplinaria
(Sotolongo, 2013), que requiere los principios de PDI para destacar y extraer
información de las imágenes médicas (puede ser una radiografía) (Gómez, 2010),
incluso en áreas de difícil visualización debido a su bajo contraste o resolución. Estos
sistemas requieren además del aprendizaje de máquina (machine learning) para
clasificar los patrones relevantes que ayuden al especialista en su diagnóstico
definitivo.
Los sistemas CAD comúnmente son desarrollados para implementarse
conjuntamente con la medicina tradicional, aunque en nuevas investigaciones se ha
2
visto su utilidad en la medicina alternativa (Jogi, 2014), particularmente en iridología,
ya que hace un análisis integral preventivo del paciente. Esta rama de la medicina
alternativa se encarga de detectar enfermedades en base al análisis de color del iris y
sus delicadas estructuras musculares que lo componen.
Iridología es una rama de la ciencia médica que se encarga del estudio de la
estructura del iris como un reflejo de la condición de los órganos y el sistema en el
cuerpo humano (Herlambang, 2015). El iris de un ojo está conectado a un número
inmenso de filamentos nerviosos minuciosos que, a través de los nervios ópticos, y de
la médula espinal reciben excitaciones de cada nervio en el cuerpo (Jogi, 2014).
La iridología permite una revisión y un diagnóstico integral del paciente (Salles,
2008), por tal la razón se puede emplear esta rama de la medicina alternativa como una
opción para el estudio preventivo de enfermedades comunes que puede desarrollar el
ser humano, como es el caso de la infección causada por Helicobacter pylori 1que por
lo general es causante de la gastritis.
El Helicobacter pylori es considerada como la infección bacteriana más difundida
y prevalente en el mundo (Martínez Echavarría, 2008). Se considera que gran parte de
la población se ve afectada por esta infección en algún momento de su subsistencia,
ocurriendo con mayor incidencia en países con niveles de desarrollo socio económicos
bajos, donde se supera el 90% (Valdivia Roldán, 2011).
Se debe resaltar que varias enfermedades relacionadas al sistema gástrico son
prevenibles, por lo cual es de gran importancia adoptar métodos de detección temprana
dentro de la medicina en general (tradicional y alternativa) para brindar a los pacientes
tratamientos acordes a sus necesidades, cuidando por la mejora de su calidad y
esperanza de vida.
1.2. Justificación e importancia
Al realizar un estudio en salud, se debe considerar la variabilidad biológica de los
pacientes, cada ser vivo es diferente e incluso en el mismo individuo se puede hallar
1 Es una bacteria que se aloja generalmente en el estómago y es responsable de la infección
bacteriana más frecuente en los seres humanos (Martínez Echavarría, 2008)
3
diferencias al evaluarlo en 2 etapas diferentes de su vida (Martín, 2004), aunque
gracias a la estadística se puede modelar matemáticamente un fenómeno a partir de
datos fundamentalmente impredecibles (Sosa, 2010).
Para definir un modelo de clasificación automática mediante computadoras se
emplea aprendizaje de máquina donde su resultado final se representa en términos de
probabilidad; a medida que aumenta el número de ensayos se obtiene una tendencia
de probabilidad (Martínez, 2003), describiendo el comportamiento del fenómeno (ley
de grandes números).
Por las múltiples aplicaciones que tiene el aprendizaje de máquina y el PDI, es
necesario seguir con esta línea de investigación y enfocar sus técnicas a procesos que
puedan ser optimizados como, por ejemplo; los diagnósticos preventivos de gastritis,
debido a la incidencia y consecuencias que tiene esta enfermedad en la población. Por
ejemplo, si la gastritis no es tratada a tiempo, se tiene mayor probabilidad de tener
cáncer de estómago a largo plazo (Atherton, 2006).
Es importante frenar las incidencias de enfermedades crónicas en el sistema
digestivo, ya que, por el estilo de vida actual, es cada vez más común detectar
enfermedades como cáncer en personas menores a 40 años. Lo anteriormente descrito
provoca un aumento en la tasa de mortalidad en países subdesarrollados, y además
demuestra la ineficacia de los sistemas de salud en dichos países.
Para agilizar los procesos de diagnóstico, se tienen dos opciones; la primera,
contratar más especialistas que atiendan adecuadamente a un mayor número de
pacientes, evitando errores humanos por saturación de trabajo. La segunda opción es
adquirir sistemas CAD, a un costo accesible, y con un proceso de diagnóstico ágil
(máximo 5 minutos).
Los sistemas CAD apoyan en la detección y localización de anomalías en los
pacientes, elaborando diagnósticos que serán corroborados por los especialistas
(Gletsos, 2003). Aunque estos sistemas ayudan al problema, no representan una
solución completa; ya que por cada tipo de examen que deba ser realizado (sangre,
biopsia de tejido, etc.) se debe adquirir un costoso sistema CAD, que no es fácilmente
4
costeado por países subdesarrollados. Entonces se muestra la necesidad de efectuar un
sistema CAD en base a exámenes integrales y de rápida toma de información.
Se debe contemplar a la medicina alternativa como una posible solución, porque
una de sus fortalezas es realizar una revisión integral al paciente, mediante
tratamientos naturales o procedimientos ancestrales como, por ejemplo, la acupuntura.
Por lo expuesto, se propone como solución a la “falta de detección temprana de
enfermedades en el sistema digestivo en personas con nivel socio económico bajo” el
diseñar un prototipo que realice el proceso de un sistema CAD que permita generar un
diagnóstico preventivo de las enfermedades gástricas de forma automática.
El prototipo propuesto debe realizar un diagnóstico preventivo automático, por lo
cual debe aprender a discernir la información entregada; en otras palabras, debe
clasificar los pacientes. Por esta razón se debe emplear métodos de aprendizaje
supervisado, conjuntamente con el procesamiento digital de imágenes y las plantillas
iridológicas.
1.3. Alcance del proyecto
El alcance del presente proyecto es realizar un prototipo de sistema CAD que logre
efectuar un diagnóstico preventivo automático de enfermedades gástricas mediante
aprendizaje de máquina; en base a las características extraídas con procesamiento
digital de imágenes y conocimientos de iridología.
Se van a evaluar varias imágenes del iris para extraer las características relevantes
que indiquen la presencia de anomalías en el sistema gástrico. Con la finalidad de
conocer los signos que se presentan en el iris de un paciente con alteraciones en su
sistema gástrico, se cuenta con tutorías referentes a iridología por parte del Dr. Telmo
de la Torre, médico cirujano especialista en medicina bio energética (Berdonces,
1999).
El prototipo de sistema CAD requiere un conjunto de imágenes (base de datos), de
donde se extrae las características que revelen una anomalía. Para generar el vector
respuesta de la base de datos de iridología se cuenta con ayuda del Dr. Telmo de la
Torre, que en base a su experiencia da un diagnóstico (vector respuesta) sobre los iris
5
obtenidos. El Dr. Telmo de la Torre se encarga de evaluar cada iris y brindar un
diagnostico en base a patrones que detectó en la imagen, posteriormente compartió su
conocimiento para establecer de manera general este tipo de anomalía lo cual permite
determinar las características de color que deben ser halladas por el sistema CAD.
El objetivo del presente trabajo de titulación es aplicar técnicas de procesamiento
digital de imágenes y aprendizaje de máquina supervisado a una nueva área de estudio,
que en este caso es la iridología, aplicada a una problemática puntual que es la
detección de gastritis.
Para el prototipo planteado en el presente documento, se requiere emplear técnicas
de aprendizaje supervisado, ya que existe un “maestro-supervisor” que comprueba el
resultado del proceso (el diagnóstico final lo da el médico especialista del tema). En
base a lo anterior, se propone únicamente un diagnóstico preventivo automático, mas
no un diagnóstico final, porque para definirlo siempre se requerirá un experto en la
materia que corrobore los resultados entregados por el sistema CAD.
1.4. Objetivos
1.4.1. Objetivo general
• Diseñar, implementar y evaluar un algoritmo de diagnóstico asistido por
computadora para la detección de enfermedades gástricas basado en
iridología.
1.4.2. Objetivos específicos
• Localizar, segmentar y cuantificar las anomalías concernientes a problemas
gástricos presentados en el iris.
• Implementar el algoritmo del sistema CAD que contempla el procesamiento
digital de imágenes, la clasificación y el diagnóstico.
• Comprender el funcionamiento de varias técnicas de aprendizaje de máquina
y evaluar sus desempeños para la detección de enfermedades gástricas.
6
• Evaluar los resultados obtenidos del sistema en términos de exactitud,
sensibilidad, especificidad y capacidad predictiva para detectar
enfermedades gástricas.
7
CAPÍTULO II
MARCO TEÓRICO
2.1. Introducción
La iridología es una rama de la medicina alternativa que ha ido ganando partidarios
alrededor del mundo, por esta razón es que se ha convertido en el objetivo de varios
casos de estudio e investigación, no solo por el procesamiento técnico que se requiere
para su segmentación sino también por los beneficios que representa como herramienta
preventiva de enfermedades.
Los resultados que se han obtenido en las investigaciones sobre iridología son
prometedores como, por ejemplo: en (Nor'aini, 2013) aplica SVM-RBF (Radial Basis
Function) para la localización de un área de interés en el iris; su exactitud fue del 80%.
En (Herlambang, 2015) se obtiene un 91,42% de exactitud aplicando redes neuronales
para la detección de anomalías en el hígado, he incluso en (Zhang, 2013) se ha
estudiado la relación que existe entre las deformaciones geométricas de la pupila y
alteraciones en la salud del paciente, donde se obtuvo un 89,8% de exactitud con un
algoritmo de clasificación SOM (Self Organizing Map).
A nuestro entender no se encontró un trabajo referente a las anomalías en el sistema
gástrico y que empleara los métodos de clasificación propuestos para determinar su
desempeño, pero si permitieron determinar una metodología tentativa para alcanzar
los objetivos formulados en el presente trabajo de titulación.
En el presente capítulo se explica de forma general los conceptos necesarios que
se emplean para la implementación del prototipo de sistema CAD y el estado del arte
para el presente proyecto de titulación.
2.2. Enfermedades del sistema digestivo
Las enfermedades en el sistema gástrico se caracterizan por grados variables de
inflamaciones o malformaciones en los órganos que lo conforman (Thews, 1983). Por
tanto, este tipo de enfermedades no se tratan de un proceso patológico homogéneo,
sino es un proceso heterogéneo de causa y mecanismo patológico multifactorial, con
8
un cuadro sintomático inespecífico e incluso en varios casos ausente, como es el caso,
de la gastritis provocada por la bacteria Helicobacter pylori (Abreu, 2007).
La infección por Helicobacter pylori generalmente presenta un cuadro
asintomático y prolongado; por lo que esta patología suele ser detectada en etapas
avanzadas de otras enfermedades más graves, mediante exámenes de sangre,
endoscopias o biopsias al tejido estomacal. Las enfermedades más comunes asociadas
a esta infección bacteriana son la úlcera péptica y la gastritis, donde sus síntomas
consisten básicamente en una inflamación de la mucosa gástrica (Thews, 1983).
Cuando se deja progresar la infección sin un tratamiento efectivo el tejido
estomacal se ve gravemente dañado, lo cual provoca que las células que lo componen
tengan un crecimiento anormal y formen carcinomas en el área afectada.
Un estudio realizado en el MIT (Massachusetts Institute of Technology) publicado
en la revista Cancer Prevention Research, indica una reducción drástica en los
carcinomas causados por la infección crónica que provoca la bacteria Helicobacter
pylori, sí al paciente lo tratan con estrógenos (pruebas realizadas a ratones machos)
(Sheh, 2011). Obviamente no se puede prescribir estrógenos a personas de género
masculino, por lo cual es necesario que se investiguen nuevos métodos para reducir o
detectar tempranamente la presencia de esta infección.
Como se mencionó en el estudio del MIT, uno de los factores de riesgo para el
cáncer de estómago es la presencia de la bacteria Helicobacter pylori que se encuentra
presente en la gastritis atrófica crónica, la cual puede generar problemas estomacales
graves. Recientes investigaciones indican que ciertos subtipos de esta bacteria pueden
convertir algunas sustancias de los alimentos en el químico que provoca un cambio en
el ADN de las células; generando un crecimiento anormal (mutación) y provocando
cáncer en los peores escenarios (Moreno, 2013).
El Helicobacter pylori está estrechamente relacionado con la gran mayoría de
enfermedades inflamatorias que tienen como origen el estómago; entre las
enfermedades existentes, se puede resaltar la gastritis, ulceras, lesiones gástricas, etc.
La gastritis se divide en: gastritis atrófica (genera carcinomas) y gastritis agua, donde
se tiene mayor probabilidad de presentar una ulcera (Abreu, 2007).
9
2.3. Anatomía del ojo
Los ojos se forman gracias a la fusión de varios tejidos embrionarios; por ejemplo,
la retina forma parte del sistema nervioso central ya que proviene del prosencéfalo,
mientras que la córnea y el cristalino proceden de la capa embrional (Persaud, 2008).
Los primeros signos de formación del ojo aparecen aproximadamente a la tercera
semana de gestación (Rodriguez, 2008).
Al terminar de formarse el embrión, los ojos se encuentran en unas cavidades
óseas llamadas órbitas, las cuales se encuentran en la parte frontal del cráneo. En la
Figura 1 se muestra la anatomía final del ojo.
Figura 1 Anatomía del ojo Fuente: (Latarjet, 2006)
A continuación, se describe las partes principales que conforman el ojo humano:
• La esclerótica está formada por seis músculos extra-oculares, formando
una capa blanca, dura, opaca y que no permite el paso de luz (Carlson,
1996).
• La córnea se encuentra en la parte frontal del ojo; a diferencia de la
esclerótica esta es transparente y permite el paso de luz (Carlson, 1996).
• El iris se encarga de regular la cantidad de luz que ingresa al lente,
mediante la miosis (pupila estrecha) y la midriasis (pupila dilatada)
(Latarjet, 2006). El iris está constituido por una parte coloreada y otra
oscura, en la parte coloreada se puede diferenciar una zona marcada por
los músculos radiados que corresponden a los vasos del iris (Latarjet,
2006). La parte oscura es cóncava y toma contacto con el lente.
10
En la medicina tradicional el examen del ojo brinda mucha información sobre el
sistema nervioso, debido a la conexión directa que tiene con el cerebro mediante
filamentos nerviosos (Lovesio, 2006).
Dentro de la valoración primaria en primeros auxilios se realiza una inspección de
los reflejos oculares (miosis y midriasis) para un diagnostico superficial del sistema
nervioso central (cerebro) (Salcedo, 2017). El sistema nervioso se encarga de
interactuar con el medio ambiente ya que está encargado del funcionamiento y
razonamiento del paciente (Cuenca, 2006).
2.4. Medicina alternativa
La medicina alternativa o bioenergética está basada en las necesidades de las
personas, por lo tanto, distintas personas pueden recibir distintos tratamientos incluso
si, de acuerdo con la medicina tradicional, sufren la misma enfermedad.
La medicina bioenergética suele utilizarse para mejorar la calidad de vida del
paciente al tratar dolencias provocadas por enfermedades crónicas o accidentes
ocasionados en las tareas recurrentes (Salud, 2002). Algunos datos auguran resultados
prometedores en tratamientos efectivos del dolor con los procedimientos en la
medicina alternativa.
Actualmente se tienen estudios que respaldan la teoría de que varias técnicas de la
medicina bioenergética alivian eficazmente el dolor y genera menos efectos
secundarios que otros tratamientos, como es el caso de la acupuntura (OMS, 2016);
por esta razón es que en la última década el interés por este tipo de tratamientos ha ido
en aumento (OMS, 2016).
La medicina alternativa se ha introducido en muchos países en el mundo, pasando a
formar parte de sus sistemas de salud, e incluso realizando investigaciones de las
bondades que se obtiene en ciertos tratamientos y dolencias. En la Tabla 1 se presenta
el porcentaje de inclusión de la medicina bioenergética dentro de los servicios de salud
en distintos países alrededor del mundo.
11
Tabla 1
Inserción de la medicina alternativa dentro de los servicios de salud (2003).
País % Inclusión en los
servicios de salud
Cantidad de personas
tratadas (Millón)
China
Chile
Colombia
India
Australia
Canadá
Estados Unidos
Francia
Alemania
40%
71%
40%
65%
48%
70%
42%
49%
49%
517
12
17
702
9
22
122
30
40
Fuente: (salud., 2002)
Como se puede ver en la Tabla 1, la medicina alternativa ha tomado varios
partidarios alrededor mundo, independientes a su cultura, etnia, o desarrollo socio-
económico, etc., esto se debe a la inconformidad que genera el sistema de salud
convencional debido a los tiempos de espera y a la mala práctica o errores en el
diagnóstico de enfermedades (salud., 2002).
2.4.1. Iridología
La iridología se encarga de estudiar el iris, la estructura más compleja en una
persona debido a sus delicadas y pequeñas estructuras (Jensen, 1980).
La estructura del ojo humano es muy compleja pues tiene innumerable cantidad de
terminaciones nerviosas (28.000 aproximadamente) que están conectadas a todos los
tejidos del cuerpo a través del cerebro y el sistema nervioso (Sulistiyo, 2014).
Los filamentos nerviosos, las fibras musculares y los diminutos vasos sanguíneos
en diferentes áreas del iris reproducen condiciones cambiantes en los órganos
correspondientes (teoría del reflejo). Es por eso que cada parte del iris tiene relación
con un órgano distinto, a la representación gráfica de esta relación se le llama mapa de
12
Jensen o mapa iridológico (Ver Figura 2). El mapa de Jensen el cual es uno de los más
aceptados y difundidos en las áreas referentes a la iridología (Othman, 2010), donde
básicamente se divide al iris de forma similar a un reloj (12 horas).
Figura 2 Mapa de Jensen ojo derecho Fuente: (Sulistiyo, 2014)
El mapa del iris izquierdo es el reflejo del iris derecho, si se quiere detectar
anomalías en el sector del tórax o el pulmón es necesario conocer el iris estudiado
(izquierdo o derecho) para no confundir sus zonas.
Por ejemplo, como se ve en la Figura 2 el iris derecho en la sección entre 9-10 se
puede estar determinando el estado del pulmón, pero en el iris izquierdo () en la misma
sección se encuentra la representación de la garganta, entonces se vuelve mandatorio
conocer el iris estudiado para esos casos particulares.
De las señales que muestra el iris se extrae la información clínica por medio de
varias marcas, signos, colores anormales o decoloraciones en el iris (signos
iridológicos).
13
Figura 3 Mapa de Jensen ojo izquierdo Fuente: (Sulistiyo, 2014)
El iris está conectado a todo el cuerpo gracias a su conexión con el sistema nervioso
central. La iridología por sí sola no puede diagnosticar una enfermedad, pero puede
reconocer problemáticas potenciales para una enfermedad.
La iridología es una rama de la medicina alternativa dedicada a entregar
información del estado de los órganos del cuerpo humano (Haigh, 1999). Esta
medicina debe ser empleada únicamente en la salud preventiva (Ceolin, 2009), en otras
palabras, solo se la emplea para obtener información del cuerpo en general, por esta
razón se requiere de la medicina tradicional para poder dar un tratamiento completo al
paciente. Los beneficios de la iridología son varios, pero podemos resaltar que es
segura, económica, rápida y no invasiva (Jogi, 2014).
Además del alto índice de incidencia que tiene la gastritis en la población mundial,
se tomó en consideración el mapa de Jensen, ya que el sector que representa el
estómago es un área concéntrica a la pupila, y por tal razón no es relevante saber si el
ojo estudiado es el izquierdo o derecho.
14
2.4.1.1. Iridología en el mundo
La iridología es una de las herramientas diagnosticas que ha ido tomando más
partidarios alrededor del mundo (Sparber A, 2001). Particularmente en Estados
Unidos, Alemania, Corea del Sur, Malasia y Kazajistán existe muchas escuelas e
institutos de iridología (Sehouli, 2003).
Debido a la inconformidad con los sistemas de salud convencionales, varios países
alrededor del mundo han llegado a integrar la medicina alternativa dentro de los
servicios de salud públicos y privados.
En la Tabla 2 se refleja el número muertes provocadas por enfermedades gástricas,
en países donde es aceptada la iridología como método de diagnóstico y en el Ecuador
donde la iridología no es muy aceptada hasta el momento. Los datos son obtenidos de
los informes de la OMS para el año 2014.
Tabla 2
Incidencia de enfermedades gástricas en 2014
País Incidencia Muerte por enfermedades
gástricas
Malasia 2563 1265
Corea 21338 7014
Ecuador 1381 1278
Kazajstán 2310 1757
Alemania 36567 15186
Estados Unidos 69045 32350
Fuente: (Sehouli, 2003)
Como se puede ver en la Tabla 2, países como Alemania o Estados Unidos existe
un gran número de incidencias de enfermedades gástricas, pero las muertes causadas
por las mismas representan 42% y 47% respectivamente, esto quiere decir que más
de la mitad de casos incidentes fueron controlados y tratados a tiempo evitando
consecuencias más graves, mientras que, en Ecuador, el 93% de las incidencias de
enfermedades gástricas terminaron en muertes de los pacientes.
15
En la Figura 4 se muestra el porcentaje de muertes causadas por enfermedades
gástricas, para este gráfico se toma al número de incidencias (presentan la patología)
como el número total de posibles muertes, mientras que el número de muertes por
enfermedades gástricas representa el número real de muertes; con estas dos cifras se
obtiene un proporcional.
Figura 4 Muertes por enfermedades gástricas Fuente: Elaboración propia
Como se puede ver, Ecuador presenta un 93% de muertes, en otras palabras, casi
todas las personas que tienen esta patología no tienen mayor esperanza de vida ya que
la mayoría fallece.
Esto se debe a las deficiencias dentro del sistema de salud que no adopta métodos
de detección temprana, donde la enfermedad aún puede ser tratada a menores costos;
no solo en relación al factor económico sino también al humano, ya que se tendría un
menor índice de mortalidad en pacientes que padecen enfermedades crónicas, como la
gastritis crónica y particularmente al cáncer del sistema gástrico.
2.4.1.2. Signos iridológicos
La iridología presenta ciertos signos en el ojo que indican una patología o estado
del organismo en particular, en la Figura 5 se encuentra una representación gráfica de
los signos iridológicos descritos a continuación:
• Criptas: Son pequeños agujeros que se presentan generalmente en forma de
rombo, afectan el tejido del iris hasta sus capas más profundas, por lo que se
Malasia Corea Ecuador Kasajstan AlemaniaEstadosUnidos
49% 33% 93% 76% 42% 47%
0%
20%
40%
60%
80%
100%
Mu
erte
s P
osi
ble
s vs
Mu
erte
s R
eale
s
MUERTES POR ENFERMEDADES GÁSTRICAS
16
observan de un color muy oscuro y representan la última fase de alguna
patología que esté afectando al órgano en cuestión.
• Rayos solares: Están relacionados con alteraciones en el sistema digestivo, ya
que nacen en la región del estómago y se abren camino hasta la periferia
(Berdonces, 1999).
• Manchas orgánicas: Son pigmentos que marcan el iris, por lo general son
señales de sobrecargas metabólica o lesiones orgánicas (Berdonces, 1999).
• Anillos Nerviosos: Son arcos que se sitúan en el iris, indican que el paciente
está bajo mucha presión o estrés (Berdonces, 1999).
• Anillo de absorción: Indica problemas en lo que refiere a la asimilación de
nutrientes importantes para el cuerpo humano (Berdonces, 1999), el sistema
encargado de la absorción de nutrientes es el sistema digestivo, concretamente
el estómago. El anillo de absorción puede indicar alguna problemática en el
estómago.
Figura 5 Signos iridologicos en el iris humano. Fuente: Elaboración propia
Las enfermedades tienen varios índices de afectación, que pueden ir desde el grado
agudo hasta el degenerativo. La iridología muestras las mismas etapas progresivas de
una enfermedad, y esto depende del grado de profundidad que muestren las
membranas que componen el iris. Se pueden determinar 4 grados patológicos, los
cuales se pueden ver en la Figura 6
17
Figura 6 Etapas progresivas del reflejo tisular Fuente: (Luna, 2016)
Como se puede ver en la Figura 6 lado derecho los grados patológicos son: (1)
aguda, (2) subaguda, (3) crónica y (4) degenerativa. Aunque el iris presente un grado
degenerativo no implica una muerte próxima ya que simplemente el iris está reflejando
un órgano muy afectado por toxinas, lesiones, falta de nutrientes o daños generados
por enfermedades crónicas.
Como se puede ver en la Figura 6 del lado izquierdo existe una variación de color
desde la etapa 1 (aguda) hasta 4 (degenerativa), las zonas más oscuras representan un
daño mayor, pero no mortal, por esta razón, es importante analizar las tonalidades de
color para detectar anomalías.
2.5. Imagen digital
Una imagen digital es una representación visual bidimensional, que está definida
por el valor que toman los pixeles que la componen. Las imágenes pueden ser a blanco
y negro, escala de grises o color. En blanco y negro el rango de valores de los pixeles
que la componen únicamente presenta los valores de 1 (blanco) y 0 (negro).
En escala de grises se define los bits en los que se desea representar los pixeles, el
valor generalmente utilizado es de 8 bits por pixel, lo cual implica 256 tonalidades de
gris; donde 0 representa la ausencia de color (negro) y 255 la claridad máxima
(blanco).
Una imagen a color está definida por la combinación de los tres colores primarios
que son: rojo, verde y azul; en la nomenclatura se lo reconoce como componentes RGB
(red, green, blue). Con estos colores es posible representar cualquier color que se
requiera. Una imagen a color tiene los tres canales de color, por tal razón generalmente
18
su dimensión matricial viene representada de la siguiente manera (𝑚, 𝑛, 3); donde 𝑚
y 𝑛 expresan la dimensión bidimensional de la imagen y 3 representa las componentes
RGB que se encuentran en la imagen.
Figura 7 Representación matricial del modelo RGB Fuente: (Acero, 2015)
2.6. Procesamiento Digital de Imágenes
El procesamiento digital de imágenes está orientado a obtener una mejora en las
imágenes mediante herramientas tecnológicas, donde se dispone los recursos
necesarios en hardware y software para el tratamiento de grandes cantidades de
información en forma matricial (Esqueada, 2005). El procesamiento de imágenes está
asociado a la visión artificial ya que se puede analizar, segmentar, almacenar y detectar
objetos o parámetros dentro de una imagen. (Esqueada, 2005).
2.6.1. Procesamiento digital basado en pixeles
Estas metodologías radican en algoritmos que varían el valor de un pixel basados
en el valor anterior de cierto pixel o en la vecindad que lo rodea. Se realiza una
búsqueda pixel por pixel dentro de la imagen a procesar para generar LUT/Look-Up
Table (Santamaría, 2013).
Si se requiere además del valor anterior del pixel y la localización del mismo,
puede ser necesario utilizar fórmulas o una combinación de las mismas con tablas de
búsqueda.
Estas técnicas mencionadas no modifican las relaciones espaciales dentro de la
imagen y en consecuencia no pueden modificar el grado de detalle contenido en las
𝑰𝑹(𝒎, 𝒏, 𝟏)
=
𝑰𝑮(𝒎, 𝒏, 𝟐)
=
𝑰𝑩(𝒎, 𝒏, 𝟑)
=
𝑰𝑹𝑮𝑩(𝒎, 𝒏, 𝒑)
=
19
mismas, debido a su simplicidad, su implementación se puede realizar en circuito
electrónico para una ejecución en tiempo real (Santamaría, 2013).
2.6.1.1. Histograma
Corresponde a un gráfico que permite obtener una “primera vista” de la
distribución de intensidad en los píxeles de una imagen, de una porción de la misma o
de las componentes de color que la conforman (Shapiro, 2001 ).
Se puede denotar como ℎ(𝑖), el número de pixeles que se encuentra dentro de la
región de interés y tiene el valor de intensidad 𝑖, donde (𝑖 = 0,1,2 … . 255) es el
número posible de niveles de color por componente RGB para la imagen. El
histograma proporciona importante información acerca de características intrínsecas
de la imagen como son: intensidad, contraste, así como de su rango dinámico (Ross,
2011). En la Figura 8 se muestra el dibujo de un histograma de una imagen del iris,
obtenida de una base de datos Iriso.
Figura 8 Histograma de las componentes RGB de la imagen segmentada Fuente: Elaboración propia
Como se mencionó anteriormente las zonas que presentan algún tipo de afección
sea: aguda, crónica o degenerativa tienden a ser más oscuras, por lo tanto, para la
detección de anomalías (zona cercana a cero) serán importantes las componentes azul
y verde (la imagen empleada fue extraída la pupila, esclerótica y parpados).
Blue
Green Red
20
2.6.1.2. Mejora en imágenes por modificación de contraste
El contraste de una imagen, puede ser corregido mediante un cambio en la
intensidad de cada pixel, en otras palabras, la intensidad correspondiente a cada pixel
de entrada (imagen original) y que denotaremos por x, se puede modificar atenuando
o realzando su intensidad (rango dinámico) en base a una transformación específica
(Mancebo Pérez, 2013).
2.6.2. Procesamiento basado en zonas de la imagen
Las técnicas de procesamiento basadas en una zona específica tienen muchas
aplicaciones en la extracción de características, estos procedimientos permiten
diferenciar a los objetos que conforman una imagen (Passariello, 1995).
Uno de los procesos más utilizados para la subdivisión de regiones en una imagen,
es la localización de contornos o bordes; esta técnica permite delimitar los objetos
dentro de la imagen para poder extraerlos posteriormente empleando una máscara.
Una máscara es una plantilla de igual dimensión que la imagen original, pero el
área que corresponde al objeto de interés es rellenada con unos y el resto con cero. Al
multiplicar la imagen original por la plantilla se consigue extraer únicamente el área
de interés (Ver Figura 9).
Figura 9 Mascara de una imagen Fuente: (Osorio Roig, 2017).
Otro proceso utilizado es la atenuación de ruido aleatorio, esto se consigue
aplicando un filtro para suavizar la imagen y en base al comportamiento (tendencia)
extraído de la vecindad que rodea los pixeles del objeto (Calot, 2008).
2.6.2.1. Segmentación de imágenes
La segmentación es un proceso que localiza áreas relevantes en una imagen y
cuyos píxeles presentan características similares, debido a que pertenecen al mismo
21
elemento físico. La segmentación de imágenes es uno de los procesos más importantes
de un sistema automatizado (Palomino, 2009), se aplica este procedimiento con la
finalidad de aislar el objeto de interés y hallar únicamente las características que
describen al objeto como, por ejemplo; su dimensión, forma geométrica, color medio,
etc.
Para el presente trabajo se emplean las técnicas basadas en fronteras (bordes),
debido al alcance del proyecto, ya que solo se busca detectar tempranamente trastornos
en el sistema gástrico (primer anillo posterior a la pupila en el mapa de Jensen), por lo
que el resto de zonas del iris no presentan relevancia para este estudio y deben ser
descartadas en la segmentación.
Segmentar adecuadamente una sección de la imagen resulta a menudo difícil
debido a múltiples factores como, por ejemplo: el ruido, la iluminación, contraste de
color en la imagen, y para este caso en particular la forma de la pupila y el movimiento
del ojo al tomar la imagen. Por estas razones el primer paso a seguir debe ser el
determinar los bordes del objeto, luego localizar el interior del mismo y clasificar los
pixeles en el borde como parte o no del objeto.
2.6.3. Metodologías para localización de áreas circulares
Como se ha mencionado anteriormente, el proceso de segmentación es una de las
tareas más complejas e importantes dentro del campo de la visión artificial, por lo que
la localización de los círculos concéntricos que representan la pupila y el iris suele
tornarse compleja.
Debido a que no todos los iris tienen una forma regular o sus límites no son
fácilmente localizables. A continuación, se menciona varios métodos que se suelen
emplear para el proceso de segmentación del iris.
2.6.3.1. Metodología de J. Daugman y derivadas
La metodología de J. Daugman fue la primera técnica de segmentación de iris
funcional, la cual fue propuesta e implementada en 1992 (Daugman, 1993). Esta
técnica tiene la premisa de que tanto la pupila como el iris deben tener una forma
circular, y una particularidad de este método es que puede identificar las regiones de
22
los párpados superiores e inferiores (Washington Patente nº 5,291,560, 1994), realiza
su segmentación mediante un modelado de contornos.
La ecuación que describe este método es la siguiente:
|(√2𝜋 ∙ 𝜎)𝑒−|(𝑟−𝑟𝑜)2/2𝜎2| ∗𝛿
𝛿𝑟∙ ∮
𝐼(𝑥, 𝑦)
2𝜋𝑟𝑑𝑠
𝑟,𝑥𝑐,𝑦𝑐
| ( 1)
Donde, 𝑟𝑜 representa el centro de la función radial gaussiana, 𝜎 es la desviación
estándar que permite el ajuste a las irregularidades que puede existir en los bordes de
la pupila o iris, ∗ indica convolución, 𝐼(𝑥, 𝑦) considera la intensidad lumínica de la
imagen, 𝑟 es el radio de las circunferencias localizadas y el término 2𝜋𝑟 normaliza la
integral.
El método de Daugman se encarga de evaluar siguiendo un camino circular con
radio 𝑟, y centro (𝑥𝑐 , 𝑦𝑐) los cambios máximos en el valor de los pixeles para
determinar el área a segmentar. La metodología de Daugman aplica una binarización
a la imagen, ya que utiliza un umbral para mejorar el contraste entre las áreas de
interés.
2.6.3.2. Metodología de R. Wildes y derivados
Es una metodología de Wildes propuesta en 1997 (Wildes, 1997), se basa en la
búsqueda de contornos, mediante los siguientes pasos:
• Obtención de imagen de bordes binaria (sólo niveles blancos/negro)
mediante cálculo del módulo del gradiente.
• Detección de contornos mediante la transformada Hough.
El módulo del gradiente viene dado por la siguiente ecuación:
|∇𝐺(𝑥, 𝑦) ∗ 𝐼(𝑥, 𝑦)| (2)
Siendo el gradiente igual a:
∇= (𝜕
𝜕𝑥,
𝜕
𝜕𝑦) (3)
23
Y la función 𝐺(𝑥, 𝑦) que representa una función gaussiana bidimensional con centro
en (𝑥0, 𝑦0) y desviación estándar 𝜎´ para mejorar la discriminación de bordes, igual a:
𝐺(𝑥, 𝑦) =1
2𝜋 ∙ 𝜎´2 ∙ 𝑒
−(𝑥−𝑥0)2+(𝑦−𝑦0)2
2𝜎2 (4)
2.6.3.3. Transformada de Hough
La transformada de Hough fue propuesta en 1962 (Washington, DC Patente nº
3,069,654, 1962), y es una herramienta que permite el reconocimiento de patrones
geométricos que puedan ser representados como rectas, circunferencias o elipses
dentro de una imagen (Galipienso, 2003).
Para el presente trabajo se requiere principalmente un reconocimiento de patrones
circulares, la ecuación que define una circunferencia se muestra a continuación:
(𝑥´ − 𝑥´0)2 + (𝑦´ − 𝑦´0)2 = 𝑟2 (5)
Donde, (𝑥´0, 𝑦´0) representa las coordenadas del centro de la circunferencia y 𝑟 el
radio de la misma. Al evaluar los pixeles de contorno se define todas las posibles
circunferencias que pasan por el pixel (familia de circunferencias).
Se discrimina entre la familia de circunferencias cuando una de ellas pasa por gran
cantidad de puntos de contorno, en la Figura 10 se muestra gráficamente el proceso de
la transformada de Hough.
Figura 10 Transformada de Hough circular Fuente: (Parchkoohi, 2015)
24
Los puntos rojos en la Figura 10 definen los pixeles de contorno, las
circunferencias con líneas entrecortadas representan a la familia de circunferencias que
puede tener cada pixel de contorno, la circunferencia con línea continua representa la
circunferencia que pasa por mayor número de puntos de contorno y se procede a definir
el centro que es el punto de color verde.
La transformada requiere que un gran número de incidencias caigan en la celda
correcta, en otras palabras, la eficiencia de la transformada de Hough depende de los
parámetros de entrada (detección de bordes), y además incluir un umbral para la
discriminación de patrones (Ballard, 1981).
La Transformada de Hough requiere implementar un detector de bordes para
definir si los pixeles de contorno preliminares forman parte de la figura geométrica
buscada o no.
La detección de bordes se realiza mediante el detector de Canny, el cual fue
propuesto en 1986 y se basa en tres criterios principales (Rebaza, 2007):
• Intenta obtener bordes muy puntuales, de aproximadamente un pixel de
ancho.
• Aplica una función de histéresis basada en umbrales con la finalidad de
evitar falsos positivos en la detección de bordes.
• Cerrar los contornos que pudieron quedar abiertos por problemas de ruido
en la imagen (pestañas o parpados).
2.6.3.4. Comparación entre metodologías
La Tabla 3 muestra el rendimiento de cada metodología, donde se toma en cuenta
la correcta segmentación de imágenes con usuarios no-cooperativos (Proença, 2006),
los usuarios cooperativos miran fijamente el lente (resitúan adecuadamente el iris) se
emplea la base de datos UBIRIS v1.
25
Tabla 3
Comparativa de metodologías con la base de datos UBIRIS v1
Método % de Acierto
Daugman 95,22±0,015
Daugman, binarización 96,79±0,014
Camus y Wildes 96,78±0,013
Wildes 98,68±0,008
Fuente: (Proença, 2006)
Como se puede ver en la Tabla 3 el método que da mejor resultado es el de Wildes,
teniendo un 98,68% de acierto con un 0,008 % de error. En base a esto, el presente
trabajo de titulación emplea el método de Wildes para la localización de la pupila en
el iris.
2.7. Aprendizaje de máquina
El Aprendizaje de Máquina (Machine Learning) es una tecnología
interdisciplinaria porque maneja matemáticas, estadísticas, ciencias de la computación
e inteligencia artificial (Tuya, 2007); los cuales trabajando en conjunto buscan
generalizar comportamientos o procesos en determinados estudios (Garcia, 2011).
Los algoritmos de aprendizaje de máquina encuentran patrones en los datos que
permiten describir su estado actual y próximos estados ayudando a tomar mejores
decisiones y predicciones (Alpaydin, 2014).
El aprendizaje de máquina se utiliza todos los días para tomar decisiones críticas
en el diagnóstico médico, el mercado de valores, la previsión de la carga de energía,
etc (Mathworks, 2017). Los sitios web hacen sus recomendaciones de canciones,
películas o anuncios en base a los patrones de comportamiento detectados en el
consumidor (Bell, 2007).
El aprendizaje de máquina utiliza dos tipos de técnicas: el aprendizaje supervisado,
entrena un modelo en base a los datos de entrada y salida conocidos para que pueda
predecir los resultados futuros (es similar a la metodología empleada en el área
académica) (Chapelle, 2009); y el aprendizaje no supervisado, encuentra patrones
26
ocultos o estructuras intrínsecas en los datos de entrada (es similar a como una persona
aprende a hablar) (Montesdeoca, 2016) por lo cual es capaz de definir tendencias o
comportamientos para dar un vector respuesta.
En la Figura 11 se encuentra los casos de uso más frecuentes para cada técnica del
machine learning.
Figura 11 Técnicas de aprendizaje de máquina Fuente: (Mathworks, 2017)
Para el presente trabajo se emplea una base de datos de imágenes del iris y el
criterio de un doctor experto en el tema para aportar con un diagnóstico (datos de
salida); entonces se debe realizar un proceso de clasificación entre pacientes sanos y
enfermos, por esta razón se debe implementar técnicas de aprendizaje supervisado.
2.7.1. Clasificadores
Un algoritmo de aprendizaje supervisado toma un conjunto conocido de datos de
entrada y respuestas conocidas a los datos (salida) para entrenar un modelo y generar
predicciones razonables para la respuesta a nuevos datos (Tuya, 2007).
Las técnicas de clasificación predicen respuestas discretas, por ejemplo, si un
correo electrónico es genuino o spam, o si un tumor es canceroso o benigno. Las
aplicaciones típicas incluyen imágenes médicas, reconocimiento de voz y tendencias
en la bolsa de valores o estado crediticio de una persona (Mathworks, 2017).
Aprendizaje de máquina
Supervisado
Clasificación
Regresión
No supervisado
Agrupación
27
Los pasos en el aprendizaje supervisado son: preparar los datos de entrada, elegir
un algoritmo adecuado para el tipo de datos a estudiar, ajustar el modelo (elegir las
mejores características descriptivas), elegir un método de entrenamiento
(generalmente k-fold), realizar ajuste en las características del clasificador hasta estar
satisfecho con los resultados obtenidos (Caruana, 2006).
Hay docenas de algoritmos y cada uno adopta un enfoque diferente para aprender
(Matworks, 2016). Encontrar el algoritmo correcto es en parte sólo prueba y error, sin
embargo, la selección de algoritmos también depende del tamaño y tipo de datos con
los que esté trabajando y de cómo se utilizarán esos conocimientos (Matworks, 2016).
En la Figura 12 se muestra un cuadro resumen para la selección de un algoritmo según
la técnica de aprendizaje de máquina que se esté empleando.
Figura 12 Selección de algoritmo en el aprendizaje de máquina Fuente: (Matworks, 2016)
El aprendizaje supervisado se usa para resolver problemas de clasificación, y
dentro de este grupo se puede resaltar a los siguientes métodos como los más
relevantes: árboles de decisión, vecinos más cercanos, máquinas de soporte vectorial
y redes neuronales (Blanes, 2012).
Aprendizaje de Máquina
Supervisado
Clasificación
Máquinas de soporte vectorial (SVM)
Árbol de decisión
K- Vecninos más cercanos
Redes Neuronales
Regresión
Regresión Lineal
Regresión de vectores soporte (SVR)
Redes Neuronales
28
2.7.2. Árboles de decisión
Los árboles de decisión, predicen las respuestas en función a los atributos de
entrada y el vector respuesta. Un árbol de decisión es un clasificador que realiza una
discriminación consecutiva, que va desde lo general a lo particular (respuesta)
(Maimon, 2005). En la Figura 13 se puede ver la representación gráfica del árbol de
decisión donde, cada hoja representa un valor de la variable de destino.
Figura 13 Estructura de árbol de decisión Fuente: Elaboración propia
En la Figura 13 se muestra un árbol de decisión y sus partes, como se puede ver
discrimina las características y da como resultado una respuesta nominal, que para este
caso en particular es binaria. Para el presente trabajo se emplea resultados binarios que
expresan la presencia o no de la enfermedad.
Un árbol de decisión permite predecir las respuestas a los datos siguiendo las
decisiones en el árbol desde la raíz (inicio) hasta una hoja (nodo). Un árbol consiste en
umbrales de ramificación donde el valor de un predictor se compara con un valor
(peso) entrenado. El número de ramas y los valores de pesos se determinan en el
proceso de entrenamiento.
Entre los aspectos positivos, se tiene que los árboles de decisión son fáciles de
interpretar, son rápidos para el ajuste y la predicción, además presenta un bajo uso de
memoria, pero pueden tener una baja precisión en predicción debido al sobre-ajuste
(Quinlan, 1986).
29
El sobre-entrenamiento o sobre ajuste es cuando se añade varios niveles al árbol,
clasifica muy bien los datos de entrenamiento, pero luego no sabe generalizar al
conjunto de prueba. Este fenómeno se da debido a que se adapta a las regularidades
del conjunto particular de entrenamiento (Deng, 2011) y ya no puede ajustarse a un
nuevo conjunto de prueba.
Una forma para solucionar el sobre-entrenamiento es realizar una poda de árbol, esto
consiste en eliminar un sub-árbol anidado en ese nodo transformándolo en una hoja y
asignándole la clasificación más común de los ejemplos de entrenamiento
considerados en ese nodo. Por lo general un árbol poco profundo puede ser más
robusto y más fácil de interpretar.
2.7.3. Máquinas de soporte vectorial (SVM)
Los SVM fueron desarrollados por Vapnik en los años 90 (Carmona, 2014),
originalmente los SVM fueron empleados en la resolución de problemas binarios,
aunque actualmente son usados para resolver diversos tipos de problemas como: multi-
clasificación, regresión, etc.
Dentro de los clasificadores, los SVM clasifican los datos encontrando el límite
de decisión lineal (hiperplano) que separa todos los puntos de datos de una clase de los
de la otra clase.
Dado un conjunto de datos 𝐷 = {(𝑋0, 𝑌0), … , (𝑋𝑛−1, 𝑌𝑛−1)} donde 𝑛 representa el
número total de datos, 𝑋𝑖 ∈ ℝ𝑑 que son las características extraídas del modelo e 𝑌𝑖 ∈
{1, −1} que indica el vector salida (respuesta); solamente con esta consideración se
consigue delimitar varios hiperplanos como funciones lineales capaces de separar el
conjunto de datos sin error (Carmona, 2014). En la Figura 14 se muestra gráficamente
los posibles hiperplanos que pueden separar los datos
30
Figura 14 Ejemplo de los hiperplanos de sepación para el conjunto de datos Fuente: (Carmona, 2014)
La función lineal que puede describir lo representado en Figura 14 es:
𝐷(𝑥) = (𝑤0𝑋0 + ⋯ + 𝑤𝑛−1𝑋𝑛−1) + 𝑐 (6)
Donde, 𝑤 y c son factores reales, que deben cumplir las siguientes condiciones
para definir correctamente la separación entre las dos clases.
< 𝑤, 𝑋𝑖 > +𝑐 ≥ 0 si 𝑌𝑖 = +1
< 𝑤, 𝑋𝑖 > +𝑐 ≤ 0 si 𝑌𝑖 = −1
(7)
Al verificar que los hiperplanos cumplen con las condiciones descritas en la
ecuación 6, se procede a seleccionar uno especifico de la infinidad de planos separables
con el margen.
Los SVM buscan separadores lineales que equidisten de los datos más cercanos
de cada clase, para seleccionar el hiperplano adecuado se opta por el que tenga mayor
margen (Hongzong, 2007); el margen está relacionado con la capacidad de
generalización del sistema. En la Figura 15 se muestra gráficamente el hiperplano
óptimo de separación entre clases.
Clase 1
Clase 2
Posibles
Hiperplanos
31
Figura 15 Margen de separación óptimo que define el hiperplano se serpación Fuente: (Carmona, 2014)
En la Figura 15 se puede ver una separación entre clases sin errores, ya que los datos
que definen el margen (vectores soporte) se encuentran a una distancia adecuada
permitiendo definir un hiperplano que divida perfectamente ambas clases.
El mejor hiperplano para un SVM es el que tiene el mayor margen entre las dos
clases, cuando los datos son linealmente separables. Los SVM usan a veces una
transformación del kernel para transformar datos no lineales separables en
dimensiones más altas (𝑅2 → 𝑅3) donde se puede encontrar un límite de decisión
lineal. En la Figura 16 se muestra el uso que tiene el kernel para diferenciar entre las
clases de datos.
Figura 16 Uso del kernel para la división de clases Fuente: (Marín, 2006)
Clase 1
Clase 2
Kernel
32
La formulación matemática de los SVM varía dependiendo de la naturaleza de los
datos; es decir, existe una formulación para los casos lineales y, no lineales (Carreras,
2004). Pese a los excelentes resultados obtenidos, las SVM tienen algunas limitaciones
(Ortiz, 1999):
▪ La elección de un kernel adecuado es todavía un área abierta de investigación.
▪ La complejidad temporal y espacial, tanto en el entrenamiento como en la
evaluación, son también una limitación.
2.7.4. K-Vecinos más cercanos (K-Nearest Neighbors)
Es un método de aglomeración jerárquica, cuya particularidad está en determinar
la distancia mínima (más cercano) entre los grupos de datos (vecinos). Este método
tiene propiedades contractivas sobre el espacio, ya que a medida que el grupo crece,
los datos tienden a moverse de forma más adyacente (Herrera, 2000).
Suele tener una buena precisión predictiva en las dimensiones bajas. Tienen una
alta velocidad de ajuste, y la velocidad de predicción es rápida para las dimensiones
bajas, pero tienen un alto uso de memoria y no son fáciles de interpretar (Mora-Florez,
2008). Entre sus limitaciones se destaca que es muy sensible a los atributos
irrelevantes, al ruido y tiene problemas con la dimensión. En la Figura 17 se muestra
un ejemplo de un espacio con tres posibles clases (puntos, cruces y asteriscos).
Figura 17 Distribución de tres grupos de datos con KNN Fuente: (Pelegrín, 2004)
Clase 1
Clase 2
Clase 3
33
Como se puede ver en la Figura 17, el circulo azul representa 𝐾 = 1 vecinos
donde, al tener una única referencia se clasificaría el dato como parte de la clase
“puntos”, en el círculo verde con K=3 se puede ver que el dato sería clasificado al
grupo de las cruces y con K=20 se tiene las 3 posibles clases (puntos, cruces y
asteriscos), pero las cruces representan mayoría y su distancia es más corta al dato a
clasificar, por lo tanto, el dato “?” va a ser clasificado dentro del grupo de las cruces.
2.7.5. Redes Neuronales
El primer modelo matemático que define el comportamiento de las neuronas
biológicas fue propuesto por Warren McCulloch y Walter Pitts en 1943 (López, 2008),
el cual intenta imitar el manejo de información del sistema nervioso (cerebro) ante
casos concretos (Matich, 2016).
Una red neuronal consiste en redes altamente conectadas que relacionan las
entradas con las salidas deseadas. La red es entrenada modificando iterativamente los
pesos de las conexiones de modo que se llegue a la respuesta correcta (Mathworks,
2017).
Las características más relevantes de las redes neuronales se mencionan a
continuación:
• Son unidades de procesamiento que se interconectan en paralelo y se les
entrega información, por esta razón, es que en las redes neuronales se puede
observar casos donde algún problema inicialmente no puede ser resuelto,
pero luego del intercambio de información con el conjunto de neuronas se
puede “aprender” a resolverlo/clasificarlo.
• Se utilizan para reconocer patrones.
• Tienen la capacidad de mejorar su rendimiento en base al aprendizaje.
Generalmente las neuronas se suelen agrupar en estructuras que se denominan
“capas”, en la Figura 18 se muestra la estructura básica de una red neuronal con una
conexión unidireccional (feedforward).
34
Figura 18 Ejemplo de red neuronal completamente conectada Fuente: (Matich, 2016)
Como se puede ver en la Figura 18, existen 3 tipos de capas, que son: de entrada,
ocultas y salida. La capa de entrada (sensorial) es la que recibe directamente la
información proveniente de alguna fuente externa.
Las capas ocultas son las responsables de definir la topología de la red neuronal y
entregar información para que la capa de salida pueda dar un resultado.
La capa de salida muestra directa o indirectamente la decisión a tomar.
Otra característica importante dentro de este método es que solamente las neuronas
que están especializadas en un patrón de entrada son activadas y el resto no, por lo
tanto, pueden ser consideradas como ganadoras recopilando la nueva información.
Las ventajas que se pueden resaltar de este método son los siguientes (Matich,
2016): su aprendizaje similar al ser humano (adaptativo), tolerancia a errores, tiempo
de ejecución y su adaptación a la tecnología actual, aunque no sean completamente
transparentes sus procesos.
2.8. Evaluación de clasificadores
Para determinar la eficiencia de los clasificadores se tendrá en cuenta su grado de
exactitud, sensibilidad y especificidad.
𝐼𝑛1
𝐼𝑛2
𝐼𝑛𝑘
35
2.8.1. Validación cruzada
Al dividir los datos disponibles en conjuntos, se reduce drásticamente el número
de muestras que se pueden utilizar para aprender, y los resultados pueden depender de
una elección aleatoria particular para el par de conjuntos.
Una solución al problema de pocas muestras es un procedimiento llamado
validación cruzada (VC). Un conjunto de prueba todavía debe ser mantenido para la
evaluación, pero el conjunto de validación ya no es necesario al hacer VC (Arahal,
2006).
En el enfoque básico, llamado k-fold, el conjunto de entrenamiento se divide en 𝑘
conjuntos más pequeños. Se sigue el siguiente procedimiento para cada uno de los k
"pliegues":
• Un modelo es entrenado usando 𝑘 − 1 de los pliegues como datos de
entrenamiento;
• El modelo resultante se valida en la parte restante de los datos.
La medida de rendimiento reportada por la validación cruzada k-fold es entonces
el promedio de los valores calculados en todo el proceso (Arahal, 2006). Este enfoque
puede ser costoso desde el punto de vista computacional (Lavelli, 2008), pero no
desperdicia demasiados datos, lo cual es una ventaja importante en el problema, pero
el número de muestras de prueba se hace más pequeño. En la Figura 19 se encuentra
una representación del procedimiento de validación cruzada.
Figura 19 Descrpción de validación cruzada Fuente: (Lavelli, 2008)
36
La validación cruzada representada en la Figura 19 está en el orden de k, y se
encarga de fraccionar los datos de entrada en conjuntos más pequeños. En cada
iteración el modelo se entrena con 𝑘 − 1 conjuntos de datos y se evalúa con el restante
(uno). El valor final de precisión es el promedio resultante de cada iteración.
2.8.2. Matriz de confusión
Es comúnmente usada para definir la eficiencia de los modelos de aprendizaje de
máquina implementados. Contiene información sobre la clasificación actual y la
predicha realizada por un sistema. En las celdas dentro de la matriz se especifica
cuantitativamente el grado de acierto o fracaso en cada caso (verdaderos positivos,
falsos negativos, verdaderos negativos, etc.) (Lewis, 2001). La Tabla 4 muestra la
matriz de confusión para un clasificador binario.
Tabla 4
Ejemplo de matriz de confusión
Predicción
SI NO
Cla
se
Actu
al SI VP FN
NO FP VN
Fuente: Elaboración propia
Las entradas en la matriz de confusión mostrada en la Tabla 4 tiene el siguiente
significado:
• VN (Verdadero negativo) es el número de predicciones correctas de que una
instancia es negativa,
• FP (Falso Positivo) es el número de predicciones incorrectas de que una instancia
es positiva,
• FN (Falso Negativo) es el número de predicciones incorrectas de una instancia
negativa, y
• VP (Verdadero Positivo) es el número de predicciones correctas de que una
instancia es positiva.
Uno de los beneficios de las matrices de confusión es que facilitan ver si el sistema
está confundiendo dos clases; esta característica es importante cuando se tiene una
base de datos que no es equiprobable.
37
Por ejemplo, si se tiene 200 muestras en total, de las cuales 188 son tipo “paciente
sano” y las 12 muestras restantes son tipo “paciente enfermo”, el clasificador puede
generalizar todo el conjunto a tipo “paciente sano” y tendría una exactitud del 94%,
pero esto no significa que sea un buen clasificador ya que obtuvo un 100% de error en
las muestras que representaban a un paciente enfermo, lo que puede conducir a
consecuencias más graves.
A continuación, se detalla las fórmulas empleadas para generar la matriz de
confusión.
• Exactitud. - Es la proporción de los resultados verdaderos (ambos verdaderos
positivos y verdaderos negativos) entre el número total de casos examinados.
𝐸𝑥𝑎𝑐𝑡𝑖𝑡𝑢𝑑 =𝑉𝑃 + 𝑉𝑁
𝑉𝑃 + 𝑉𝑁 + 𝐹𝑃 + 𝐹𝑁∙ 100% (8)
• Sensibilidad. - Muestra la capacidad del modelo para detectar a los pacientes
enfermos.
𝑆𝑒𝑛𝑠𝑖𝑏𝑖𝑙𝑖𝑑𝑎𝑑 =𝑉𝑃
𝑉𝑃 + 𝐹𝑁∙ 100% (9)
• Especificidad. - Es el porcentaje de personas sanas que se identificó
correctamente como no tener la condición.
𝐸𝑠𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑑𝑎𝑑 =𝑉𝑁
𝑉𝑁 + 𝐹𝑃. 100 (10)
2.8.3. Curvas ROC (Receiver Operating Characteristic)
La evaluación de las pruebas de diagnóstico es un motivo de preocupación en la
medicina moderna no sólo para confirmar la presencia de enfermedad, sino también
para descartar la enfermedad en sujetos sanos (Hajian-Tilaki, 2013). La curva ROC es
una herramienta fundamental para la evaluación de pruebas diagnósticas. En una curva
ROC se representa la tasa verdadera positiva (Sensibilidad) en función de la tasa de
falsos positivos (Especificidad) para diferentes puntos de corte de un parámetro (Begg,
1991).
Cada punto de la curva ROC representa coordenada de sensibilidad / especificidad
que corresponde a un punto de decisión particular. El área bajo la curva ROC (AUC)
38
es una medida de lo bien que un parámetro puede distinguir entre dos grupos de
diagnóstico (enfermo / normal).
El parámetro que indica la precisión de un modelo es al área bajo la curva ROC,
si el área es igual a uno es un predictor perfecto, caso contrario, si el área es menor o
igual a 0.5 es una prueba sin precisión diagnóstica (aleatoria) (García, 1997). Una
limitación de las curvas ROC es que sólo contemplan dos estados clínicos posibles
(sano, enfermo) y no sirven para situaciones en que se trata de discernir entre más de
dos estados.
En la Figura 20 se encuentra una representación gráfica de las curvas ROC y su
área bajo la curva (AUC) con respecto al valor diagnóstico.
Figura 20 Representación gráfica de las curvas ROC Fuente: (Fawcett, 2004)
2.9. Lenguajes de programación
2.9.1. OpenCV (Open Source Computer Vision)
OpenCV es una biblioteca de funciones de programación dirigida principalmente
a la visión por ordenador en tiempo real (Bradski, 2008). La librería cuenta con más
de 2500 algoritmos optimizados, que incluye un amplio conjunto de procedimientos
clásicos y de última generación de visión por ordenador y algoritmos de aprendizaje
de la máquina.
Los algoritmos implementados en OpenCV pueden ser utilizados para detectar y
reconocer rostros, identificar objetos, clasificar acciones humanas en videos, rastrear
objetos en movimiento, edición de imágenes y seguir los movimientos oculares, etc.
(Bradski, 2008).
39
Adoptada en todo el mundo, OpenCV tiene más de 47 mil personas de la
comunidad de usuarios y el número estimado de descargas supera los 9 millones. Los
usos van desde el arte interactivo hasta la inspección de minas, construcción de sitios
web o robótica avanzada.
2.9.2. Python
Python fue desarrollado como una licencia de código abierto (aprobada por OSI),
lo que permite ser un lenguaje de programación libremente utilizable y distribuible,
incluso para uso comercial (Khachatryan, 2015). Python en cierta forma es similar a
Java, incluso tiene una máquina virtual (la PVM, Python Virtual Machine) y también
puede ejecutarse en modo consola de manera parecida a Matlab.
Python es un lenguaje de programación intuitivo y debido a esta característica
cuenta con gran cantidad de módulos para realizar múltiples tareas, la mayoría de ellos
son realizados por la fundación Python.
Para utilizar Matlab se requiere una licencia de varios miles de dólares, mientras
que Python es Open Source y es completamente gratuito para aplicaciones científicas
y comerciales.
En el presente trabajo se empleó Matlab inicialmente debido al toolbox que tiene
para aprendizaje de máquina, ya que para un primer acercamiento es muy intuitivo y
práctico, pero su gran desventaja es el licenciamiento, y por esto se vio la necesidad
de buscar otro lenguaje de programación que permita generar similares resultados.
Para el procesamiento digital de imágenes y el aprendizaje de máquina se emplea
anaconda2, que es una distribución de alto rendimiento de Python y R, una de sus
ventajas es que ya cuenta con los paquetes básicos para el tratamiento de imágenes
(OpenCV) y aprendizaje de máquina en Python (librería sklearn).
40
CAPÍTULO III
PROCEDIMIENTO
3.1. Introducción
Para realizar el prototipo de sistema CAD se requiere un conjunto de imágenes
para ser analizadas, pero al momento de elaborar el presente trabajo de titulación no
se encontró una base de datos de iridología liberada que contenga el diagnóstico final
por parte de un doctor especialista (gastroenterólogo), únicamente se encontró una
base de datos de iris. Para dar un diagnóstico se solicitó ayuda al Dr. Telmo de la Torre
para localizar posibles anomalías en los iris presentados en la base de datos.
La base de datos total para el presente trabajo de titulación tiene 100 iris. La base
de datos Iriso cuenta únicamente con 77 imágenes, donde principalmente los pacientes
son cooperativos y las imágenes fueron captadas en un ambiente controlado,
presentando toda la base de datos características similares. La cantidad de la base de
datos Iriso se consideró reducida por lo que se vio la necesidad de conseguir más
imágenes. Las 23 imágenes restantes se los obtuvo gracias a la colaboración de la Dra.
Elena Egas (imágenes de 640 x 480 con pacientes no cooperativos) y compañeros de
clase (imágenes de 16 megapíxeles con una cámara diferente a la empleada en Iriso)
que prestaron su tiempo e iris para el actual estudio. Estás 23 imágenes se las añadió
con la finalidad de evaluar la robustez del sistema implementado.
Al tener la base de datos completa de iris se debe seguir el proceso para su
segmentación, que en un inicio es muy similar al que se realiza para el reconocimiento
de iris en la autenticación biométrica. Se emplea máscaras en forma de anillo para la
segmentación del área de interés (En la sección 3.3 Descripción general del algoritmo,
se encuentra los diagramas de bloques describiendo el proceso seguido).
Con el área de interés segmentada (estómago) se procede a la conversión a
coordenadas polares para poder retirar la pupila de la evaluación ya que su tonalidad
oscura afectaría a los resultados. Luego se procede a la extracción de características de
cada imagen (básicamente son características de color).
41
Con los datos obtenidos se manda a los 4 tipos de clasificadores que son: árbol de
decisión, vecinos más cercanos KNN, SVM y redes neuronales. Debido al tamaño de
la muestra (100 iris) se requiere emplear validación cruzada (10 fold) y se determina
los mejores resultados.
3.2. Base de datos
Existen bases de datos de iris públicas para el estudio o investigación del iris como
son: CASIA, UTIRIS, UBIRIS, UPOL, (Nalla, 2015) entre otras, pero las bases de datos
enfocadas únicamente a iridología tienen un costo elevado, debido a la popularidad
que ha tomado esta práctica en los últimos años, se ha hecho muy comercial.
Los principales problemas con estas bases de datos públicas, son el tipo de luz que
usan (infrarroja) y la resolución de las mismas.
La resolución de las cámaras es un aspecto importante, ya que la iridología se
encarga de estudiar las delicadas fibras del iris, por lo que se requiere cámaras que
logren detectar esas minúsculas alteraciones, como el anillo de absorción.
Con el tipo de iluminación infrarroja, se está quitando los colores característicos
del iris como se muestra en la Figura 21.
Figura 21 Imágenes del Iris: (a) Imagen con luz infrarroja, (b) Imagen a color Fuente: Imagen (a) (Najafi, 2011) e Imagen (b) base de datos Iriso
3.2.1. Iriso
Para el presente trabajo se empleó la base de datos Iriso (Iriso, 2015), que cuenta
con 77 imágenes de iris con diferentes iluminaciones; las imágenes fueron captadas
42
con una cámara Cannon® de 16 Megapíxeles, la dimensión de la imagen es de
4608x3456 píxeles, en formato jpg con 3 bits comprimidos por píxel.
La base de datos no incluye información del paciente (sexo, edad, historial
clínico), tampoco cuenta con información de si el iris captado en la imagen es el
izquierdo o derecho. No brinda mayor información sobre las personas que colaboraron
en la base de datos debido al secreto profesional. En la
Figura 22 se muestra las diferentes iluminaciones disponibles en la base de datos.
a) b) c)
d) e) f)
Figura 22 Tipos de iluminaciones disponibles en la base de datos Iriso Fuente: (Iriso, 2015)
En la
Figura 22 se muestra un mismo iris con diferente iluminación: (a) Iluminación
Horizontal, (b) Iluminación Vertical, (c) Iluminación Superior, (d) Iluminación Lateral
Derecha, (e) Iluminación Inferior, (f) Iluminación Lateral Izquierda.
Los iris que tienen una sola luz lateral son con la finalidad de destacar las texturas
presentes, las luces laterales dobles permiten estudiar áreas precisas comparando las
sombras proyectadas y penetrando hasta el fondo de lesiones. En una consulta
convencional se usan principalmente los pares horizontal y vertical para tener una
iluminación uniforme.
43
3.2.2. Imágenes adicionales
Dentro del campo práctico de la iridología las imágenes a ser estudiadas no tienen
la resolución, iluminación y postura del iris adecuado; por esta razón se decidió incluir
23 imágenes adicionales, para determinar la robustez del sistema ante cambios. Las
imágenes añadidas representan un 29,87% de la base de datos original.
Dentro de las 23 imágenes se tiene 8 imágenes de 640 x 480 pixeles, con
iluminación lateral horizontal en formato jpg (Ver Figura 23a); 3 imágenes son
captadas con una cámara Sony® de 16 megapíxeles de resolución, sin lente de
aumento adicional, enfoque automático e iluminación lateral izquierda (Ver Figura
23b) y las 12 imágenes restantes fueron tomadas con un celular Sony® de 16
megapíxeles, un lente de aumento para lograr mayor detalle en la imagen y presentan
iluminación lateral (Ver Figura 23c).
a) b)
c)
Figura 23 Imágenes adicionales con diferente resolución, iluminación y detalle Fuente: (Iriso, 2015)
Como se puede ver las imágenes mostradas en la Figura 23 no tienen el mismo
aspecto y características que presenta la base de datos de Iriso. Al incluir este tipo de
44
imágenes se debe configurar todo el prototipo para que funcione con la menor
resolución de imágenes, que en este caso particular es de 640 x 480 pixeles.
3.3. Descripción general del algoritmo
Para realizar el diagnóstico se puede adquirir una imagen del iris de la base de
datos, y en el caso de que se requiera adjuntar una imagen adicional al prototipo, se
recomienda tener en cuenta lo siguiente; la imagen debe ser a color, tomada con una
cámara de 16 Megapíxeles Cannon® (es con la finalidad de tener imágenes de similares
características a las de la base de datos Iriso), las dimensiones de la imagen deben ser
de 4608x3456 píxeles, enfoque manual y sin ningún filtro adicional.
Se recomienda tomar la imagen a una distancia de aproximadamente 2 cm. del ojo
(entre el lente y el iris), mantener la cámara a una altura cómoda para el paciente y que
pueda mirar fijamente, de ser posible emplear lentes de aumento en la cámara y
emplear una luz lateral (LED) para iluminar el iris. No se debe mantener la luz muy
cercana al ojo ni durante periodos de tiempo extensos (máximo 30 segundos), por
último, se recomienda que el paciente este calmado para que pueda ver directamente
el lente y no tenga movimientos nerviosos (involuntarios) en la captura de imagen.
Al tener la imagen del iris se procede a efectuar un procesamiento digital de imagen
para localizar y segmentar el iris, para obtener varios parámetros de interés de la zona
estudiada (zona 1 y 2).
En este prototipo se requiere una etapa de clasificación, donde en base a los
parámetros de interés extraídos se determina si el paciente está o no enfermo. Este
proceso emplea métodos de aprendizaje de máquina supervisado, ya que se tiene un
vector respuesta (diagnóstico del doctor).
Al ser cada iris distinto (varia de persona a persona) debe adquirir experiencia en
el diagnóstico en otras palabras debe ser entrenado, por esto se utiliza varios
clasificadores donde se evalúa la eficiencia de cada uno y en base a los resultados
obtenidos se determina el mejor clasificador para los atributos característicos que
presenta el prototipo.
45
En la Figura 24 se describe el proceso general que realiza el sistema para establecer
un diagnóstico.
Figura 24 Proceso para la detección y diagnóstico de enfermedades gástricas. Fuente: Elaboración propia
3.4. Preprocesamiento
El iris es el área esencial de estudio para este trabajo, por esta razón debe ser
segmentado de la imagen original adquirida, en otras palabras, se requiere quitar los
elementos que no aporten información para la detección de enfermedades en el sistema
gástrico, como son: pestañas, esclerótica, lagrimal, marcas en el borde del ojo, entre
otras.
La segmentación del iris requiere una localización circular dentro de la imagen
original del ojo. Esto significa detectar solamente el borde interno (pupila), ya que el
área del estómago es el siguiente sector circular (ver Figura 25).
Figura 25 Localización de un mapa de Jensen en un iris real Fuente: Elaboración propia
Captura de imagen
46
Como se puede ver en la Figura 25, no existe necesidad de localizar el borde
externo del iris, ya que se encuentra fuera del área de interés, y de esta forma se
optimiza el proceso para reducir el tiempo de ejecución.
La descripción general de los pasos que se siguen para el preprocesamiento de
imagen, se muestra en la Figura 26.
Figura 26 Preprocesamiento de imagen Fuente: Elaboración propia
En la Figura 26 el inicio del proceso es la imagen aplicada una redimensión, en el
siguiente apartado se explica que aspectos se tomaron en consideración para definir la
redimensión óptima para el presente caso de estudio.
3.4.1. Redimensión de imagen
Como primer paso, el sistema adquiere imágenes de la base de datos, para la
resolución original de 4608x3456 píxeles el radio mínimo de la pupila es de 225 y el
máximo de 467 pixeles, para revisar a detalle el valor de radios por imagen, favor
revisar la sección de anexos.
Con las dimensiones de la pupila sistema presenta un tiempo de procesamiento
por imagen de 53603,8 segundos (14 h 52 min y 48 s) en realizar un solo proceso de
localización, segmentación y extracción de características (sin diagnóstico final - sin
clasificador).
Uno de los objetivos del presente trabajo es obtener un diagnóstico ágil que no
demande el tiempo que se requiere con otros procedimientos (biopsia, examen de
sangre). Al tardar aproximadamente 15 horas en examinar la imagen completa, se ve
la necesidad de implementar una redimensión de imagen al proceso.
Debido a las 23 imágenes añadidas se debe tener una redimensión de 640x480
pixeles lo cual implica que solo se está empleando un 1,89% aproximadamente de la
imagen original. Al realizar este procedimiento el valor de entropía en la imagen será
despreciable ya que está relacionado con el tamaño total de la imagen.
47
En la Tabla 5 se muestra las características del computador empleado para el
presente trabajo de titulación y del cual se obtiene el tiempo de procesamiento:
Tabla 5
Características del computador empleado para las pruebas del prototipo
Componentes Detalle
Procesador Intel(R) Core™ i7-5600U
RAM 8Gb
Velocidad 2,60GHz
Sistema operativo Windows 10 Pro 64 bits
Modelo Dell Latitude E5450
Fuente: Elaboración propia
Con la redimensión mencionada el prototipo tarda 0,33 segundos en realizar el
procesamiento de imagen y entregar las características, con la base de datos completa
tarda 33 segundos.
Se debe tener en cuenta que cada vez que se quiera realizar un diagnóstico nuevo el
sistema debe estar entrenado para poder dar un resultado. Al ir generando estos
estudios se recomienda añadir las imágenes nuevas (img) a la base de datos, con esto
el sistema CAD tendrá un conjunto de entrenamiento mayor (100 + img )imágenes.
3.4.2. Localización del área de interés
Posterior a la redimensión de imagen se llama a la subrutina Hough la cual se
encarga se realizar la localización circular inicial del área de interés. En base a lo
descrito en la sección 2.6.3.4 sobre la comparativa de metodologías, se optó por
emplear la detección del iris de R. Wildes, por lo tanto, se requiere aplicar un detector
de bordes de Canny y la Transformada Hough.
Para el presente trabajo no se requirió el detector de bordes de Canny, ya que al
aplicarlo se localizaban varios círculos (criptas, luz, borde exterior, etc) y por lo tanto
se incrementaba el tiempo de procesamiento. Se comprobó que solo con cambiar el
espacio de color de RGB a escala de grises era más que suficiente para detectar el
borde interior del iris (pupila).
48
Para usar la transformada Hough de OpenCV en Python se requiere la función
cv2.HoughCircles donde los parámetros de entrada son: la imagen donde se realiza la
localización (en escala de grises), método para detección del centro de la
circunferencia (actualmente el único método implementado es CV_HOUGH_
GRADIENT que es básicamente 21HT descrito en (Yuen, 1990)), el radio máximo y
mínimo de la circunferencia y la distancia mínima entre los centros de los círculos
detectados.
Los radios máximo y mínimo para la localización de la pupila son en tamaño de
66 y 30 pixeles respectivamente (Favor revisar Anexos Tabla A). Estos valores son
respecto a la resolución de 480 pixeles.
Si la distancia mínima entre centros es demasiado pequeña (circunferencias
localizadas con la transformada Hough), varios círculos vecinos pueden ser falsamente
detectados además de uno verdadero. En el caso de que sea demasiado grande, algunos
círculos pueden ser perdidos, para este caso solo necesitamos encontrar una
circunferencia, por lo tanto, se coloca un valor alto como distancia mínima entre
centros (la distancia mínima colocada es de 800).
Al localizar la pupila con la transformada Hough se procede a dibujar la
circunferencia encontrada con la finalidad de validar si el procedimiento ejecutado fue
exitoso o no.
Para la localización del área de interés se tiene en mente que la localización del
borde interno del iris es de principal importancia, mientras que el borde exterior real
para el presente trabajo no es la separación entre el iris y la esclerótica (borde exterior);
el borde exterior real es el anillo de absorción en caso de que exista y las zonas 1 y 2
que corresponden al sistema gástrico.
Para seleccionar el área de interés final se tiene en consideración el radio medio de
la pupila y del iris, que son 49 y 171 pixeles respectivamente (revisar la sección de
Anexos). Con estos valores se saca el tamaño medio del iris que es 122 pixeles.
En los mapas de Jensen se puede ver que la región del estómago son pequeñas
áreas concéntricas a la pupila (10-30 pixeles), pero para el presente trabajo de
49
titulación se tendrá en consideración el peor caso, el cual sería, si el área de interés
llega hasta la mitad del iris (61 pixeles).
Se determina la distancia óptima que representa el área de interés en base a la
exactitud final del sistema, para esto se hace pruebas con valores de múltiplos de 10
hasta el valor máximo que es de 60 píxeles.
En la Figura 27 se presenta el diagrama de flujo para la localización del área de
interés (borde interno del iris y zona del estómago).
Figura 27 Algoritmo de localización para el área de interes en la imagen Fuente: Elaboración propia
50
La elección del valor óptimo se encuentra en la sección de resultados, pero para la
explicación del procedimiento se utilizará la nomenclatura de 𝐿 para representar dicho
valor.
Después de localizar correctamente el borde interior del iris se suma 𝐿 pixeles al
radio obtenido de la pupila con la finalidad de obtener únicamente las secciones de
relevancia mientras se descarta la información innecesaria. El resultado de este proceso
se puede verificar en Figura 28.
Figura 28 Reultado del proceso de localización de area de interes Fuente: Elaboración propia
La localización del área de interés es el primer paso, ya que no se puede sacar
información útil de la imagen como se muestra en la Figura 28 porque aún están
considerada la pupila, el parpado, la esclerótica, entre otros. Entonces, es necesario
realizar una segmentación de imagen para tener únicamente las zonas 1 y 2 del mapa
de Jensen.
3.4.3. Segmentación del área de interés
La segmentación de imagen se realiza mediante dos máscaras. En la Figura 29 se
muestra las etapas del algoritmo empleado para segmentar el área de interés.
51
Figura 29 Algoritmo para segmentación del area de interes Fuente: Elaboración propia
La función Mascara recibe la siguiente información como datos de entrada: la
imagen con las circunferencias localizadas, el radio de la pupila, radio del área de
interés (zona 1 y 2) y el centro de la circunferencia.
Para realizar una máscara de igual dimensión que el área de interés se realiza una
matriz de ceros de igual tamaño que la imagen original (640,480,3) y se coloca un área
circular llena de unos con las dimensiones (el centro y el radio zona 1 y 2) obtenidas
de la subrutina Hough.
Se calcula una máscara por cada imagen, debido a que los radios y centros no
coinciden, para la primera imagen de la base de datos su máscara resultante se muestra
en la Figura 30.
52
Figura 30 Máscara resultante para la imagen 1 de la base de datos Fuente: Elaboración propia
Solo con la máscara mostrada en la Figura 30 no se puede tener el resultado
esperado ya que la pupila seguiría presente en la imagen.
Para eliminar la pupila de la imagen se realiza una segunda máscara, se utiliza un
circulo con las dimensiones de la pupila, pero esta vez llena de ceros. En la Figura 31
se muestra la máscara final implementada.
Figura 31 Máscara final implementada para la segmentación del iris Fuente: Elaboración propia
Para extraer solamente la zona 1 y 2 se realiza una operación AND (en Python se
representa con &) entre la imagen entregada (imagen localizada de la subrutina Hough)
y la máscara final, adicionalmente se recorta la imagen para que solo se muestre la
zona de interés (tiene forma similar a un anillo), en la Figura 32 se muestra el resultado
final de la subrutina máscara.
Figura 32 Imagen resultante de la segmentación Fuente: Elaboración propia
53
3.4.4. Transformación de coordenadas
Luego de segmentar la imagen exitosamente, el siguiente paso es transformar de
coordenadas rectangulares a polares (i.e., la imagen es cambiada a dimensiones fijas)
(Masek, 2003). Para ello se debe tener en cuenta el cambio de dimensiones de la pupila.
La imagen transformada a coordenadas polares es la que se codificará y permita
una homogenización en el proceso de detección de características. El modelo reasigna
a cada punto dentro del iris a un par de coordenadas polares (Daugman J. , 2004).
Para la transformación a dimensiones fijas se emplea el método de Daugman y en
la Figura 33 se muestra un ejemplo de normalización.
Figura 33 Ejemplo de normalización por el método de Daugman Fuente: (Daugman J. , 2004)
Como se mencionó anteriormente entre las imágenes de la base de datos existe
diferencias como: la iluminación, el tamaño del iris, tamaño de la pupila, inclinación
de la cabeza, entre otras. Para realizar un sistema automático es necesario que las
imágenes a ser diagnosticadas presenten la misma forma, por lo cual es de vital
importancia realizar una transformación de coordenadas rectangulares a coordenadas
polares.
Como primer paso se realiza el cambio a coordenadas (𝑟, 𝜃) empleando las
formulas descritas a continuación:
𝑟 = √(𝑥2 + 𝑦2) (11)
𝜃 = 𝑎𝑡𝑎𝑛 (𝑦
𝑥) (12)
Donde 𝑟 representa el radio y está en el intervalo entre [0,1], mientras que 𝜃
representa el ángulo de apertura, por lo tanto, puede tener valores entre [0,2𝜋].
54
En la Figura 34 se describe el algoritmo para la transformación de coordenadas
rectangulares a polares.
Figura 34 Algoritmo para la transformación de coordenadas Fuente: Elaboración propia
Al tener la imagen en coordenadas polares se debe realizar una transformación
adicional para pasarlos a coordenadas de pixeles nuevamente, para lo cual se utiliza
las siguientes fórmulas:
𝑥 = 𝑟 . cos 𝜃 (13)
𝑦 = 𝑟 . sin 𝜃 (14)
Donde (𝑥, 𝑦) representan las coordenadas de los pixeles, el resultado de este
procedimiento se muestra en la Figura 35 donde se puede notar que existen dos zonas
negras que rodean el área de interés. Estas zonas representan al área segmentada de la
55
pupila y los bordes exteriores resultantes de aplicar la máscara a la imagen (ver Figura
35).
Figura 35 Imagen realizada la transformación de coordenadas Fuente: Elaboración propia
Para retirar las zonas oscuras que rodean el iris se procede a recortar la imagen,
dando como resultado la Figura 36.
Figura 36 Imagen resultante del proceso de cambio de coordenadas Fuente: Elaboración propia
3.5. Extracción de características
Al tener únicamente la zona de interés se puede proceder con la extracción de
características en la imagen, que indican la presencia de alguna anomalía en el iris.
Para que el sistema pueda tomar una decisión se debe tener en cuenta ciertos
parámetros que denoten las anomalías dentro de la zona de interés. En total se
consideró 20 características, pero no todas son evaluadas ya que no aportaban con
información relevante para el estudio. A continuación, se describe todas las
características y se explica en ciertos casos porque se las retira del prototipo final.
3.5.1. Media de color
Este parámetro indica el posible intervalo de color normal. En esta característica
es necesario aclarar un aspecto, las imágenes empleadas en la base de datos son en su
mayoría de tonalidades color café, por lo cual se espera una variación en la distribución
de datos en este parámetro para las imágenes de una tonalidad diferente (2 imágenes-
56
tonalidad azul) ya que evidentemente va a variar el color medio drásticamente entre
los dos grupos de imágenes.
3.5.2. Desviación estándar
La desviación estándar muestra la cantidad de desviación que existe entre el color
medio y las anomalías presentes en el mismo, ayudando a detectar y diferenciar los
cambios que se presentan en cada componente RGB.
3.5.3. Intensidad de color según el nivel de afectación
Es una característica propuesta, donde la imagen segmentada es transformada a
escala de grises y en base a (Sivasankar, 2012) se establece rangos para determinar el
grado de afectación. En la Tabla 6 se muestra los rangos considerados:
Tabla 6
Rango de intensidad según el nivel de afectación
Grado de afectación Nivel de gris Intensidad (escala de grises)
Agudo Blanco 201-255
Sub agudo Gris claro 151-200
Crónico Gris oscuro 101-150
Degenerativo Negro 0-100
Fuente: (Sivasankar, 2012)
En la Figura 37 se muestra gráficamente la distribución de intensidad que tienen las
imágenes del iris, las zonas oscuras van a representar el área de anomalías que van a
estar de 0-100.
Figura 37 Densidad de anomalías en base al color medio y desviación estándar Fuente: Elaboración propia
Intervalo
de color normal
57
3.5.4. Densidad de anomalías
Se binariza la imagen segmentada y se procede a determinar la cantidad de ceros
(áreas afectadas) en la imagen. Se suma los unos presentes en la imagen y se lo divide
para el número total de pixeles que tiene la imagen segmentada. Los clasificadores
deben definir un umbral para dar un diagnóstico en base a esa información. La imagen
binarizada se muestra en la Figura 38.
Figura 38 Imagen de segmentación binarizada Fuente: Elaboración propia
3.5.5. Detección del anillo de absorción
Esta característica es sobre localización de anillo de absorción, ya que las
anomalías presentes en la región de análisis pueden ser confundidas con la pupila
debido a su textura y color obscuro. Si existe un valor diferente de cero en este
parámetro, significa que hay anomalías obscuras presentes en la zona de interés.
3.5.6. Máxima intensidad de color
La detección de alteraciones en la salud mediante iridología están estrechamente
relacionadas con los cambios de color; por esta razón es importante definir las
tonalidades máximas que se presentan en la imagen.
Se optó por sacar esta característica del prototipo final debido a que todos los
valores eran de 255, lo cual indica hay un punto de luz presente en la imagen estudiada.
Pero no representa una característica útil para la clasificación.
3.5.7. Mínima intensidad de color
En esta característica si se evidenció tonalidades mínimas diferentes de cero que
se presentan en la imagen, por esta razón si fue tomada en consideración para el
prototipo final.
En la Tabla 7 se detalla el nombre de cada parámetro empleado junto con el número
de atributos extraídos del mismo.
58
Tabla 7.
Nombre de parámetros y número de atributos extraídos (implementados).
Nombre de los atributos Número de atributos extraídos
Media de color 3
Desviación estándar 3
Intensidad de color 1
Densidad de anomalías 1
Anillo de absorción 1
Mínima intensidad de color 3
TOTAL 12
Fuente: Elaboración propia
3.6. Clasificador
Al tener las 12 características por imagen se debe utilizar los clasificadores para
definir el diagnostico. En la Figura 39 se muestra el algoritmo implementado para
realizar la clasificación.
El primer paso es implementar validación cruzada (son 100 imágenes se tiene 10
grupos de 10), para lo cual en el programa realizado en Python se requiere incluir la
librería sklearn ya que se necesita emplear la función KFold y las librerías de
aprendizaje de máquina. La función KFold solo obtiene los índices de los elementos
que forman los grupos de datos para entrenamiento y evaluación.
Con los índices de los datos se debe formar los grupos de entrenamiento y llamar
a la función tree.fit (árbol de decisión), knn.fit (vecino más cercano), svm.fit (SVM),
mlpc.fit (redes neuronales).
Figura 39 Algoritmo para los cuatro clasificadores Fuente: Elaboración propia
59
Para cada clasificador se evalúa un parámetro en particular. Para árbol de decisión
se estudia cual es el nivel de profundidad ideal para el modelo, para vecinos más
cercanos se determina el número máximo de vecinos que se debe considerar, en SVM
se estudia que kernel da el mejor desempeño. En redes neuronales se determina el
número óptimo de redes neuronales.
60
CAPÍTULO IV
RESULTADOS
4.1. Introducción
Una vez obtenidos todos los atributos relevantes, se utiliza los clasificadores y
validación cruzada para determinar el rendimiento de cada uno. La nomenclatura para
el diagnóstico de cada imagen es: 0 representa que está enfermo y 1 indica que está
sano. Para definir las mejores características de entrenamiento se utilizó el número de
posibles combinaciones (4095 posibles combinaciones) entre las 12 características
para SVM, vecino más cercano y árbol de decisión. Para redes neuronales no se utilizó
este proceso.
En esta sección se define el valor óptimo de 𝐿 (distancia del borde exterior de la
pupila al área de interés) en función de la exactitud y el área de la curva ROC (AUC).
4.2. Definición de 𝑳
Como se mencionó en el capítulo 3 para la definición de 𝐿 se tomó en
consideración desde los 10 píxeles hasta los 60, en la Tabla 8 se muestra los resultados
obtenidos con ese procedimiento.
Tabla 8
Desempeño de los clasificadores según la distancia optima
Clasificadores 10
píxeles
20
pixeles
30
pixeles
40
pixeles
50
pixeles
60
pixeles
Árbol de
decisión
Exactitud 79% 92% 92% 85% 84% 89%
AUC 0,70 0,88 0,88 0,8 0,76 0,85
Vecinos más
cercanos
Exactitud 85% 81% 85% 87% 80% 81%
AUC 0,78 0,76 0,89 0,74 0,65 0,68
SVM Exactitud 86% 98% 94% 90% 82% 83%
AUC 0.83 0,81 0.92 0,89 0,77 0,79
Redes
Neuronales
Exactitud 63% 79% 83% 70% 66% 48%
AUC 0,67 0,85 0,89 0,75 0,71 0,51
Fuente: Elaboración propia
El mejor resultado obtenido en la variación de 𝐿 fue de 30 pixeles, a continuación,
se explica con mayor detalle cada clasificador.
61
4.3. Resultados con la base de datos de 100 imágenes
4.3.1. Árbol de decisión
En la Tabla 9 se presenta el rendimiento de árbol de decisión con diferentes
criterios de clasificación:
Tabla 9
Rendimiento del clasificador árbol de decisión
Criterio de separación Exactitud AUC
Entropía 92% 0,88
Gini 87% 0,81
Fuente: Elaboración propia
Con el criterio de ganancia de información se tiene mejores resultados que con el
índice de Gini (expresa la desigualdad en las clases).
Se evaluaron los resultados para árboles de decisión con diferentes criterios de
separación, en la Figura 40 se muestra la curva de mejor desempeño entre evaluación
y entrenamiento del árbol de decisión con un criterio de segmentación de entropía.
Figura 40 Gráfica de ajuste del árbol de decisión con el criterio de entropía Fuente: Elaboración propia
En la Figura 40 se compara la curva de entrenamiento y evaluación para detectar
los puntos donde el árbol puede estar en sobre entrenamiento. Desde el nodo 8 se puede
ver que la curva de entrenamiento (roja) no sufre mayor variación y se mantiene
constante, esto se debe a que el árbol generalizó el modelo al grupo de datos de
entrenamiento.
Cantidad de nodos
62
El nodo 7 tiene un 92% de exactitud y en su transición al nodo superior se puede ver un último crecimiento en la curva de entrenamiento. En
la Figura 41 se muestra el árbol de decisión con los umbrales de separación.
Figura 41 Árbol de decisión con umbrrales por característica Fuente: Elaboración propia
63
Como se puede ver en la Figura 41, para el árbol de decisión, 6 de los 12 atributos
no tienen importancia para obtener un diagnóstico final, por esta razón se decide
retirarlos de este clasificador para obtener los mejores resultados. El árbol de decisión
tiene 7 divisiones y emplea 6 características (no emplea la intensidad de color,
detección del anillo de absorción, color mínimo en la componente roja y azul, media
de color en verde y la desviación estándar en azul)
4.3.2. Vecino más cercano KNN
En la Figura 42 se muestra el rendimiento del clasificador en base al número de
vecinos que considera.
Figura 42 Ajuste KNN en función del número de vecinos que considera Fuente: Elaboración propia
Con K igual a 4 vecinos se obtiene los mejores resultados, teniendo una exactitud
del 85%. Se puede ver que a partir de este punto el clasificador tiene más conflictos en
determinar el diagnóstico.
4.3.3. SVM
Para el modelo de SVM se cambia el kernel entre las siguientes opciones: SVC
(Support Vector Classifier), RBF (Radial Basis Function), POLY (kernel polinómico
de grado 3), LIN (kernel lineal). El clasificador SVM utilizó 5 de las 12 características,
las cuales son; la media de color en la componente red, densidad de anomalías y la
desviación estándar de RGB.
64
En la se muestra el desempeño de SVM con cada kernel, se puede ver que RBF y
POLY dan los mejores resultados, mientras que LIN da el desempeño más bajo.
Figura 43 Desempeño de SVM según el kernel empelado Fuente: Elaboración propia
En la Figura 43 se muestra el valor de exactitud de cada SVM con su respectivo
kernel y en la Tabla 10 se encuentra en mayor detalle los resultados obtenidos con el
clasificador SVM.
Tabla 10
Desempeño de SVM según el kernel empleado
Tipo de Kernel Exactitud AUC
Support Vector Classifier 81% 0,79
Radial Basis Function 94% 0,92
Polinómico 89% 0.87
Lineal 70% 0,63
Fuente: Elaboración propia
4.3.4. Redes Neuronales
Emplea tres conjuntos, uno para validación (30% de la base de datos), otro
entrenamiento (30% de la base de datos) y el último para pruebas (40% de la base de
datos). De cada etapa obtiene un resultado, pero para el presente análisis solo se tendrá
en cuenta como resultado final (análisis global de las respuestas).
65
4.3.5. Comparativa del rendimiento de clasificadores
Los resultados de la evaluación son presentados en términos de exactitud,
sensibilidad, especificidad y capacidad predictiva (área bajo la curva ROC) con la
finalidad de entender las características de desempeño de los sistemas propuestos.
Los valores presentados anteriormente representan el valor medio de los valores
de clasificación obtenidos durante el K-fold.
En la Tabla 11 se presenta el promedio de la exactitud, sensibilidad, especificidad
y capacidad predictiva mostrada por cada clasificador.
Tabla 11
Eficiencia de clasificadores
Clasificador Exactitud Sensibilidad Especificidad Capacidad
Predictiva
Tree 92% 75,75% 100% 0,88
Knn 85% 81,48% 86,3% 0,89
Svm 94% 87,87% 97,01% 0.92
Redes
neuronales 83% 66,67% 91,04% 0,89
Fuente: Elaboración propia
Los valores de sensibilidad son bajos debido a la base de datos empleada, no es
equiprobable. Las personas enfermas son 33, mientras que las personas sanas son 67.
4.3.6. Matriz de confusión
En la Tabla 13,14,15 y 16 se muestra las matrices de confusión para obtener los
valores de exactitud, sensibilidad, del sistema de árbol de decisión, vecino cercano,
SVM y redes neuronales respectivamente.
Tabla 12
Matriz de confusión árbol de decisión.
Predicción
SI NO
Cla
se
Actu
al SI 25 8
NO 0 67
Fuente: Elaboración propia
66
Como se puede ver en la Tabla 12 , el clasificador no funciona adecuadamente ya
que no logra discriminar entre una persona sana de otra enferma. Lo más alarmante de
este resultado es que a 8 pacientes enfermos los diagnosticó como sanos, y como se
explicado anteriormente las consecuencias de no dar un tratamiento temprano es que
se incremente la predisposición para contraer cáncer del sistema gástrico.
Tabla 13
Matriz de confusión vecino más cercano
Predicción
SI NO
Cla
se
Actu
al SI 22 5
NO 10 63
Fuente: Elaboración propia
Tabla 14
Matriz de confusión SVM
Predicción
SI NO
Cla
se
Actu
al SI 29 4
NO 2 65
Fuente: Elaboración propia
Como se puede ver SVM es el que mayor sensibilidad presenta, ya que es el
clasificador que mejor detecta a los pacientes enfermos, aunque tenga un error en el
diagnóstico de un paciente sano no causa tanto impacto.
Tabla 15
Matriz de confusión redes neuronales Predicción
SI NO
Cla
se
Actu
al SI 22 11
NO 6 61
Fuente: Elaboración propia
67
4.3.7. Curvas ROC
En la Figura 44 se presenta de forma gráfica el área bajo la curva que para el
prototipo implementado es de 0,92 y según (Zhu, 2010) la calidad de la prueba
diagnóstica es buena.
Figura 44 Curva ROC de SVM con un Kernel RBF
Fuente: Elaboración propia
El 0,92 que muestra la curva significa que existe un 92% de probabilidad de que,
ante un par de individuos, uno enfermo y el otro sano, el sistema los clasifique
correctamente. En caso de que el prototipo se llegue equivocar en su clasificación, es
más probable que muestre al individuo enfermo (aunque este sano) lo cual es menos
crítico, ya que la persona va asistir a una consulta médica a corroborar el diagnóstico
dado por el sistema.
4.4. Resultados con 77 imágenes de Iriso
4.4.1. Comparativa del rendimiento en los clasificadores
El procedimiento que se sigue en el caso de emplear las 77 imágenes es muy
similar pero los resultados varían un poco, ya que las imágenes consideradas para este
experimento son uniformes.
Los resultados de la evaluación son presentados en términos de exactitud,
sensibilidad, especificidad y capacidad predictiva (área bajo la curva ROC) con la
finalidad de entender las características de desempeño de los sistemas propuestos.
68
En la Tabla 16 se presenta el promedio de la exactitud, sensibilidad, especificidad
y capacidad predictiva mostrada por cada clasificador.
Tabla 16 Eficiencia de clasificadores con 77 imágenes
Clasificador Exactitud Sensibilidad Especificidad Capacidad
Predictiva
Tree 94,8% 86,6% 96,77% 0.91
Knn 81,8% 6,66% 100% 0.64
Svm 96,1% 86,66% 98,38% 0.99
Redes
neuronales 90,9% 66,66% 96,77% 0,98
Fuente: Elaboración propia
Con las 77 imágenes de Iriso se tiene 14 pacientes enfermos, mientras que las
personas sanas son 63.
4.4.2. Matriz de confusión
En la Tabla 17,18,19 y 20 se muestra las matrices de confusión para obtener los
valores de exactitud, sensibilidad, del sistema de árbol de decisión, vecino cercano,
SVM y redes neuronales respectivamente.
Tabla 17 Matriz de confusión con árbol de decisión
Predicción
SI NO
Cla
se
Actu
al SI 13 2
NO 2 60
Fuente: Elaboración propia
Tabla 18 Matriz de confusión con vecino más cercano
Predicción
SI NO
Cla
se
Actu
al SI 1 14
NO 0 62
Fuente: Elaboración propia
Como se puede ver en la Tabla 18, el clasificador no funciona adecuadamente ya
que no logra discriminar entre una persona sana de otra enferma. Lo más alarmante de
este resultado es que a 14 pacientes enfermos los diagnosticó como sanos, y como se
69
explicó anteriormente las consecuencias de no dar un tratamiento temprano es que se
incremente la predisposición para contraer cáncer del sistema gástrico.
Predicción
SI NO
Cla
se
Actu
al SI 13 2
NO 1 61
Fuente: Elaboración propia
Como se puede ver SVM es el que mayor sensibilidad presenta, ya que es el
clasificador que mejor detecta a los pacientes enfermos, aunque tenga un error en el
diagnóstico de un paciente sano no causa tanto impacto.
Predicción
SI NO
Cla
se
Actu
al SI 10 5
NO 2 60
Fuente: Elaboración propia
4.1 Curvas ROC
En la Figura 23 se presenta la curva ROC, únicamente se presenta la curva ROC
del clasificador con el mejor rendimiento integral que para este caso es SVM.
Figura 45 Curva ROC para el sistema con 77 imágenes Fuente: Elaboración propia
70
Las causas de que el sistema no detecte de manera óptima son:
1) Las deformaciones en la pupila. Interfieren al momento de realizar la
segmentación e identificación de la circunferencia lo cual obstaculiza los pasos
posteriores para el diagnóstico.
2) La posición de la iluminación para la captura de la imagen juega un papel
primordial ya que si interfiere en el área de interés se está quitando información
importante para el diagnóstico.
71
CAPÍTULO V
CONCLUSIONES Y RECOMENDACIONES
5.1. Conclusiones
En un ambiente controlado con las 77 imágenes de similares características se
obtuvo un mejor desempeño del prototipo con 96,1% de exactitud y 99% de capacidad
predictiva (ROC). Al añadir las 23 imágenes se ingresó un mayor ruido al sistema ya
que aquellos iris tienen diferentes características porque no fueron captados en un
ambiente controlado y cooperativo, a pesar de esto el prototipo no se vio gravemente
afectado debido a que solo baja un 2,1% en exactitud, pero presenta un aumento en lo
que es el parámetro de sensibilidad.
Con el clasificador SVM se obtiene mejor resultado para las imágenes bajo el
procedimiento descrito en el presente trabajo con un kernel RBF. Actualmente el
sistema tiene un 94% de diagnósticos correctos, el 87,87% de probabilidad de que un
sujeto enfermo obtenga una prueba diagnóstica con un resultado positivo. Estos
resultados son favorables para el problema de una falta de detección temprana, ya que
si el sistema determina que el paciente tiene alguna enfermedad gástrica; este debe
asistir a una consulta médica para corroborar el diagnóstico y recibir el tratamiento
adecuado evitando futuras molestias o complicaciones.
En base a los resultados obtenidos con el kernel de SVM se determina que la
distribución de los datos no es linealmente separable y por esta razón KNN presenta
un bajo rendimiento en el sistema, debido a que solamente evalúa la proximidad entre
los pacientes.
Las curvas ROC indican que tiene un buen nivel de predicción (valor entre 0.8 -
1), aunque esto puede cambiar debido a que la base de datos empleada no es
equiprobable y tiene poca cantidad de muestras.
Es necesario un valor alto en la curva ROC, para esto se determinó que el sistema
debe tener un valor elevado en sensibilidad antes que en especificidad ya que es
preferible diagnosticar la enfermedad en un paciente sano antes que errar en el
diagnóstico de un paciente enfermo, ya que este no va asistir a una consulta médica y
72
dejara pasar los síntomas hasta que el dolor sea intolerable y tenga mayores
complicaciones en el tratamiento.
5.2. Recomendaciones
Actualmente el sistema está enfocado a ojos con ciertas particularidades de color
debido a la base de datos con la que fue entrenado el prototipo, ya que la mayoría de
iris son de tonalidades cafés. Por esta razón se recomienda incrementar las imágenes
en la base de datos con nuevas características de color para que el sistema pueda
generalizar mejor su clasificación.
En caso de añadir nuevas imágenes a la base de datos se debe tener el radio de la
pupila y el iris para poder setear estos nuevos parámetros dentro del programa.
El principal limitante en este trabajo fue la falta de un diagnóstico por parte de un
gastroenterólogo, ya que esto sería de gran importancia porque se realizaría un
contraste entre ambas prácticas médicas y se podría desarrollar las posibles ventajas o
desventajas que tenga este tipo de medicina bioenergética y el prototipo implementado.
5.3. Trabajos Futuros
Como trabajo futuro se propone emplear métodos de aprendizaje no supervisado
para segmentar la imagen de estudio o diferenciar entre áreas adyacentes del iris para
determinar su pertenencia o no a una clase.
Como trabajo futuro se propone mejorar el desempeño del sistema para poder
ingresarlo de forma embebida en un sistema de acceso biométrico, así las personas
estarían en continuo estudio y en caso de detectar alguna anomalía se lo informaría
inmediatamente al área correspondiente. Es necesario tener presente que el médico
debe realizar una evaluación previa, para levantar su historia médica y otras
características que son apoyo en el diagnóstico y de interés dentro del área.
73
BIBLIOGRAFÍA
Abreu, L. &. (2007). Gastritis. En Gastroenterología: endoscopia diagnóstica y
terapéutica. (págs. 166-170). Ed. Médica Panamericana. doi:8479039639
Acero, Á. R. (2015). Sistema de clasificación por visión artificial de mangos tipo
Tommy. Revista UIS Ingenierías, 21-31.
Alpaydin, E. (2014). Introduction to machine learning. MIT press, 5-8.
Arahal, M. R. (2006). Validación cruzada. En Técnicas de predicción con aplicaciones
en ingeniería (págs. 77-78). Sevilla: Universidad de Sevilla.
Atherton, J. C. (2006). The pathogenesis of Helicobacter pylori–induced gastro-
duodenal diseases. Annu. Rev. Pathol. Mech, 63-96.
Ballard, D. H. (1981). Generalizing the Hough transform to detect arbitrary shapes.
Pattern recognition, 111-116.
Begg, C. B. (1991). Advances in statistical methodology for diagnostic medecine ni
the 1980's. . Statistics in medicine, 1888-1894.
Bell, R. M. (2007). Lessons from the Netflix prize challenge. Acm Sigkdd Explorations
Newsletter, págs. 75-79.
Berdonces, J. L. (20 de junio de 1999). El gran libro de iridologia grafico. RBA libros.
Obtenido de EL GRAN LIBRO DE IRIDOLOGIA GRAFICO.
Blanes, C. S. (2012). Aplicacion de un modelo de red neuronal no supervisado a la
clasificacion de consumidores electricos. Editorial Club Universitario.
Bradski, G. &. (2008). Learning OpenCV: Computer vision with the OpenCV library.
" O'Reilly Media, Inc.".
Calot, E. (2008). Reconocimiento de patrones en imágenes médicas basado en sistemas
inteligentes. . En Capitulo 2 (págs. 5-7). Enrique Calot.
Cañadas, M. M. (2007). Estudios para la optimización de la calidad de imagen en el
escáner ClearPET, modificando parámetros del algoritmo IMF-OSEM 3D
sobre adquisiciones simuladas con GAMOS. . CIEMAT, 1-3.
Carmona, E. J. (2014). Tutorial sobre Máquinas de Vectores Soporte (SVM). Madrid,
España.: Dpto. de Inteligencia Artificial, ETS de Ingeniería Informática,
Universidad Nacional de Educación a Distancia (UNEC).
Carreras, X. M. (2004). Máquinas de Vectores Soporte. En Introducción a la minerıa
de datos. Pearson-Prentice Hall.
74
Caruana, R. &.-M. (2006). An empirical comparison of supervised learning
algorithms. In Proceedings of the 23rd international conference on Machine
learning (págs. 163-168). ACM.
Ceolin, T. H. (2009). Inserción de terapias complementarias en el sistema único de
salud atendiendo al cuidado integral en la asistencia. Enfermería Global, 1-2.
Chapelle, O. S. (2009). Semi-supervised learning. IEEE Transactions on Neural
Networks, 542.
Cuenca, E. M. (2006). Fundamentos de fisiología. Paraninfo.
Daugman. (1993). High confidence visual recognition of persons by a test of statistical
independence. IEEE transactions on pattern analysis and machine intelligence
(págs. 1148-1161). IEEE.
Daugman, J. (2004). How iris recognition works. IEEE Transactions on circuits and
systems for video technology, 21-30.
Daugman, J. G. (1994). Washington Patente nº 5,291,560.
Deng, H. R. (2011). Bias of importance measures for multi-valued attributes and
solutions. Proceedings of the 21st International Conference on Artificial
Neural Networks (ICANN), (págs. 293–300.).
Esqueada, &. P. (2005). Fundamentos de procesamiento de imágenes. Baja California:
UABC.
Fawcett, T. (2004). ROC graphs: Notes and practical considerations for researchers. .
Machine learning, HP Laboratories, 2-30.
Galipienso, M. I. (2003). Inteligencia artificial: modelos, técnicas y áreas de
aplicación. Editorial Paraninfo.
Garcia, A. G.-P. (2011). Methodology for software development estimation
optimization based on neural networks. IEEE Latin America Transactions,
384-398.
García, M. A. (1997). IV Simposio de Metodología de las Ciencias del
Comportamiento. EDITUM, 77-78.
Gletsos, M. M. (2003). A computer-aided diagnostic system to characterize CT focal
liver lesions: design and optimization of a neural network classifier. IEEE
Transactions Information Technology in Biomedicine, 153-162.
75
Gómez, M. C. (2010). Avances en diagnóstico e intervencionismo mamario. En
Radiología básica de la mama (págs. 1-9). Madrid: Sociedad Española de
Radiología Médica.
Haigh, R. A. (1999). Reconstructing Paradise: Canada's Health Care System,
Alternative Medicine and the Charter of Rights. Health LJ, 2-3.
Hajian-Tilaki, K. (2013). Receiver operating characteristic (ROC) curve analysis for
medical diagnostic test evaluation. Caspian journal of internal medicine, 627.
Herlambang, R. A. (2015). Application of liver disease detection using iridology with
back-propagation neural network. . In Information Technology, Computer, and
Electrical Engineering (ICITACEE) (págs. 123-127). IEEE.
Herrera, A. (2000). La clasificación numérica y su aplicación en la ecología . Santo
Domingo.: Instituto Tecnológico de Santo Domingo.
Hongzong, S. T. (2007). Support vector machines classification for discriminating
coronary heart disease patients from non-coronary heart disease. The West
Indian Medical Journal, 451-455.
Hough, V. (1962). Washington, DC Patente nº 3,069,654.
Iriso. (1 de Julio de 2015). Iriso Camera. Obtenido de Base de datos iris [en línea]:
https://sites.google.com/site/irisocamera/home
Jensen, B. (. (1980). En D. B. Jensen, Ciencia y Practica de la Iridologia. (págs. 145-
146). YUG.
Jogi. (2014). Methodology of iris image analysis for clinical diagnosis. In Medical
Imaging, m-Health and Emerging Communication Systems (MedCom), 2014
International Conference, 235-236.
Khachatryan, V. S. (2015). Precise determination of the mass of the Higgs boson and
tests of compatibility of its couplings with the standard model predictions using
proton collisions at 7 and 8 TeV. . The European Physical Journal C, 75(5),
212-216.
Lai, C. L. (2010). Health examination based on iris images. In Machine Learning and
Cybernetics (ICMLC), 2010 International Conference (págs. 2616-2617).
IEEE.
Lavelli, A. C. (2008). Evaluation of machine learning-based information extraction
algorithms: criticisms and recommendations. Language Resources and
Evaluation, 361-393.
76
Leal, N. L. (2010). Sistemas de monitoreo de tránsito vehicular basados en técnicas de
segmentación de imágenes. Avances en Sistemas e Informática, 75-86.
Lewis, H. G. (2001). A generalized confusion matrix for assessing area estimates from
remotely sensed data. International Journal of Remote Sensing, 3223-327.
López, R. F. (2008). Fundamentos Biológicos de las Redes Neuronales Artificiales.
En Las redes neuronales artificiales (págs. 19-20). Netbiblo.
Lovesio, C. (2006). El paciente en coma. En Libro de Medicina Intensiva (págs. 20-
22). Buenos Aires: El Ateneo.
Luna, S. (2016). Iridología como herramienta semiología en homeopatía. Bogóta:
Fundación Universitaaria Luis G. Páez.
Maimon, O. &. (2005). Data mining and knowledge discovery handbook (Vol. 2). .
New York: Springer.
Mancebo Pérez, A. (2013). Desarrollo de una interfaz gráfica en Matlab para la
aplicación de detección de humos mediante procesamiento digital de imágenes.
(Doctoral dissertation)., 10-25.
Marín, J. I. (2006). Reconocimiento de comandos de voz usando la transformada
wavelet y máquinas de vectores de soporte. Scientia et technica, 10-15.
Martín, A. &. (2004). Bioestadística para las ciencias de la salud. Capitel Editores.
Martínez Echavarría, M. T. (2008). Helicobacter pylori en pacientes con diferentes
enfermedades gastroduodenales. Revista Cubana de Medicina, 47(4), 2-4.
Martínez, P. C. (2003). El valor de la estadística para la Salud Pública. Salus, Volumen
4, número 1.
Mathworks. (11 de Junio de 2017). Machine Learning with Matlab . Obtenido de
https://es.mathworks.com/campaigns/products
Matich, D. (Diciembre de 2016). Cátedra de Informática Aplicada a la Ingeniería de
Procesos . Obtenido de Orientación Fac. Regional Rosario. Argentina:
https://www.frro.utn.edu.ar/repositorio/catedras/quimica/5_anio/orientadora1/
monograias/matich-redesneuronales.pdf#page=1&zoom=auto,-19,852
Matworks. (2016). How Do You Decide Wich Algoritm to Use? En Introduction to
Machine Learning (pág. 7). The MathWorks.
Monar, M. &. (2014). Aplicación de las Redes Neuronales al Reconocimiento de
Objetos en Robots Manipuladores. Quito: Doctoral dissertation.
77
Montesdeoca, T. E. (2016). Sistema inteligente para el diagnóstico de enfermedades.
Bachelor's thesis, 15-17.
Mora-Florez, J. M.-E.-C. (2008). Evaluación del clasificador basado en los k vecinos
más cercanos para la localización de la zona en falla en los sistemas de
potencia. . Ingeniería e Investigación, 81-86.
Moreno, M. E. (2013). Epidemiología descriptiva del cáncer de estómago en la
Comunidad de Madrid: análisis de supervivencia. Universidad Complutense
de Madrid.
Najafi, M. &. (2011). Iris Recognition Based on Using Ridgelet and Curvelet
Transform. Matlab 1.
Nalla, P. R. (2015). Iris classification based on sparse representations using on-line
dictionary learning for large-scale de-duplication applications. SpringerPlus,
238-239.
Nor'aini, A. J. (2013). Classification of iris regions using Principal Component
Analysis and Support Vector Machine. In Signal and Image Processing
Applications (ICSIPA) IEEE International Conference, 134-139.
OMS, A. M. (7 de Septiembre de 2016). Organización Mundial de la Salud. Obtenido
de Medicina tradicional: http://apps. who.
int/gb/archive/pdf_files/WHA56/sa5618. pdf.
Ortiz, J. A. (1999). Clasificación con discriminantes: un enfoque neuronal . Doctoral
dissertation, PhD thesis, Departamento de Lenguajes y Sistemas Informáticos
Universidad de Alicante.
Othman, Z. &. (2010). Preliminary study on iris recognition system: Tissues of body
organs in iridology. In Biomedical Engineering and Sciences (IECBES) (págs.
115-119). IEEE.
Palomino, N. L. (2009). Técnicas de segmentación en procesamiento digital de
imágenes. Revista de investigación de Sistemas e Informática, 9-16.
Parchkoohi, M. H. (2015). Automatic detection of karstic sinkholes in seismic 3D
images using circular Hough transform. Journal of Geophysics and
Engineering, 746.
Passariello, G. (1995). Imagénes médicas. Adquisición, Análisis. Equinoccio.
Pelegrín, B. P. (2004). Avances en localización de servicios y sus aplicaciones.
EDITUM.
78
Proença, H. &. (2006). Iris segmentation methodology for non-cooperative
recognition. . IEE Proceedings-Vision (págs. 199-202). Image and Signal
Processing.
Quinlan, J. R. (1986). Induction of decision trees. Machine learning, 82-106.
Rebaza, J. V. (2007). Detección de bordes mediante el algoritmo de Canny. Escuela
Académico Profesional di Informática Universidad Nacional de Trujillo., 1-4.
Ross, L. &. (2011). The Image Processing Handbook. Microscopy and Microanalysis.
CRC.
Salcedo, E. (2017). Factores de riesgo asociados a la alteración del reflejo de bruckner
en recién nacidos en el hospital de ate-vitarte en el periodo de septiembre-
octubre del año 2016. Medicina Humana, 5-7.
Salles, L. F. (2008). The prevalence of iridologic signs in individuals with Diabetes
Mellitus. Acta Paulista de Enfermagem, 474-480.
Salud, O. M. (2002). Estrategia de la OMS sobre medicina tradicional 2002-2005. 56ª
asamblea mundial de la salud: Organización Mundial de la Salud.
salud., O. M. (2002). Estrategia de la OMS sobre medicina tradicional 2002-2005. 1-
10.
Santamaría, A. (2013). Diseño de un filtro bidimensional configurable de altas
prestaciones para procesamiento de imágenes. Universidad Carlos III de
Madrid, 1-4.
Sehouli. (2003). Alternative medicine in Germany and worldwide [in German].
Ratgeber unkonventionelle Krebstherapie, 51–60.
Shapiro, L. &. ( 2001 ). Computer Vision. Prentice Hall. Recuperado el 4 de 1 de 2017
Sivasankar, K. S. (2012). FCM based iris image analysis for tissue imbalance stage
identification. In Emerging Trends in Science, Engineering and Technology
(INCOSET) (págs. 210-215). IEEE.
Sotolongo, A. D. (2013). Combinación de técnicas de procesamiento digital de
imágenes e inteligencia artificial para el análisis de imágenes de mamografía.
3C Tecnología, 1-4.
Sparber A, W. J. (2001). Use of alternative and complementary cancer therapies. .
Surveys of complementary and alternative medicine: part II. , 281–287.
Sulistiyo, M. D. (2014). Iridology-based dyspepsia early detection using linear
discriminant analysis and Cascade Correlation Neural Network. In Information
79
and Communication Technology (ICoICT) 2nd International Conference
(págs. 139-144). IEEE.
Thews, G. &. (1983). Gatritis. En G. &. Thews, Anatomía, fisiología y pato fisiología
del hombre (págs. 384-386). Reverté.
Tuya, J. R. (2007). Técnicas cuantitativas para la gestión en la ingeniería del software.
Netbiblo.
Valdivia Roldán, M. (2011). Gastritis y gastropatías. Revista de Gastroenterología del
Perú, 38-48.
Wildes, R. P. (1997). Iris recognition: an emerging biometric technology. Proceedings
of the IEEE, 1348-1353.
Yuen, H. K. (1990). Comparative study of Hough transform methods for circle finding.
Image and vision computing, 170.
Zhang, D. L. (2013). Iris-based medical analysis by geometric deformation features.
IEEE journal of biomedical and health informatics, 223-231.
Zhu, W. Z. (2010). Sensitivity, specificity, accuracy, associated confidence interval
and ROC analysis with practical SAS®. Implementation NESUG proceedings:
health care and life sciences, 1-9.