View
223
Download
0
Category
Preview:
Citation preview
Una aproximación a la visión
La Visión, David Marr
Laboratorio de Inteligencia Artificial
MIT, años 70
Neurofisiología
• Entender el conexionado, los sensores, los mecanismos.
• Encontrar la imagen neural y la imagen física.
• Existe la “Neurona Abuela”?
• Donde se producen los niveles de integración?
Psicofísica
• Estudios comportamentales.
• Experimentos que intentas aislar los diferentes aspectos. Por ejemplo los estereogramas de Julezs.
• Permite encontrar reglas o leyes de cómo funciona la visión en términos más generales?
Aproximación computacional.
• Hacer programas (algoritmos) que resuelven problemas visuales sencillos o simplificados.
• Por ejemplo: detección de bordes en un conjunto de estructuras poligonales de color mate (Horn). Con la esperanza de poder generalizar después.
Marr y Poggio (‘77)
• Aproximación como un problema de análisis de información.
• Independencia de la realización particular de una solución concreta en el cerebro o en una máquina.
• Es una aproximación arriba-abajo con niveles diversos engarzados.
Representación y Descripción.
• Representación: Sistema formal para hacer explícitas ciertas entidades o tipos de información y una descripción de cómo el sistema lo hace.
• Descripción: Resultado de emplear una representación para describir una entidad.– Ej: números arábigos o romanos. Son mejores o
peores para hacer ciertas cosas (*, +)...
Proceso
• Significados restringido a los asociados a máquinas de procesamiento de información.
• Hay que escoger la representación adecuada para las entidades a manipular por ese proceso (entrada y salida)
• Un algoritmo para implementar el proceso.– Serie, paralelo, más robusto, más eficiente...
Tres niveles
• La explicación de la visión debe ser coherente a diferentes niveles: desde la neurona a la representación global.
• Teoría del cálculo: Procesamiento de la información
• Algoritmo y representación: psicofísica
• Realización física: neuroanatomía y neurofisiología
Teoría de cálculo
• Cual es el objetivo?
• Porqué es apropiado?
• Cuál es la lógica de la estrategia mediante la que se la puede llevar a cabo?
Representación y algoritmo
• Cómo puede implementarse esta teoría de cálculo?
• Cuál es la representación de la entrada y la salida?
• Cuál es el algoritmo para la transformación?
Implementación física
• Cómo puede realizarse físicamente esta representación y algoritmo?
• Solución biológica
• Solución informática
• Figura 6.1
Visión
• “Proceso que a partir de imágenes del mundo externo produce una representación útil al observador y no está ensombrecida por información irrelevante”.
• Puede concebirse como una proyección de una representación en otra: – Entrada: distribución de intensidad de luz
detectada por los fotorreceptores en la retina
Marco teórico
• Tabla 1.1
Factores responsables de la intensidad en una imagen
• Geometría de la escena
• Punto de observación (geometría del observador)
• Reflectancia de las superficies
• Iluminación de la escena
Procesamiento visual inicial
• Obtener representaciones adecuadas a los cambios y estructuras de la imagen:– detección de cambios de intensidad– representación y análisis de la estructura
geométrica local– detección de efectos de iluminación (por ej.
transparencia)
Qué representación?
• Debe incluir “marcadores de lugar” que puedan derivarse de las imágenes de modo fiable.
• Atributos: orientación, brillo, tamaño, posición.
• Deben corresponder con cambios físicos reales.
Supuestos físicos
• “El mundo está formado por superficies lisas con funciones de reflectancia (FR) cuya estructura espacial se puede elaborar”
• Organización jerárquica: “A menudo la organización espacial de la FR de una superficie ha sido generada por varios procesos diferentes, actuando a escalas distintas”
Supuestos físicos
• Similitud:” Los elementos generados en una superficie dada por un proceso generador de reflectancia que actúa en una escala dada tienden a ser más similares entre sí en su tamaño, contraste local, color y organización espacial que otros elementos de esta superficie”
• Se puede medir dentro de una escala...
Supuestos físicos
• Continuidad espacial: “A menudo las señales generadas en una superficie por un único proceso se organizan espacialmente”
• La continuidad en la superficie debe reflejarse de algún modo en la continuidad de los marcadores...
Supuestos físicos
• Continuidad de las discontinuidades: Las localizaciones de las discontinuidades en profundidad u orientación de las superficies son suaves.
• La cohesión de la materia implica que los objetos existen y tienen límites...
Supuestos físicos
• Continuidad de flujo: si la dirección del movimiento es discontinua en más de un punto (por ejemplo en una línea) entonces estamos frente al límite de un objeto.
Los ceros
• Detección de los cambios de intensidad:– Ocurren a diferentes escalas– Un cambio brusco de I equivale a un cero de la
segunda derivada.
• Figura 2.12 (detección de ceros con el operador laplaciano .Negro es negativo y blanco positivo, cruces por cero).
• Figs 2.17 y 2.23
G2
Qué relaciones espaciales hacer explícitas?
• Intensidad local media.• Tamaño medio• Densidad• Orientación local• Distancias locales de los elementos
agrupados.• Orientación local de los elementos agrupados.
Procesos de agrupamiento
• Construir marcadores de lugar que capten la estructura a mayor escala de la función de reflectancia de la superficie.
• Detectar cambios en los parámetros medidos asociados con estos marcadores y que indiquen cambios de orientación o distancia al observador
• Elaborar marcadores y encontrar límites.
• Figs. 2.5, 2.6, 2.33 y 2.34
• Tabla 3.2
• Tabla 3.3
• tabla 4.1
Recommended