Sistema de Conteo de Objetos en Movimiento

Embed Size (px)

Citation preview

  • 8/14/2019 Sistema de Conteo de Objetos en Movimiento

    1/16

    Disponible en: http://www.redalyc.org/articulo.oa?id=47826850010

    Red de Revistas Cientficas de Amrica Latina, el Caribe, Espaa y Portugal

    Sistema de Informacin Cientfica

    LOAIZA QUINTANA, ANDRS FELIPE; MANZANO HERRERA, DAVID ANDRS; MNERA SALAZAR, LUISEDUARDO

    Sistema de visin artificial para conteo de objetos en movimiento

    El Hombre y la Mquina, nm. 40, septiembre-diciembre, 2012, pp. 87-101

    Universidad Autnoma de Occidente

    Cali, Colombia

    Cmo citar? Nmero completo Ms informacin del artculo Pgina de la revista

    El Hombre y la Mquina,

    ISSN (Versin impresa): 0121-0777

    [email protected]

    Universidad Autnoma de Occidente

    Colombia

    www.redalyc.orgProyecto acadmico sin fines de lucro, desarrollado bajo la iniciativa de acceso abierto

    http://www.redalyc.org/articulo.oa?id=47826850010http://www.redalyc.org/comocitar.oa?id=47826850010http://www.redalyc.org/fasciculo.oa?id=478&numero=26850http://www.redalyc.org/articulo.oa?id=47826850010http://www.redalyc.org/revista.oa?id=478http://www.redalyc.org/revista.oa?id=478http://www.redalyc.org/revista.oa?id=478http://www.redalyc.org/revista.oa?id=478http://www.redalyc.org/http://www.redalyc.org/revista.oa?id=478http://www.redalyc.org/revista.oa?id=478http://www.redalyc.org/articulo.oa?id=47826850010http://www.redalyc.org/revista.oa?id=478http://www.redalyc.org/articulo.oa?id=47826850010http://www.redalyc.org/fasciculo.oa?id=478&numero=26850http://www.redalyc.org/comocitar.oa?id=47826850010http://www.redalyc.org/
  • 8/14/2019 Sistema de Conteo de Objetos en Movimiento

    2/1687

    (*) Universidad Icesi, Cali, Colombia. Correo electrnico: [email protected].(**) Universidad Icesi, Cali, Colombia. Correo electrnico: [email protected].(***)

    Universidad Icesi, Cali, Colombia. Correo electrnico: [email protected].

    Sistema de visinartificial para conteo de

    objetos en movimiento

    ANDRSFELIPELOAIZAQUINTANA*

    DAVIDANDRSMANZANOHERRERA**

    LUISEDUARDOMNERASALAZAR***

    Resumen

    En este artculo se hace una intro-duccin a diferentes conceptos y meto-dologas utilizadas en la construccin

    reconocimiento de patrones; as mismo,se describen los resultados obtenidosdurante el estudio y desarrollo de un -teo de personas que se mueven dentrode un espacio cerrado. El objetivo de

    este tipo de sistemas es el de obtenerinformacin de inters, que se puedainterpretar, a partir de un complejoprocesamiento de imgenes obtenidaspor medio de dispositivos pticos. Eneste proceso se deben tener en cuentavarios aspectos: el mtodo para obtenerlas imgenes, las diferentes tcnicasde procesamiento de las mismas y lamanera en que se va a interpretar lainformacin obtenida a travs de esosprocesos de manipulacin. Cualquiera

    la precisin de las aplicaciones y lacalidad de los resultados dependern:del nivel de conocimiento que se tengaacerca del objeto de estudio, la reso-lucin de los dispositivos con los que

  • 8/14/2019 Sistema de Conteo de Objetos en Movimiento

    3/1688

    se obtienen la imgenes y la capacidad deprocesamiento de los equipo en que se eje-cutan las aplicaciones; sin embargo, estosdos ltimos aspectos pueden ser menos

    caractersticas de los objetos que permiten

    abstracciones de los objetos, en lugar derealizar una comparacin exhaustiva delos reales.

    Palabras clave:

    de personas, reconocimiento de objetos.

    Abstract

    This article introduces different subjectsand methodologies used for building pattern -

    pose the results found during the study and

    vision system for indoors. Getting valuableinformation through a complex image pro-cessing is the goal of this kind of softwaresystems. In this process it must be take inaccount several factors: the method forgetting the images, the way to manipulatethem and the way to interpret informationabout those manipulations. Whichever ob-ject you follow, the applications accuracy

    and the quality of the results depend on:the knowledge level about studied object,the devices resolution and the processingcapabilities of the computer that executesthe applications, however, these two lastpoints could be less important if it is possi-ble to identify objects features that allow

    objects abstractions instead of making andexhaustive comparisons on the real object.

    Keywords:

    countig, objetcs and pattern recognition.

    1. Introduccin

    los mbitos de la vida pblica. En todas partes(la calle, los centros comerciales, los aeropuer-tos, etc.) hay grandes cantidades de personas enmovimiento aparentemente desordenado. Si seregistran sistemticamente estos movimientos yla cantidad de personas que transitan, los datosobtenidos se pueden utilizar comercialmente.

    El problema es que, hasta el momento, esasmediciones se realizan de forma manual y sonsusceptibles al error humano.

    Esta informacin resulta especialmenteimportante para las empresas, pues les ayudaa tomar decisiones en sectores como: manejode personal, mercadeo, logstica y manejo de laseguridad. Por tal razn, ha surgido en la comu-nidad dedicada al desarrollo de inteligencia arti-

    el inters de automatizar el proceso de conteo yseguimiento de los movimientos de las personas.

    El rea de visin por computador se interesaen la solucin de dos problemas fundamentales:la mejora de la calidad de las imgenes para lainterpretacin humana y el procesamiento delos datos de la escena para la percepcin de las

    mquinas, de forma autnoma.La primera trata de mejorar las tcnicas y

    tecnologas que permiten obtener una mejor ca-lidad en las imgenes, para que de ellas se puedaextraer ms informacin. Este problema est porfuera del alcance de este proyecto.

    La segunda se concentra en otorgar a lasmquinas la capacidad para ver el mundo que lesrodea, ms precisamente para deducir la estruc-tura y las propiedades del mundo tridimensional,a partir de una o ms imgenes bidimensionales(Gonzlez & Woods, 2001). En este tema se ubicael propsito del presente estudio.

    El objetivo de este artculo es determinar losprocesos y tcnicas de procesamiento de imge-nes, necesarios para el desarrollo de un sistema de

    movimiento, en especial de personas. Y el diseode un prototipo que permita mostrar las formas deobtener informacin valiosa a partir del mismo.

    2. Marco terico

    En la actualidad los sistemas de deteccin y

    dos tipos: los que hacen uso de diferentes tipo desensores (de proximidad, trmicos, infrarrojos,entre otros) y los se basan exclusivamente enla utilizacin de cmaras, siendo estos ltimos

    de objetos propuesto en este proyecto realiza sutrabajo basado en las teoras de los sistemas de

  • 8/14/2019 Sistema de Conteo de Objetos en Movimiento

    4/16

  • 8/14/2019 Sistema de Conteo de Objetos en Movimiento

    5/1690

    propiedades intrnsecas del objeto. Desdeel punto de vista de la teora de seales,la iluminacin corresponde con las bajasfrecuencias de la imagen, mientras que la

    frecuencias y, por tanto, con los detalles dela imagen. Existen diferentes mecanismos

    para separar las componentes de iluminacin

    consiste en eliminar las bajas frecuencias dela imagen para quedarse solo con las altas y,en consecuencia, con los detalles (Pajares &De la Cruz, 2008).

    C. Representacin de imgenes digitales

    de intensidad bidimensional, que se representadependiendo de la literatura y el contexto comof(x, y), f(i, j), I(x, y), I(i, j), E(x, y), g(x, y), g(i, j),etc., donde x e y o bien i y j son las coordenadasespaciales y el valor de f, I, E o g en cualquierpunto (x, y) o (i, j) es proporcional a la intensidado nivel de gris de la imagen en ese punto.

    Figura 3.Convencin de ejes utilizada para la repre-sentacin de imgenes digitales

    Fuente:(Gonzlez & Woods, 2001).

    D. Segmentacin

    La segmentacin es un proceso que consisteen dividir una imagen digital en regiones homo-gneas con respecto a una o ms caractersticas

    de facilitar un posterior anlisis o reconocimientoautomtico (Vlez et al., 2003). Se basa en dosprincipios fundamentales: discontinuidad y simi-

    litud. Tienen tambin dos categoras: orientadaa bordes (discontinuidad) y orientada a regiones

    (similitud) (Gonzlez & Woods, 2001). Entrminos generales, una regin es un rea de laimagen en la que sus pxeles poseen propiedadessimilares (de intensidad, color, etc.), mientras queun borde es una lnea que separa dos regiones dediferentes propiedades.

    Cualquiera que sea la tcnica de segmen-tacin usada, el proceso implica manipular ytransformar la imagen original en una que puedaprocesarse fcilmente.

    Deteccin de bordes

    Basndose en el hecho de la discontinuidad,se proponen los siguientes tipos de operadorespara la deteccin de bordes: operadores primeraderivada, operadores segunda derivada y opera-

    dores morfolgicos.

    Deteccin de regiones

    Para la deteccin de regiones se utilizantcnicas basadas en el hecho de la similitud:binarizacin, apoyada en el uso de umbrales;crecimiento de regiones, mediante la adicinde pxeles; divisin de regiones y similitud detextura, color o niveles de gris.

    En general, el proceso de la segmentacin

    suele resultar complejo, debido, por un lado, aque no se tiene una informacin adecuada de losobjetos a extraer y, por otro, a que en la escenaa segmentar aparece normalmente ruido. Es poresto que el uso de conocimiento sobre el tipo deimagen a segmentar o alguna otra informacin dealto nivel puede resultar muy til para conseguirla segmentacin de la imagen (Vlez et al., 2003).

    Cuando la calidad de la imagen no es buenay no es posible extraer la informacin de formaadecuada, es necesario aplicar tcnicas de mejoraen la calidad de la imagen original (Gonzlez &Woods, 2001).

    E. Descripcin

    Una vez se han destacado los bordes o lasregiones como elementos de inters, el procesode descripcin consiste en extraer propiedades oatributos para su uso en las aplicaciones. En l-

    de forma inequvoca, las diferentes estructuras dela imagen (Gonzlez & Woods, 2001). Estructu-

  • 8/14/2019 Sistema de Conteo de Objetos en Movimiento

    6/1691

    ras que el observador considera necesarias para

    Levialdi, 1996).

    (Cantoni & Levialdi, 1996), es decir, patrones quecomparten caractersticas similares y permiten

    en su forma geomtrica, topolgica, cromtica ymorfolgica (Cantoni & Levialdi, 1996).

    F. Tcnicas de deteccin y seguimiento del

    movimiento

    En particular, son tareas del sistema propues-to: diferenciar el fondo de la escena de los objetosque se encuentran en movimiento; distinguir

    cules de los objetos en movimiento detectadoscorresponden a una persona o al tipo de formaque se quiere reconocer; y hacer el seguimiento,dentro de la escena, a todos aquellos elementosque hayan sido reconocidos.

    A continuacin se describen las tcnicas utili-zadas para satisfacer las necesidades del sistema.

    Substraccin del fondo(background sub-

    traction).La substraccin de fondo es una tcnicautilizada para la deteccin de los objetos en mo-vimiento, cuya aplicacin consiste en compararcada uno de losframes(cada una de las imge-nes que componen un video) de una secuenciade imgenes con el frameinicial u otro que seescoja a conveniencia, de tal forma que en elvideo resultante, los elementos que permanezcanconstantes se vean de color negro, y los que hancambiado, de blanco o viceversa. Este procesocorresponde a la etapa de segmentacin y estbasado en tcnicas de deteccin de regiones quehacen uso de la binarizacin basada en umbrales(Vlez et al., 2003) y funciones estadsticas de

    densidad para establecer el modelo de fondo. Elresultado (manchas) de este proceso determinacules son los objetos de inters en la imagen.

    Anlisis de manchas (blob analysis). Elanlisis de las manchas primero requiere la sepa-racin del objeto del fondo. Usando una imagendigital binarizada (solo pxeles totalmente blan-cos o totalmente negros), se agrupan los pxelesdel objeto para formar un patrn. La geometra de

    objeto, localizarlo y examinarlo. Este es un mto-do simple, rpido y capaz de manejar cambios de

    rotacin y tamao. Este proceso corresponde a laetapa de descripcin, ya que permite determinarcules de los objetos de la escena correspondenal objetivo de estudio y cules pueden ser des-cartados (Gonzlez & Woods, 2001).

    Seguimiento a las manchas. Los objetosfsicos generalmente presentan un movimientosuave a lo largo del tiempo, como consecuenciade la inercia. El seguimiento visual de objetos sebasa fundamentalmente en esta consideracin.Un factor clave para conseguir que un compu-tador pueda seguir la posicin de los objetos enmovimiento, es la posibilidad de anticipar estemovimiento a partir de su caracterizacin previa.Esta informacin a priori se usa para que los algo-ritmos atiendan al objeto de inters (por ejemplo,una cabeza en una aplicacin de videoconfe-rencia, un intruso en un sistema de vigilancia)

    y no se distraigan con otros objetos presentesen la imagen. Junto a un modelo dinmico quedescriba la evolucin del movimiento a lo largodel tiempo, es fundamental disponer de un con-junto de observaciones sobre el desplazamientosufrido por los elementos de la imagen en varioscuadros, para plantear as el seguimiento. Losparmetros del algoritmo pueden estar referidosa su localizacin real en la escena (seguimiento3D) o bien al movimiento proyectado sobre elespacio de imagen (seguimiento 2D) (Pajares &

    De la Cruz, 2008).Regiones y puntos de medicin. Gracias al

    seguimiento de manchas es posible conocer laposicin de cada objeto de inters dentro de la

    usa esta informacin y se comparan esos datoscon los de cada objeto que ha ingresado en laescena, se pueden obtener y demarcar reas deespecial inters, por ejemplo, reas de mayor

    Para determinar esas reas, es importante los puntos de entrada y de salida de los objetos de

    G. Aplicacin

    -

    obtencin de la distancia de los objetos en la

  • 8/14/2019 Sistema de Conteo de Objetos en Movimiento

    7/1692

    escena y estructura tridimensional; deteccinde objetos en movimiento; reconocimiento depatrones y formas; y reconocimiento de objetostridimensionales. El sistema de este proyecto sepuede enmarcar en las tres ltimas, pues la solu-cin del problema requiere detectar los objetos,analizarlos y determinar si se trata de personas

    u otro tipo de objetos.Es posible detectar la presencia de objetos

    en movimiento mediante la comparacin de unasecuencia de imgenes obtenidas de la escenatridimensional en diferentes instantes de tiempo,para lo que se pueden utilizar diferentes tcnicas

    mtodo local (Lucas-Kanade) y el mtodo global(Gauss-Seidel). El tratamiento de secuenciastambin se utiliza para la deteccin de cambiosen diferentes ambientes.

    El reconocimiento de formas y patrones secentra en caracterizar los objetos por la forma de-terminada de su contorno, la cual detalla la reginque delimitan y sus propiedades subyacentes.

    Las tcnicas de obtencin de las formas, apartir de sombras (shape form shading), tambinse encaminan a la obtencin de la estructuratridimensional mediante el conocimiento de lailuminacin de la escena y la determinacin delpunto de observacin de la misma.

    3. Metodologa

    Los mtodos usados para dar cumplimento a

    personas de bajo costo, utilizando los mnimosrecursos de .

    Se analizaron las caractersticas de dife-rentes dispositivos de captura de imgenes y

    video, entre los que se tuvo en cuenta: cmarasIP, normalmente utilizadas en circuitos de vigi-lancia; cmaras web, utilizadas comnmente enordenadores porttiles y de escritorio; y cmarasanlogas de circuitos cerrados de televisin, lasms usadas en las aplicaciones actuales de reco-nocimiento de personas.

    Entre las caractersticas que se analizaronestn el costo monetario de los equipos, el apor-te que induce el dispositivo al desempeo de laaplicacin y la calidad de las imgenes propor-

    cionadas por el aparato de captura.

    de la cmara en la habitacin para obtener los me-jores datos de la escena. Para esto se deben rea-lizar tomas con la cmara ubicada en diferentes

    establecer una geometra estndar aplicable a lamayora de personas.

    -jetos que se encuentran en movimiento. Para estose evaluaron diferentes tcnicas de segmentacinde imgenes, haciendo especial nfasis en lasustraccin del fondo y tcnicas de binarizacinbasadas en umbrales. Tambin se tuvo en cuentalos antecedentes para determinar cules de ellasson ms usadas y favorecen a su vez el procesode deteccin de movimiento.

    cul de ellas corresponde a una persona. Paracumplirlo se utilizaron los resultados obtenidosen los numerales 2 y 3; adicionalmente se debeescoger un algoritmo de anlisis de manchas quesea adecuado para dicha situacin.

    -

    esto se utilizaron los resultados obtenidos en losnumerales 2 y 3 de esta seccin, y se estudiarondiferentes tcnicas de seguimiento de manchasque permitieran hacer el rastreo de los objetos

    -tema de conteo en diferentes campos de accin,y probarlo en diferentes espacios y condiciones.

    Una vez implementado un prototipo delsistema, se realizaron pruebas haciendo simu-laciones con videograbaciones para mostrarsu funcionamiento en diferentes condiciones.Adicionalmente, se propusieron diferentes reaspara su aplicacin, explicando el propsito que el

    sistema cumple en cada una de ellas (por ejem-plo, mercadeo, distribucin de espacios, manejo

    4. Desarrollo y resultados

    A continuacin se plasman algunos proble-mas y resultados obtenidos en el desarrollo.

  • 8/14/2019 Sistema de Conteo de Objetos en Movimiento

    8/1693

    H. Seleccin de los dispositivos de captura de

    imagen

    Los dispositivos objeto de comparacin fue-ron: cmaras IP, cmaras web y cmaras anlogasCCTV. Despus de una comparacin exhaustivase decidi usar cmaras IP o cmaras web enlugar de cmaras anlogas CCTV. Aunque hayvarios factores importantes para esta decisin,el de mayor peso es el factor costo. Las cmarasanlogas son ms costosas que las digitales. Lascmaras digitales tienen ventajas en su instala-cin, debido a su facilidad de conexin a travsde una red cableada Ethernet, una red inalmbricao a travs de puertos USB. Otra ventaja es quelas cmaras IP y web entregan la informacindirectamente en forma digital; se evita el inconve-niente de tener que usar una tarjeta PCI especial oimplementar un paso ms en el proceso de captura

    para convertir la seal anloga en digital.

    Por otra parte, el uso de las cmaras digitalesfavorece la escalabilidad del sistema, dado quepermite tener el control de varias cmaras endiferentes reas desde una sola unidad central

    lo cual es til si se desea realizar una implemen-tacin donde se necesite tomar informacin dediferentes lugares al mismo tiempo.

    I. Seleccin de la posicin de la cmara

    La seleccin de la posicin en que se debeubicar la cmara no es una tarea sencilla. De ella -pende la complejidad de la seleccin o descarte delos objetos de inters (Collins, Lipton & Kanade,1999). Por este motivo se deben analizar factorescomo: cul de las posiciones en las que se puedeubicar la cmara facilita el anlisis de la imagen;y cul de ellas ofrece la menor variabilidad en el

    tamao del objeto observado.En cuanto a la posicin, es necesario consi-

    derar que las escenas 3D pueden ofrecer mayoro menor cantidad de informacin dependiendodel ngulo en que se les mire, como se puede veren la Figura 4, que muestra dos vehculos desdediferentes ngulos.

    En esta imagen todas las vistas proporcionanla misma informacin para el ojo humano. Sinembargo, para una computadora los ngulossugeridos en las secciones (a) y (c) brindan unamejor manera de procesar la informacin, pues

    permiten diferenciar con facilidad cada uno de losobjetos por separado, mientras que la imagen enla seccin (b) hace necesaria la implementacinde un tipo de reconocimiento que pueda intuirla presencia de un objeto a partir de partes de suestructura, lo que implicara un mayor consumode recursos y el uso de tcnicas de inteligencia

    Figura 4.Informacin obtenida de una escena desdediferentes

    Fuente:elaboracin propia.

    Es preciso validar si la posicin seleccionada

    introduce algn tipo de deformacin a los objetosde inters de la escena. Los objetos que se quiereanalizar dentro de la imagen generan diferentessiluetas, dependiendo de la posicin de la cmara.La Figura 5 permite comparar nuevamente la for-ma en que se ve un auto desde diferentes vistas.

    El objetivo es el de estandarizar el rea queocupan los objetos de inters dentro de la imageny facilitar su reconocimiento

    Figura 5.Ejemplo de variacin del tamao de losobjetos dependiendo del ngulo en el que se observen

    Fuente:elaboracin propia.

    El anlisis descrito requiere un conocimientoprofundo de la morfologa de los objetos de inters,que permita realizar abstracciones que faciliten su -ters son las personas que, adems de tener carac-

    mltiples posiciones como, sentarse, acostarse,estar de pie o incluso inclinarse. Debido a estagran variabilidad, se debe restringir el dominio de

    de personas que transitan a travs de un espacio

  • 8/14/2019 Sistema de Conteo de Objetos en Movimiento

    9/1694

    cerrado, esta condicin disminuye el nmero de

    generalmente de pie. Teniendo esto en cuenta, seprocede a evaluar los aspectos necesarios paraseleccionar la posicin de la cmara, tal como sehizo en el ejemplo de los automviles. En el casode las personas se decidi que la mejor forma de

    ubicar la cmara sera una posicin cenital, todavez que desde esta perspectiva las siluetas de laspersonas pueden abstraerse a una forma de rectn-gulo (ver Figura 6).

    En esta posicin, adems, la variabilidad dela forma de los individuos es menor que si se ob-servaran de frente, ya que las personas son msdiversas en estatura (nios, adultos, ancianos,personas en sillas de ruedas, etc.) que en el anchode su espalda o la longitud que existe entre la partefrontal y trasera del cuerpo. Para poder realizar un

    reconocimiento preciso es necesario establecer lasmedidas estndar de las personas en esta vista,tema que se desarrolla en la seccin C.3.

    Figura 6.Abstraccin de las personas en la imagen

    Fuente:elaboracin propia.

    J. Modelo del sistema propuesto

    Figura 7.Diagrama de actividades del sistema propuesto

    Fuente:elaboracin propia.

    3. Sustraccin del fondo (background substraction)

    Al retirar el fondo, la imagen resultantemostrara nicamente el primer plano en unarepresentacin binaria (Collins et al., 1999). LaFigura 8 muestra la imagen de salida cuando elfondo (primer cuadro) se ha restado del segundocuadro. En el tercer cuadro se muestran los ob-jetos en primer plano, que a menudo se conocencomo manchas.

    Algunas de las tcnicas disponibles paraeste procesamiento son: funciones Gaussianas,Histogramas, Kernel Estimation Density (KDE),etc. Igualmente existen diferentes algoritmos de

    Figura 8.Sustraccin del fondo, imagen a procesar

    Fuente:

    Sin importar la tcnica usada, lo primordiales obtener las manchas del primer plano, con una

    tamao y zona ocupada.Es necesario, adems, que el mtodo de

    substraccin sea muy rpido, pues de no serlo, elresultado del proceso ser una imagen totalmenteen blanco o totalmente en negro, dependiendo dela lgica usada en la representacin de los objetosdel primer plano (Viola & Jones, 2001). Por talrazn, en la aplicacin creada, se agreg en esteproceso una variable ms, que consiste en una

    proceso de actualizacin del fondo de la imagen

    sea ms rpido o ms lento.

    4. Anlisis de manchas

    El anlisis de manchas implica el examende la imagen binarizada para diferenciar enella todos los objetos en primer plano individual(manchas). En algunos casos esta tarea puedeser bastante difcil, incluso para el ojo humano.

    La Figura 9 muestra dos manchas fcilmente -zan visten colores similares a las del fondo, las

  • 8/14/2019 Sistema de Conteo de Objetos en Movimiento

    10/1695

    manchas resultantes despus de eliminar el fondopueden quedar distorsionadas o con agujeros enel centro, de forma similar a lo que se puede veren la Figura 10.

    Figura 9.Manchas fcilmente diferenciables

    Fuente:

    Figura 10.Manchas distorsionados

    Fuente:

    Estas distorsiones pueden ocasionar que elsistema interprete una mancha de mayor tamao,como un conjunto de manchas ms pequeas (verFigura 11).

    Figura 11.Mancha fragmentado

    Fuente:

    En algunos casos, los bordes de la mancha seconvierten en partes poco claras, y ciertas partesa menudo aparecen como pequeos rasguos,considerados regularmente como ruido. Unamancha con bordes distorsionados se muestraen la Figura 12.

    Figura 12.Manchas afectadas por el ruido

    Fuente:

    La gente que permanece en grupos es difcilde manejar, incluso para el ojo humano. Cuandoestn juntos forman una gran mancha (ver Figura

    13). Es difcil determinar con precisin cuntas

    manchas existen realmente en la imagen. LaFigura 14 muestra cmo los objetos en primerplano se pueden dividir en seis manchas.

    Figura 13.Mancha generada por la presencia devarios objetos juntos

    Fuente:

    Figura 14.Subdivisin de manchas muy grandes

    Fuente:

    Puede parecer sencillo dividir las manchasgrandes en piezas ms pequeas, aprovechando

    propiedades como la altura y el ancho, pero esteproceso requiere de varios clculos en cuantoa reas, bordes y proximidad entre las mismas.Adems, existe la posibilidad de que no todas lasmanchas grandes sean personas; por ejemplo enun supermercado, los clientes pueden empujarcarros de compras delante de ellos. Estos carrospueden ser del mismo tamao de un ser humano,como se ve en la Figura 15.

    Figura 15.Mancha de una persona junto con un carrito

    Fuente:

    Parte de los problemas descritos son resueltospor el proceso de sustraccin del fondo y a travs

    de las imgenes.

  • 8/14/2019 Sistema de Conteo de Objetos en Movimiento

    11/1696

    Figura 16.Dimensiones del rectngulo envolventeque representan una persona en el sistemapuesto

    Fuente:elaboracin propia.

    Figura 17.Medidas antropomtricas equivalentes a

    las dimensiones del rectngulo envolvente

    Fuente:elaboracin propia.

    Tabla 1.Promedio de las medidas de X y Y en hom-bres y mujeres de Colombia

    Fuente:elaboracin propia.

    5. Determinacin del espacio real ocupado

    por un objeto

    Al observar las personas desde una perspec-tiva cenital, los datos obtenidos corresponden alancho y alto del rectngulo envolvente (box) que representa una persona en la imagen.Para determinar las dimensiones de ese rectngu-lo es necesario establecer la medida promedio delas personas, como se muestra en la Figura 19.

    Estas medidas X y Y corresponden al anchode la espalda de una persona (X) y a la distanciaque existe entre el pecho y la espalda (Y) (verFigura 20). Estas medidas varan mucho de una

    de los objetos como personas, pues habra quetener registradas todas la posibles combinacionesde X y Y en el mundo. En lugar de eso, se esta-

    bleci un rango de medidas promedio con baseen estudios antropomtricos.

    Los resultados de estos estudios se muestranen la Tabla 1. Cabe aclarar que las magnitudesexpuestas en esta tabla corresponden a lo encon-trado en literatura y estudios previos, y no a unanlisis profundo de las medidas del cuerpo hu-mano. Adems, corresponden a investigacionesrealizadas en Colombia, por lo que estas medidaspueden variar de un pas a otro.

    Determinar este tipo de medidas corres-ponde al rea de la antropometra y requiere deun trabajo estadstico arduo que est por fueradel alcance de este documento. Sin embargo,es bueno recordar que la parametrizacin del

    con datos de mayor veracidad, llevar

    objetos de inters.

    6. Determinacin del tamao de un objeto en

    la imagen

    En una imagen digital el ancho (X) y alto(Y) de una persona se mide en pxeles. Estoimplica determinar un factor de conversin. Noobstante, para poder establecer el tamao de unobjeto en pxeles a partir de una imagen digital,se debe tener en cuenta que no todas las cmaras

    tamao del lente, ngulo de apertura, etc., y,

    la foto resultante presentar variaciones. Por lotanto, es necesario conocer algunos conceptosde fotografa:

    Profundidad de campo.Se denomina as atodo el espacio en una fotografa que se encuen-tra enfocado o, al menos, a toda la zona de la

    bueno como para distinguir los objetos de unamanera ntida. Dependiendo de la profundidad de

    campo, existen distintos planos de enfoque. Hayuna zona donde se encuentra el mayor grado deenfoque o. Por delante y por detrs de estefoco, aparecen diferentes planos de enfoque quese encuentran ms o menos enfocados.

    En el caso del sistema de conteo de personas,se necesita que la imagen tenga una profundidadde campo que abarque todo el espacio o escena.Para lograr esto, el diafragma de la cmara se

    se mide la apertura del diafragma de la cmara)

    alto, es decir, con una apertura pequea. Por lo

  • 8/14/2019 Sistema de Conteo de Objetos en Movimiento

    12/1697

    Figura 18.Relacin entre la apertura del diafragma

    y la profundidad de campo

    Fuente:http://2.bp.blogspot.com/-6A1LlUOJ338/ULWuk15XR8I/AAAAAAAAAI0/-T9WnXEOAYY/s1600/profun+campo.jpg.

    Figura 19.Ejemplo de perspectiva (a) y (b)

    Fuente: http://www.funny22.com/wp-content/uploads/2012/06/family-illusion-4.jpg.

    Fuente: http://static0.blip.pl/user_generated/update_pictures/2161107.jpg.

    Figura 20.Principio de la cmara estenopeica

    Fuente:

    general, en las cmaras webla apertura del dia-fragma no se puede cambiar y, por defecto, esuna apertura pequea que permite enfocar todala escena. Por esto, para las pruebas realizadasen este proyecto no representa mayor problema.

    Perspectiva.Es bsicamente la ilusin visualque, percibida por el observador, ayuda a determi-nar la profundidad y situacin de objetos a distin-tas distancias. Gracias a ella se puede distinguircules objetos estn ms cerca y cules ms lejos.En fotografa y video hay que tener en cuentaeste concepto, ya que, en un plano horizontal, ydependiendo de la distancia del objeto al lente,su tamao va a variar en la imagen, hacindosems pequeo a mayor distancia.

    establecer medidas estndar para una persona yaumenta los clculos a realizar. Este problemadesaparece al utilizar la cmara en posicin ceni-tal, apuntando hacia el suelo en un plano vertical,donde los objetivos estn sobre un lmite: el piso.De esta manera, las personas permanecen a unamisma distancia de la cmara.

    7. Clculo del tamao de un objeto en pxeles

    Cuando se toma una imagen con una cmara,se utiliza el principio de la cmara estenopeica.Esta es, bsicamente, una caja con un agujerode unos 0.5mm, por donde entra la luz, y una

    Entonces, si se enfoca un objeto delante de la

    dentro de la caja, en la cara contraria se formaruna imagen invertida del rbol, ya que la luz sepropaga en lnea recta, lo que hace que los rayosincidentes de la copa del rbol se proyecten enla parte inferior de la caja.

    En realidad, las cmaras actuales ya nofuncionan con el mismo mecanismo, sino que

    reemplazan el agujero con el uso de lentesconvergentes, que hacen que los rayos de luz seconcentren y converjan proyectando la imagena un sensor. El mecanismo es diferente, pero elprincipio se conserva.

    Utilizando este principio se obtiene la si-guiente ecuacin (E1):

    Altura Objeto

    distancia Objeto Lente

    Altura Imagen

    distancia Focal=

    (E1)

  • 8/14/2019 Sistema de Conteo de Objetos en Movimiento

    13/1698

    Donde:

    Altura Objeto. Altura en (mm) del objeto.

    Distancia Objeto Lente. Distancia del Objetoenfocado al lente de la cmara.

    Altura Imagen. Altura de la imagen en el sensor.

    Distancia Focal. Es la distancia entre el centroptico de la lente o plano nodal posterior y el foco.

    Por otro lado tenemos que:

    Altura Objeto

    distancia Objeto Lente

    Altura Imagen

    distancia Focal=

    (E1)

    Donde:

    #pxeles Imagen. Es el nmero de pxeles delobjeto en la fotografa.

    Tamao del pxel del sensor. Es el tamao

    La altura del objeto y la distancia del objetoal lente se pueden medir fcilmente y la distan-

    cmara. La altura de la imagen es el nico datoindeterminado, dado que no se conoce el nmerode pxeles que ocupa en la imagen (dato a hallar),pero s se puede conocer el tamao del pxel enel sensor, el cual tambin debe aparecer en las

    Por lo cual, a partir de (E1) y (E2) se obtiene

    (E3)

    Altura Objeto * distancia Focal

    distancia Objeto * tamao Pxel Sensor

    =#pixeles Imagen

    Aplicando esta ecuacin para el alto y elancho se puede hallar la medida de un objeto ouna persona en una imagen.

    En caso de no contar con todos los factorespara realizar los clculos de la anterior ecuacin,lo ms fcil es medir en la escena dos objetosde los cuales se conoce su tamao, a una mismadistancia y a travs de comparacin y una reglade tres deducir el dato.

    Debido a la variedad de dispositivos dispo-nibles, lo ideal en eles incluir controlesque permitan calibrar estos datos en tiempo real,de forma que este se adapte mejor a las condi-

    ciones del entorno.

    8. Seguimiento de manchas

    El mdulo de seguimiento de manchas per-

    el objetivo de no contar como nuevos aquellosdentro de la escena que ya han sido detectados yque solo se han desplazado en la imagen.

    El seguimiento de manchas etiqueta cada uno

    adjuntar a la mancha similar o igual en el cuadro

    como algo similar en dos imgenes? Depende delalgoritmo empleado. En el caso que se presenta,se tienen en cuenta dos factores, el tamao del

    La primera comparacin que se hace es la delfondo substrado versus la imagen en movimien- -

    chas. Luego,frameporframe, se comparan lasimgenes y de acuerdo con la proximidad de loscentroides de las manchas, es posible mantener elrastro de cada uno. La Figura 21 muestra tres ob-jetos detectados. Estos se mueven en direccionesdiferentes. El cuadro siguiente muestra cmo las -ciones. Las manchas desvanecidas representan elcuadro anterior, mientras que las manchas negrasmuestran la nueva posicin del objeto.

    Figura 21.Seguimiento de manchas, primera imagenizquierda y segunda imagen derecha

    Fuente:

    K. Implementacin tcnica

    Tecnologa usada. El proyecto se desarrollen el lenguaje de programacin c++, debido a sunivel medio-bajo, que permite un mayor controlsobre el uso de la memoria.

    Proceso de ejecucin del programa. El pro-

    grama consta bsicamente de tres procesos que

  • 8/14/2019 Sistema de Conteo de Objetos en Movimiento

    14/1699

    realizan toda la operacin del sistema: inicializa-cin de las variables, actualizacin de la escenay tratamiento de las imgenes (implementacin

    A continuacin se indican paso a paso lasactividades que realiza el programa cuando seejecuta:

    Inicializacin de las variables.En esta etapase parametriza el sistema, dndole valor iniciala aquellas variables que el programa utiliza pararealizar su tarea: tamao de las personas en laescena, resolucin de la cmara, establecimiento

    tasa de refresco del fondo de la imagen, debido aque la imagen y los elementos del fondo puedenir cambiando con el tiempo.

    La pantalla principal muestra la visualiza-

    cin de la cmara y el video convertido a escalade grises. En esta pantalla estn las opciones

    transformaciones.

    Tratamiento de las imgenes.Primero seobtiene el fondo de la escena, que es la primeraimagen que toma la cmara. Luego, se obtienenlos pxeles de las siguientes imgenes, paraconvertirlos en un objeto de tipo imagen, el cualpuede variar dependiendo de la librera de pro-gramacin que se utilice.

    Despus de obtener la instancia de la ima-gen, esta se convierte a escala de grises (es msfcil trabajar un solo canal en vez de tres, comolo es RGB). Luego de obtener la siguiente ima-gen, se realiza la diferencia entre el fondo y laimagen que se est capturando en el momento.

    segmentan la imagen destacando los objetos de

    Filtro de erosin .Corres- -ma de los objetos en una imagen, por la erosin(reduccin) de los lmites de los objetos brillantesy la ampliacin de los lmites de los oscuros.Se utiliza para reducir, o eliminar, los pequeosobjetos brillantes.

    Suavizado (Smooth). Filtros de suavizado,

    conservan componentes de baja frecuencia yreducen los componentes de alta frecuencia.

    Filtro de paso alto (HighPass)

    frecuencias altas, pero atena (es decir, reducela amplitud de) las frecuencias ms bajas. Lacantidad real de atenuacin para cada frecuencia

    Blurhigh Pass o Gaussian Blur.Tambinconocido como suavizado de Gauss, es el re-sultado de difuminar la imagen por una funcingaussiana. Es un efecto ampliamente utilizado

    reducir el ruido de la imagen y reducir el detalle.El efecto visual de esta tcnica es un desenfoquesuave parecido al que resulta de ver la imagen atravs de una pantalla translcida.

    Umbral Durante el procesode umbral, los pxeles en una imagen se marcancomo objeto si su valor es mayor que cierto va-lor umbral (suponiendo que un objeto sea ms

    brillante que el fondo) o como fondo en casocontrario (su valor de intensidad es menor queel umbral). Por lo general, a un pxel objeto se

    se obtienen una imagen binaria compuesta porcada pxel de color blanco o negro.

    L. Pruebas

    La Tabla 2 muestra los resultados de las

    pruebas realizadas con el programa.

    Tabla 2.

    *Se utiliza una imagen esttica en el fondo.

    Fuente:elaboracin propia.

  • 8/14/2019 Sistema de Conteo de Objetos en Movimiento

    15/16100

    Figura 22.Prueba 1. Objetos robots

    Fuente:elaboracin propia.

    Figura 23.Prueba 2. Fondo

    Fuente:elaboracin propia.

    Figura 24.Prueba 2. Reconocimiento

    Fuente:elaboracin propia.

    Figura 25.Prueba 3. Reconocimiento (b)

    Fuente:elaboracin propia.

    Tabla 3.Resultados

    Fuente:elaboracin propia.

    Se observa que cuando dos individuos sejuntan, las manchas se traslapan y el rastro sepierde. Es necesario dividir esa forma y mantenerel rastro. Para ello y de acuerdo con los resul-tados, se observa que en la unin de manchasse genera una forma con ngulos cncavos, loscuales pueden usarse para determinar el puntode separacin. Esto ser tenido en cuenta para

    prximas versiones del prototipo.

    Un problema que queda por resolver son lasvariaciones de luz dentro de la escena, pues esun elemento del ambiente que muchas veces nopuede ser controlado y que cambia de maneradrstica la forma en que debe ser parametrizadoel sistema.

  • 8/14/2019 Sistema de Conteo de Objetos en Movimiento

    16/16

    Conclusiones

    bsica, con el uso de los elementos imprescindi-bles descritos en el marco terico: un computa-dor, un sensor y un algoritmo de procesamiento,como el descrito en este documento.

    de objetos, podra parametrizarse, de diferentesmaneras, para que en la etapa de descripcin sereconozca un objeto en especial. En este docu-mento, las pruebas se realizaron con personas,pero como se describi con el ejemplo de losautomviles, las posibilidades son muy variadasen cuanto a los campos de accin y los diferentesambientes en que se use.

    Por ltimo, se puede concluir que, habiendo informacin a obtener de la imagen, se pue-den lograr resultados de conteo muy certeros.Igualmente, encontramos que el proceso para elsistema propuesto puede llegar a tener mejorassustanciales y resultados ms precisos, si se in-

    aqu mencionados.

    Referencias

    . Gothenburg: Chal-mers University of Technology.

    Cantoni, Virginio, Levialdi, Stefano & Vito,Roberto. (1996).

    . Academic Press.

    Collins, R., Lipton, A. & Kanade, T. (1999). .American Nuclear Soc. 8th Int. Topical Meeting

    on Robotics and Remote Systems.Conrad, Gary & Johnsonbaugh, Richard.

    (1994). . SAC 94:Proceedings of the 1994 ACM symposium onApplied computing. New York.

    Doshi, Anup. (2005). .

    Gonzlez, Rafael C. & Woods, Richard E.(2001). . Prentice Hall.

    Haritaoglu, I., Harwood, D. & Davis, L. S.(1998). .

    Jain, Anil K. (1989). . Prentice Hall.

    Kim, Jae-Won, Choi, Kang-Sun, Choi,

    Byeong-Doo & Ko, Sung-Jea. (2002).

    . Seoul: Korea University, Anam-dong, Sungbuk-ku.

    Krumm, J., Harris, S., Meyers, B., Brumitt,B., Hale, M. & Shafer, S. (2000). . VS00:Proceedings of the Third IEEE InternationalWorkshop on Visual Surveillance (VS2000).Washington, D. C.

    Lipton, A., Fujiyoshi, H. & Patil, R. (1998). . Proc. of the Workshop on Appli-cation of Computer Vision. IEEE.

    Pajares Martinsans, Gonzalo & De la CruzGarca, Jess M. (2008).

    . 2 ed. Madrid:RA-Ma Alfaomega.

    Siebel, N. & Maybank, S. (2002).Fusion of

    .

    Sigvaldason, Einar. (2002). .

    Sourabh, Daptardar & Makarand, Gawade.(2007). .

    Teixeira, Thiago & Savvides, Andreas.(2007).

    Viola, Paul & Jones, Michael (2001).

    . International Journalof Computer Vision.

    Yang, Danny B., Gonzlez Baos, Hctor H.& Guibas, Leonidas J. (2003).

    . Proceedings of Ninth IEEEInternational Conference on Computer Vision.

    Vlez Serrano, Jos F., Moreno Daz, AnaB., Snchez Calle, ngel & Snchez Marn,Jos L. E. (2003). . 2 ed.

    Universidad Rey Juan Carlos.