- Resumen
- Introducción
- Estructura del software
- Estructura del campo visual
- Detección de objetos en movimiento
- Extracción de características y clasificación
- Implementación y resultados
- Conclusiones
- Referencias
Resumen
En este documento se presenta un informe de las diversas formas de visión artificial, sus diferentes usos y aplicaciones, como por ejemplo la visión artificial aplicada a la detección de transeúntes para que de esta manera con poco personal humano se pueda realizar un trabajo amplio que originalmente requeriría muchas personas.
PALABRAS CLAVES: Procesamiento de imágenes, seguimiento visual, conteo de personas, detección de flujo vehicular.
Introducción
El proceso general que realizaremos es la de detectar el movimiento ya sea de personas u otro objeto mediante el uso de aparatos electrónicos o software como por ejemplo el Display IMG, TeamSoftware, Irmotion, Goratech Ireport. De esta manera facilitaremos el trabajo de las personas ya estas no tendrán que estar todo el tiempo tras las cámaras de vigilancia.
Sea cual sea el mecanismo o software que vayamos a utilizar debe poseer la capacidad de detectar, analizar e informar sobre cualquier evento que suceda en área determinada [1] [2] [3].
Los sistemas de visión artificial deben tener la gran capacidad de detectar objetos tal y cual como lo hacen los seres humanos, mediante la detección de objetos estos deben tomar decisiones pero esto ya se vincula con la inteligencia artificial que en este caso no hablares mucho de ello [4].
En la siguiente figura (Fig. 1) se indica la estructura implementada en el software de visión artificial, este diagrama se explica desde arriba hacia abajo, en esta se dice que existen tres perfiles de usuario:
Básico, intermedio y avanzado [5].
Fig. 1 estructura del software
Estructura del campo visual
Esto hace referencia a la imagen plana que refleja una escena generalmente tridimensional, para esto se han usado sensores foveales los cuales presentan un perfil de resolución variable a lo largo del campo de visión. Al realizar esto permite que la percepción y al ambiente visual en el que estamos trabajando sean coordinados y que se dé una mejor interacción, gracias a esto podremos recibir las imágenes más detalladas pero sin perder de vista el campo visual en que estamos [6].
De la misma manera podemos aplicar esto para detectar el densidad de peatonal en tiempo real, de esta manera podremos detectar aumenta densidad de personas en ciertas horas del día y sin la necesidad de que alguna persona este sentado todo el día enfrente de una cámara de vigilancia para realizar todo esto se presenta el siguiente diagrama de bloque detallando cada una de las etapas [8]:
Detección de objetos en movimiento
Cunado un objeto está en movimiento estos producen cambios de intensidad debido a los reflejos producidos por la luz, eso significa que si analizamos dos imágenes sucesivamente esto producirán cambios de intensidad tanto en objetos móviles como estáticos [8][9].
También presentamos una propuesta para el reconocimiento invariante de objetos que está basada en el uso de formas cónicas dentro de la base más simple de conocimiento, esto se puede representar mediante un vector que se llama [CDF&POSE] [9].
Generación del vector descriptivo [CDF&POSE]:
Cuando la información ya ha sido procesada se conforma el vector descriptivo que en realidad es la entrada a la red neuronal.
1. Detección de movimiento invariante a la luz:
3. Clasificación
Extracción de características y clasificación
Descriptores de Fourier
Mediante esta descripción se trata de extraer imágenes a partir de imágenes bizarras utilizando un análisis de conectividad, para esto primero se utilizan detectores de bordes. Los descriptores de Fourier se caracterizan por ser invariantes a transformación es geométricas y tolerantes al ruido [10]. Cuando se trata de una superficie cerrada la serie de Fourier se la puede representar con una adecuada parametrizacion
z(k) = [Xk,Yk], k=1.2……N (1)
z(k) = Xk + jYk (2)
la transformada discreta de Fourier de a(n)=z(k) es:
Implementación y resultados
Para la implementación de la visión artificial se utilizó una PC con un procesador Intel Pentium IV de 2.8 GHz y 512 MB de memoria RAM en un sistema operativo de Windows XP. La aplicación se la realizo en la plataforma de LabVIEW 8.0 de National Instruments.
La siguiente imagen se la capto con una cámara Web convencional o sea común y corriente la cámara estaba a 3.5m del suelo en una posición acimutal, captando una área de 9 metros cuadrados [8].
Se realizaron varias pruebas para una mejor verificación de resultados con diferentes velocidades de muestreo 7.5, 15, 30 pies, pero lastimosamente no se pudo hacer pruebas en tiempo real debido al software que se utilizó. Para la distancia de 15 y 30 pies se obtuvieron resultados estadísticamente equivalentes por lo daba igual los datos a 15 pies que los datos a 30 pies.
Las pruebas se realizaron en ambientes estáticos en donde no haya más movimiento que la que produce el objeto que estamos analizando, esto es un gran problema ya que en un ambiente real van a existir muchos objetos en movimiento y tratar de analizar uno en específico nos resultara muy difícil [8].
Conclusiones
Con toda la información que presentamos anteriormente tratamos de demostrar la importancia que tiene la visión artificial que es una parte que abarca la inteligencia artificial, pero de igual manera no deja de ser importante ya que gracias a la visión artificial podemos crear mecanismos que realicen trabajo no por el simple hecho de recibir órdenes si no que son capaces de visualizar su objetivo, tomar decisiones y ejecutarlas.
En este artículo también se trata de explicar un poco más sobre los proyectos que involucran la visión artificial, como por ejemplo aplicada en la detección de peatones.
Pero todo esto solo es un trabajo de investigación ya que todo lo realizado es simplemente una recopilación de información o experimentos que ya fueron realizados.
Referencias
[1] Hughett. P, "A programable command interpreter to automate image
processing of infrared thermography",SPIE Vol 1467, Thermosense XIII,1991.
[2] Ballard, D. y Brown, C. (1982) Computer Vision, Prentice
[3] Hughett. P, "A programmable command interpreter to automate image
processing of infrared thermography",SPIE Vol 1467, Thermosense XIII,1991.
[4] Tombropolous,R.Z., J.R. Adler et al. (1999), »Carabeamer : A treatment planner for a robotic radiosirurgical system with general kinematics », Medical Image Analysis 3(3) : 237,264.
[5] Hern´an Ben´itez,Humberto Loaiza,Bladimir Vacca,Javier Acevedo
[6] Arrebola, F., Urdiales, C., Camacho, P. y Sandoval, F.,
(1998) "Vision system based on shifted fovea
multirresolution retinotopologies", Proc. of the 25th
Annual Conf. IEEE Ind. Electronics Soc., 3, pp. 1357-
1361, Aachen-Alemania.
[7]A. Bandera, C. Urdiales, J.L. Herreros y F. Sandoval
Dpto. Tecnología Electrónica, E.T.S.I. Telecomunicación
Universidad de Málaga, Campus de Teatinos, 29071 Málaga, España
[8] Scientia et Technica Año XIII, No 35, Agosto de 2007. Universidad Tecnológica de Pereira. ISSN 0122-1701
[9]Mario Peña Cabrera1, Ismael López Juárez2, H. Gómez N1., R. Osorio C.1, Oleg Sergiyenko3
1 Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas (IIMAS-UNAM)
Circuito Escolar, Cd. Universitaria, D.F. CP 4100,México.
2 CINVESTAV, Saltillo , Coahuila, México.
3 Engineering Institute, Autonomous University of Baja California, Mexicali, Baja California, México.
[10]E. G, V. F. Batlle. A. A: Oliver y L. S. "Descriptores de Fourier para identificacin y posicionamiento de objetos en entornos 3D". In Proc. 2004 XXV Jornadas de Automatica Cuidad Real. España, pp 8-10.
Autor:
Oscar David Sari Villa
UNIVERSIDAD POLITÉCNICA SALESIANA
Carrera de Ingeniería Electrónica Y Telecomunicaciones