Antecedentes El acceso al mundo computacional y virtual se ha hecho prácticamente indispensable para la ejecución de tareas diarias. En Ecuador el 13,2 % del total de la población sufre alguna discapacidad (CONADIS),es decir más de 1,6 millones de ecuatorianos requieren protección especial. Uno de los más importantes dispositivos de apoyo para personas con discapacidades son los instrumentos de comunicación con computadores o similares. El principal problema es controlar las dificultades debido a las habilidades físicas limitadas de los usuarios. Diferentes tipos de interfaces han sido desarrolladas para facilitar la comunicación entre usuarios discapacitados y dichos dispositivos.
Objetivos OBJETIVO GENERAL Realizar un sistema que permita el manejo del mouse de un PC a partir de la detección del movimiento ocular garantizando el uso de personas discapacitadas.
Ojo Humano El ojo humano es un órgano esférico detector de luz que posibilita la visión, su función es la de captar colores y formas de objetos presentes en el exterior, por medio de estímulos luminosos que son transportados al centro nervioso de la visión en el cerebro.
Conceptos Mouse: Periférico de entrada para interactuar con la computadora a través de un puntero mostrado en pantalla en sistemas GUI. GUI: Interfaz Gráfica de usuario, conjunto de formas y métodos que posibilitan la interacción de un sistema con los usuarios utilizando formas gráficas e imágenes (botones, íconos, ventanas, fuentes, etc.) API: Conjunto de funciones contenidas en bibliotecas que permiten que una aplicación se ejecute en el sistema operativo Microsoft Windows. Son diseñadas en C y C++. Sus versiones son Win16, Win32, Win32s, Win64. Permite a los desarrolladores crear software usando dichas funciones.
Visión Artificial Permite optimizar procesos donde se requiere el uso del ojo humano, de éste modo se ha logrado mejorar la calidad y velocidad de los procesos. Alta velocidad de respuesta, lo que hace posible mediciones sin contacto en tiempo real. Visión Artificial se define como un campo de la Inteligencia Artificial que, mediante la utilización de las técnicas adecuadas, permite la obtención, procesamiento y análisis de cualquier tipo de información especial obtenida a través de imágenes digitales. El propósito de la visión artificial es programar un computador para que "entienda" una escena o las características de una imagen.
Formación de Imágenes Una imagen es una representación visual de un objeto iluminado por una fuente radiante. La naturaleza básica de una imagen se caracteriza por dos componentes que son iluminación y reflactancia. Iluminación es la cantidad de luz incidente que procede de la fuente de la escena contemplada, denotándose como i(x,y). Reflactancia es la cantidad de luz reflejada por los objetos de la escena; denotándose como r(x,y). Ambas se combinan como producto para dar como resultado la imagen, denotándose como f(x,y).
Formación de Imágenes La imagen digital que se forma puede ser representada por una matriz f de dimensiones NxM de la siguiente forma:
Donde cada elemento o pixel da la intensidad de la imagen en ese punto, como ejemplo la representación matricial, de una parte de la imagen, de dimensiones 5×5.
Procesamiento de Imágenes Su objetivo es mejorar el aspecto de las imágenes y hacer más evidentes ciertos detalles que se desean hacer notar. Técnicas de procesamiento: Segmentación, morfología, procesamiento de histograma.
La Cámara Web Periférico de entrada usado para capturar imágenes y videos con la finalidad de almacenarlos, editarlos o transmitirlos a otro equipo o red. La técnica apta para la creación de la herramienta es la de detección por video basada en pupila y reflexión córnea, pues permite medir el punto de interés, es decir el lugar exacto a donde el ojo está mirando. La cámara web intervendrá como sensor del movimiento del ojo.
Técnica de Desarrollo
Periférico Alternativo DECISIONES DE DISEÑO Movimiento de la cabeza: Representa una desventaja ya que se requiere que el usuario mantenga la cabeza firme con el fin de captar con exactitud los datos. Otro problema es la forma en el que el ojo se mueve, el sistema podría terminar actuando sobre comandos que el usuario no tenía la intención de realizar; se debe resolver los comandos significativos a partir de observaciones simples, o movimientos no significativos. Otra solución es manejar la detección de parpadeo como la base para los comandos de interacción, como los son clic y doble clic.
Elección de la Cámara Web Precio relativamente bajo. Sensor: CMOS, realiza la digitalización píxel a píxel, el resultado que entrega está ya digitalizado. Filtro infrarrojo, en el proyecto se retiró el filtro mencionado y se reemplazó por un negativo fotográfico. Grabación de video DivX, formato de vídeo que es compatible con Windows. Compatible con S.O. Windows XP-SP2/Vista/Win7, Max. resolución dinámica: 5.0M píxeles 320×240, resolución del video, el cual fue considerado para obtener el punto centro y poder realzar la calibración para iniciar la ejecución del herramienta.
Modificaciones a la Cámara Web Retirar los tornillos y abrir la cámara. Desmontar con precaución la parte frontal hasta el CMOS. Localizar el lente del sensor de luz y se retirar el lente donde se encuentra ubicado el filtro infrarrojo.
Modificaciones a la Cámara Web Retirar el lente y posteriormente el filtro infrarrojo. El negativo fotográfico debe sustituir al cristal retirado
Modificaciones a la Cámara Web Reensamblar la cámara y se puede apreciar el resultado de la modificación
Iluminación de la Imagen La iluminación de la imagen en uno de los puntos más críticos del proyecto, ya que ésta es muy dependiente del factor ambiente. Para la detección de la imagen del ojo, es notorio que se tendrá varios escenarios dependiendo si se usa la herramienta durante el día o la noche.
Página siguiente |