Descargar

Tratamiento digital de voz e imagen


  1. Tipos de señales
  2. Categorías
  3. Aplicaciones
  4. Conclusiones
  5. Referencias

Desde sus inicios se han creado numerosas aplicaciones tecnológicas tanto para el tratamiento de información como de las comunicaciones. Existen muchos servicios basados en las telecomunicaciones que hacen la vida mucho más fácil y nos permiten obtener información de muchas fuentes entonces aquí evolucionan combinando la voz o sonido con la imagen.

La voz es un sonido que se produce por las vibraciones de las cuerdas vocales emitidas por el ser humano para hablar, cantar, reír, llorar, etc., estas son emitidas o enviadas al cerebro.

La señal de audio consiste en la representación de una señal eléctrica en una señal sonora y se realiza de manera binaria, que es el lenguaje que entienden todos los sistemas de información para establecer una comunicación. A esta representación se le conoce con el nombre de cuantificación. Finalmente, para poder transmitir esta secuencia binaria, es necesario adaptarla al medio de transmisión; es por ello que se utiliza una codificación adecuada para no tener pérdidas de datos binarios. [1]

Tipos de señales

Existen varios tipos de señales que permiten que la información viaje a través de un sistema de telecomunicaciones en forma de señales eléctrica y electromagnética. En tratamiento de señal se clasifican en: señales unidimensionales, señales bidimensionales, tridimensionales.

edu.red

Ilustración 1. Ejemplo de tipos de señales

Fuente. Marcos Faundez

Procesamiento digital de señales de voz o sonido.

edu.red

Ilustración 2 ProDivo

Fuente. Wikipedia

La voz es uno de los medios de comunicación más antiguo y natural que existe de comunicación entre los seres vivos además se está haciendo más frecuente que las comunicación se realicen por una máquina, este medio de comunicación debe estar obligado adaptarse a la tecnología y por ello se han creado dispositivos, herramienta y otro tipo de medio de transmisión en donde esta señal analógica viaja y así mismo es transformada en digital.

Nuestro medio de comunicación más antiguo es conocido como la voz y a medida que evolucionamos también evoluciona con nosotros al pasar del tiempo, pero así como evolucionamos los medios de comunicación o la tecnología también y de esta forma se van adaptando los dispositivos a convertir nuestra voz de analógica a digital.

Existen muchas aplicaciones que intervienen en las señales de voz

"El procesamiento de voz es el estudio de las señales de voz y las técnicas de procesado de estas señales". [2]

Las señales de voz son señales digitales ya que estas deben ser llevadas a una computadora para realizar un análisis y procesamiento de estas señales

Las señales son normalmente procesadas a partir de una representación digital; por eso el procesado de voz puede verse como la intersección del procesado digital de señal y el procesamiento de lenguaje natural.

Categorías

El procesamiento de voz se puede dividir en las siguientes categorías: "a)Reconocimiento de voz, que trata el análisis del contenido lingüístico de una señal de voz; b)Reconocimiento de locutores, que tiene como objetivo identificar al hablante; c)Mejora de la señal de voz, por ejemplo reducción de ruido; d)Codificación de voz para compresión de datos y transmisión de la voz; e)Análisis de voz con propósitos médicos, para el análisis de disfunciones vocales; d)Síntesis de voz: la síntesis artificial del habla, lo que habitualmente significa habla generada por computador". [3]

Aplicaciones

Tratamiento digital de voz e imagen tiene múltiples aplicaciones entre ellas cabe destacar; –La comunicación hombre-máquina: hoy en día las actividades humanas se ven enlazadas a la información ya que estas permiten resolver problemas interpretando órdenes que lo realiza mediante el reconocimiento del habla; permiten acceso a cual información, y reciben información de forma oral.

-"Uso eficiente de recursos: extraer la información relevante de forma que se ocupe el mínimo ancho de banda posible en aplicaciones de transmisión y/o almacenamiento (codificación de voz e imagen), con especial énfasis en los estándares multimedia.

-Reconocimiento de formas, identificación biométrica de personas, protección de los derechos de la propiedad intelectual, etc.

-Se incluyen numerosas figuras y tablas con las direcciones donde obtener más información de los diferentes productos existentes en el mercado".

Conclusiones

Las redes de telecomunicaciones tienen un amplio campo por estudiar, pero las más importantes son las redes de telecomunicación que ofrecen seguridad, en este caso personalmente las industriales y las residenciales el cual hacen que la tecnología ayude de manera increíble a la protección de nuestros bienes o información así mismo ofrecen una interconexión muy amplia a la hora de trabajar y mejorar la producción y ahorro de tiempo. Las redes de telecomunicación son un gran beneficio para la sociedad; ayuda de muchas formas como a comunicarnos, enviar información, aumentar la publicidad, disminuir costos, reconocimiento mundial y seguridad, sobre todo, pero seguirá avanzando y tendremos que idear nuevas formas de proteger esta red porque a medida que avanza la tecnología avanza la manera de vulnerarla.

La generación de la señal analógica conocida como la voz por parte de las personas, consiste en la creación de una onda de presión sonora que se propaga a través del aire a una velocidad muy rápida, pero las necesidades de comunicarse a diferentes partes del mundo sin estar presentes obligan a la creación de convertidores de señal analógica en digital y aplicarla en la voz para que esta señal llegue hasta donde un receptor se ubique, y como el ser humano es muy ingenioso invento no solo la forma de enviar señales o sonidos sino de emitir imágenes en que nosotros podemos estar en otras partes del mundo, observar otros lugares con simplemente tener un red, una comunicación mundial hacia cualquier lugar.

Referencias

[1] G. G. P. Alonso, Universidad Distrital Francisco José de Caldas, Colombia: Tecnologias, 2010.

[2] M. Faundez-Zanuy, Tratamiento digital de voz e imagen y aplicación a la multimedia, Editorial Marcombo, 2000.

[3] J. Gomez, «Procesamiento Digital de Señales de Voz,» 2011. [En línea]. Available: www.fcera.unr.edu.ar/prodivoz/apuntes.htm..

Carrera: Ingeniería en Computación y Redes

Seminarios: Google, Microsoft, Emprendimiento, Telecomunicaciones

Año 2017

 

 

 

Autor:

Janeth Karina Quimis Quimis.