Historia de los codificadores de voz Primera reseña histórica, 1779:
C. G. Kratzenstein. Profesor de la Universidad de Copenhague.
Fue capaz de producir vocales uniendo cavidades de resonancia a los tubos de un órgano.
Historia de los codificadores de voz Wolfgang von Kempelen, 1791: Primer sintetizador de voz Máquina que reproducía fielmente la anatomía del aparato fonador humano
Historia de los codificadores de voz Joseph Faber, 1835: “Euphonia”, permite (además) generar voz cantada.
En el siguiente enlace se puede ver un dibujo de la máquina en cuestión.
Historia de los codificadores de voz Homer Dudley, 1939: “Voder” – Primer sintetizador electrónico Bell telephone Emplea: Oscilador Generador de ruido blanco Banco de filtros paso banda Teclas para consonantes
Historia de los codificadores de voz En la década de los 40 se empezó a trabajar intensamente el los codificadores de voz
Codificador de voz: Vocoder (Voice Coder)
Un vocoder analiza la voz y la convierte en una serie de parámetros característicos que posteriormente se vuelven a convertir en voz audible en el receptor. Su principal ventaja es la reducción del ancho de banda necesario. Muy útil en telefonía móvil
Muestreo y cuantificación Muestreo:
Nyquist:
Si no se cumple este requisito se produce aliasing.
Cuantificación uniforme Cuantificación: Expresar una cantidad que representa una variación continua dentro de un rango limitado de valores.
Cuantificación uniforme (PCM): (Gp:) Vout (Gp:) Vin
Cuantificación uniforme La señal de voz y la cuantificación PCM:
La voz no es estacionaria. La amplitud de la señal de voz tiene una distribución Gamma, se aproxima por una Laplaciana. Las muestras de voz están correladas.
El cuantificador uniforme está adaptado para funciones de densidad de probabilidad uniformes.
Es posible cuantificar la señal de forma más eficiente.
Cuantificación no uniforme Si la FDP no es uniforme podemos aplicarle una transformación para minimizar el error de cuantificación.
Equivalente a modificar el tamaño de los escalones: Escalones pequeños para niveles bajos de señal. Escalones grandes para niveles altos.
Cuantificación no uniforme Sistemas Compresores / Expansores: También conocidos como cuantificadores logarítmicos (LogPCM) Ley A: Ley µ: µ: 255 A: 87.56
Expansor Compresor Cuantificador n-bits Cuantificación no uniforme Sistemas Compresores / Expansores: x(n) y(n) yq(n) xq(n) Transmisor Receptor Estándar G.711 64 Kbps (4KHz, 8000 muestras/seg) Ley-µ 14-bit linear PCM a 8-bit log. Ley-A 13-bit linear PCM a 8-bit log.
Equivalente a PCM 11 bits * 8000 m/seg, 88 Kbps
Cuantificación vectorial Vector Quantization, VQ
La cuantificación se realiza por grupos de muestras o parámetros
Un grupo de N muestras se trata como un vector N dimensional
Representamos los vectores por un conjunto pequeño de representantes (codebook)
Posteriormente se debe buscar el mejor representante para un vector (codevector)
Cuantificación vectorial Tiene múltiples aplicaciones, entre ellas: Clasificador Reducción de datos (compresión)
Cálculo del codebook: Algoritmo LBG o de las k-medias Se calculan iterativamente: ci: centroide de cada región Si: particiones de los vecinos más cercanos a cada centroide D: distancia media. Si no se modifica sustancialmente , desdoblar el número de centroides .
Muestreo y cuantificación La cuantificación vectorial es eficiente porque: El codebook se adapta a la distribución estadística de la señal, sea esta cual sea. Se tiene en cuenta la correlación entre muestras y las posibles no linealidades.
La búsqueda en el codebook debe hacerse de forma eficiente: Árboles de búsqueda
En voz se suelen emplear los parámetros LPC, PARCOR, LSP, etc y se representan por un código.
Página siguiente |