Descargar

Codificación de la voz (Powerpoint)

Enviado por Pablo Turmero


Partes: 1, 2, 3

    edu.red

    Historia de los codificadores de voz Primera reseña histórica, 1779:

    C. G. Kratzenstein. Profesor de la Universidad de Copenhague.

    Fue capaz de producir vocales uniendo cavidades de resonancia a los tubos de un órgano.

    edu.red

    Historia de los codificadores de voz Wolfgang von Kempelen, 1791: Primer sintetizador de voz Máquina que reproducía fielmente la anatomía del aparato fonador humano

    edu.red

    Historia de los codificadores de voz Joseph Faber, 1835: “Euphonia”, permite (además) generar voz cantada.

    En el siguiente enlace se puede ver un dibujo de la máquina en cuestión.

    edu.red

    Historia de los codificadores de voz Homer Dudley, 1939: “Voder” – Primer sintetizador electrónico Bell telephone Emplea: Oscilador Generador de ruido blanco Banco de filtros paso banda Teclas para consonantes

    edu.red

    Historia de los codificadores de voz En la década de los 40 se empezó a trabajar intensamente el los codificadores de voz

    Codificador de voz: Vocoder (Voice Coder)

    Un vocoder analiza la voz y la convierte en una serie de parámetros característicos que posteriormente se vuelven a convertir en voz audible en el receptor. Su principal ventaja es la reducción del ancho de banda necesario. Muy útil en telefonía móvil

    edu.red

    Muestreo y cuantificación Muestreo:

    Nyquist:

    Si no se cumple este requisito se produce aliasing.

    edu.red

    Cuantificación uniforme Cuantificación: Expresar una cantidad que representa una variación continua dentro de un rango limitado de valores.

    Cuantificación uniforme (PCM): (Gp:) Vout (Gp:) Vin

    edu.red

    Cuantificación uniforme La señal de voz y la cuantificación PCM:

    La voz no es estacionaria. La amplitud de la señal de voz tiene una distribución Gamma, se aproxima por una Laplaciana. Las muestras de voz están correladas.

    El cuantificador uniforme está adaptado para funciones de densidad de probabilidad uniformes.

    Es posible cuantificar la señal de forma más eficiente.

    edu.red

    Cuantificación no uniforme Si la FDP no es uniforme podemos aplicarle una transformación para minimizar el error de cuantificación.

    Equivalente a modificar el tamaño de los escalones: Escalones pequeños para niveles bajos de señal. Escalones grandes para niveles altos.

    edu.red

    Cuantificación no uniforme Sistemas Compresores / Expansores: También conocidos como cuantificadores logarítmicos (LogPCM) Ley A: Ley µ: µ: 255 A: 87.56

    edu.red

    Expansor Compresor Cuantificador n-bits Cuantificación no uniforme Sistemas Compresores / Expansores: x(n) y(n) yq(n) xq(n) Transmisor Receptor Estándar G.711 64 Kbps (4KHz, 8000 muestras/seg) Ley-µ 14-bit linear PCM a 8-bit log. Ley-A 13-bit linear PCM a 8-bit log.

    Equivalente a PCM 11 bits * 8000 m/seg, 88 Kbps

    edu.red

    Cuantificación vectorial Vector Quantization, VQ

    La cuantificación se realiza por grupos de muestras o parámetros

    Un grupo de N muestras se trata como un vector N dimensional

    Representamos los vectores por un conjunto pequeño de representantes (codebook)

    Posteriormente se debe buscar el mejor representante para un vector (codevector)

    edu.red

    Cuantificación vectorial Tiene múltiples aplicaciones, entre ellas: Clasificador Reducción de datos (compresión)

    Cálculo del codebook: Algoritmo LBG o de las k-medias Se calculan iterativamente: ci: centroide de cada región Si: particiones de los vecinos más cercanos a cada centroide D: distancia media. Si no se modifica sustancialmente , desdoblar el número de centroides .

    edu.red

    Muestreo y cuantificación La cuantificación vectorial es eficiente porque: El codebook se adapta a la distribución estadística de la señal, sea esta cual sea. Se tiene en cuenta la correlación entre muestras y las posibles no linealidades.

    La búsqueda en el codebook debe hacerse de forma eficiente: Árboles de búsqueda

    En voz se suelen emplear los parámetros LPC, PARCOR, LSP, etc y se representan por un código.

    Partes: 1, 2, 3
    Página siguiente