Descargar

Parametrización en el Análisis de la voz (página 2)

Enviado por Pablo Turmero


Partes: 1, 2, 3
edu.red

2.5.- Autocorrelación Para desplazamientos de k igual al periodo de la señal la autocorrelación tiene máximos locales La autocorrelación de una señal periódica es periódica

edu.red

2.5.- Autocorrelación En una señal de voz: Los máximos locales de la autocorrelación corresponden con el pitch (frecuencia fundamental, f0) y los formantes del tracto vocal.

edu.red

2.6.- Estimación del Pitch A partir de la correlación Es el mayor máximo local de la autocorrelación (excluyendo el máximo global) Segmento Sonoro Segmento Sordo

edu.red

2.6.- Estimación del Pitch Problema: No siempre el mayor máximo local corresponde con el pitch

Para facilitar su localización emplearemos una función de recorte

Esta función eliminará toda la señal de entrada que no sobrepase un determinado umbral

edu.red

2.6.- Estimación del Pitch Función de recorte:

edu.red

2.6.- Estimación del Pitch Autocorrelación de la señal recortada

edu.red

2.6.- Estimación del Pitch AMDF, Average Magnitude Difference Function Estima del pitch empleando la Magnitud en vez de la correlación Menor complejidad y coste computacional En este caso en vez de buscar máximos se deben buscar mínimos

edu.red

2.6.- Estimación del Pitch AMDF, Average Magnitude Difference Function

edu.red

3.- Análisis localizado en frecuencia Para realizar un análisis localizado en frecuencia basta con calcular la TF de un segmento de señal enventanado.

edu.red

3.1- Espectrogramas También denominados Sonogramas Representan la evolución del espectro con el tiempo Estas variables son inversas Al ganar resolución en una de ellas, la perdemos en la otra

Tipos de espectrogramas: Banda ancha Banda estrecha

edu.red

3.1- Espectrogramas Banda ancha (poca resolución en frecuencia) Ventanas temporales cortas

edu.red

3.1- Espectrogramas Banda estrecha (poca resolución en el tiempo) Ventanas temporales largas

edu.red

3.2- Análisis Homomórfico: Cepstrum Utilidad: Permite separar la señal de excitación de la respuesta del filtro del tracto vocal

Un segmento sonoro es la convolución entre: La señal de excitación glotal e[n] El filtro del tracto vocal h[n]

La convolución en el tiempo es una multiplicación en frecuencia

edu.red

3.2- Análisis Homomórfico: Cepstrum Aprovechando las propiedades de los logaritmos:

Si ahora regresamos al “tiempo”: Cepstrum (Gp:) s[n] (Gp:) FFT (Gp:) Log (Gp:) IFFT (Gp:) c[n]

edu.red

3.2- Análisis Homomórfico: Cepstrum El cepstrum puede ser real o complejo: Cepstrum complejo: tomamos logaritmos del espectro completo (con la fase desenrollada, unwrapped)

Cepstrum real: sólo aplicamos el logaritmo al módulo del espectro

El cepstrum complejo se puede deshacer, el real no al no contener información de fase

Para voz se suele emplear el cepstrum real

edu.red

3.2- Análisis Homomórfico: Cepstrum La convolución se ha convertido en una suma: (Gp:) Periodo Fundamental

ce y ch son separables

edu.red

3.2- Análisis Homomórfico: Cepstrum Obtención de la envolvente espectral: Una vez calculado el cepstrum Extraemos ch con una ventana El espectro de ch es la envolvente espectral 0 1 2 3 4 5 6 7 8 -70 -60 -50 -40 -30 -20 -10 0 Frecuencia(KHz) Amplitud(dB)

edu.red

3.2- Análisis Homomórfico: Cepstrum Terminología empleada:

Spectrum ? Cepstrum Frecuency ? Quefrency Filtering ? Liftering Analysis ? Alanysis

edu.red

4.- Análisis de predicción lineal Modelo del tracto vocal: Suponemos que el tracto vocal es una serie de tubos de sección variable sin pérdidas Suponemos que el sonido se propaga como una onda plana a través de los tubos (Gp:) A1 (Gp:) A2 (Gp:) … (Gp:) AN (Gp:) Glotis (Gp:) ALabios

edu.red

Modelo del tracto vocal

Estructura de filtro en celosía (lattice) ? tiempo de propagación para atravesar una sección 4.- Análisis de predicción lineal (Gp:) A1 (Gp:) A2 (Gp:) AN (Gp:) Glotis (Gp:) ALabios??

(Gp:) ? (Gp:) ? (Gp:) ? (Gp:) ? (Gp:) ? (Gp:) ? (Gp:) Ug (Gp:) -1 (Gp:) ULabios (Gp:) 1-kN (Gp:) kN

edu.red

4.- Análisis de predicción lineal Coeficientes de reflexión: (Gp:) -km (Gp:) km (Gp:) 1-km (Gp:) 1+km (Gp:) Am (Gp:) Am+1 (Gp:) Um (Gp:) Um (Gp:) + (Gp:) – (Gp:) Um+1 (Gp:) Um+1 (Gp:) + (Gp:) –

Interconexión de secciones: Cálculo de los coeficientes de reflexión:

edu.red

4.- Análisis de predicción lineal Trabajando en tiempo discreto:

Si el periodo de muestreo T = 2 ? se puede demostrar que la respuesta en frecuencia del tracto vocal es un filtro todo polos

Los coeficientes ak del filtro se pueden obtener a partir de los coeficientes de reflexión km (Durbin)

edu.red

4.- Análisis de predicción lineal Predicción lineal: Vamos a intentar predecir el valor de s[n] a partir de sus valores anteriores s[n-1], s[n-2], …, s[n-M]

Es decir, s[n] se puede calcular en función de sus muestras anteriores (podemos predecir su valor):

Si la función f es lineal: predicción lineal

edu.red

4.- Análisis de predicción lineal Cálculo de la predicción de s[n]:

Coeficientes de predicción:

Error de predicción:

Partes: 1, 2, 3
 Página anterior Volver al principio del trabajoPágina siguiente