2.5.- Autocorrelación Para desplazamientos de k igual al periodo de la señal la autocorrelación tiene máximos locales La autocorrelación de una señal periódica es periódica
2.5.- Autocorrelación En una señal de voz: Los máximos locales de la autocorrelación corresponden con el pitch (frecuencia fundamental, f0) y los formantes del tracto vocal.
2.6.- Estimación del Pitch A partir de la correlación Es el mayor máximo local de la autocorrelación (excluyendo el máximo global) Segmento Sonoro Segmento Sordo
2.6.- Estimación del Pitch Problema: No siempre el mayor máximo local corresponde con el pitch
Para facilitar su localización emplearemos una función de recorte
Esta función eliminará toda la señal de entrada que no sobrepase un determinado umbral
2.6.- Estimación del Pitch Función de recorte:
2.6.- Estimación del Pitch Autocorrelación de la señal recortada
2.6.- Estimación del Pitch AMDF, Average Magnitude Difference Function Estima del pitch empleando la Magnitud en vez de la correlación Menor complejidad y coste computacional En este caso en vez de buscar máximos se deben buscar mínimos
2.6.- Estimación del Pitch AMDF, Average Magnitude Difference Function
3.- Análisis localizado en frecuencia Para realizar un análisis localizado en frecuencia basta con calcular la TF de un segmento de señal enventanado.
3.1- Espectrogramas También denominados Sonogramas Representan la evolución del espectro con el tiempo Estas variables son inversas Al ganar resolución en una de ellas, la perdemos en la otra
Tipos de espectrogramas: Banda ancha Banda estrecha
3.1- Espectrogramas Banda ancha (poca resolución en frecuencia) Ventanas temporales cortas
3.1- Espectrogramas Banda estrecha (poca resolución en el tiempo) Ventanas temporales largas
3.2- Análisis Homomórfico: Cepstrum Utilidad: Permite separar la señal de excitación de la respuesta del filtro del tracto vocal
Un segmento sonoro es la convolución entre: La señal de excitación glotal e[n] El filtro del tracto vocal h[n]
La convolución en el tiempo es una multiplicación en frecuencia
3.2- Análisis Homomórfico: Cepstrum Aprovechando las propiedades de los logaritmos:
Si ahora regresamos al “tiempo”: Cepstrum (Gp:) s[n] (Gp:) FFT (Gp:) Log (Gp:) IFFT (Gp:) c[n]
3.2- Análisis Homomórfico: Cepstrum El cepstrum puede ser real o complejo: Cepstrum complejo: tomamos logaritmos del espectro completo (con la fase desenrollada, unwrapped)
Cepstrum real: sólo aplicamos el logaritmo al módulo del espectro
El cepstrum complejo se puede deshacer, el real no al no contener información de fase
Para voz se suele emplear el cepstrum real
3.2- Análisis Homomórfico: Cepstrum La convolución se ha convertido en una suma: (Gp:) Periodo Fundamental
ce y ch son separables
3.2- Análisis Homomórfico: Cepstrum Obtención de la envolvente espectral: Una vez calculado el cepstrum Extraemos ch con una ventana El espectro de ch es la envolvente espectral 0 1 2 3 4 5 6 7 8 -70 -60 -50 -40 -30 -20 -10 0 Frecuencia(KHz) Amplitud(dB)
3.2- Análisis Homomórfico: Cepstrum Terminología empleada:
Spectrum ? Cepstrum Frecuency ? Quefrency Filtering ? Liftering Analysis ? Alanysis
4.- Análisis de predicción lineal Modelo del tracto vocal: Suponemos que el tracto vocal es una serie de tubos de sección variable sin pérdidas Suponemos que el sonido se propaga como una onda plana a través de los tubos (Gp:) A1 (Gp:) A2 (Gp:) … (Gp:) AN (Gp:) Glotis (Gp:) ALabios
Modelo del tracto vocal
Estructura de filtro en celosía (lattice) ? tiempo de propagación para atravesar una sección 4.- Análisis de predicción lineal (Gp:) A1 (Gp:) A2 (Gp:) AN (Gp:) Glotis (Gp:) ALabios??
(Gp:) ? (Gp:) ? (Gp:) ? (Gp:) ? (Gp:) ? (Gp:) ? (Gp:) Ug (Gp:) -1 (Gp:) ULabios (Gp:) 1-kN (Gp:) kN
4.- Análisis de predicción lineal Coeficientes de reflexión: (Gp:) -km (Gp:) km (Gp:) 1-km (Gp:) 1+km (Gp:) Am (Gp:) Am+1 (Gp:) Um (Gp:) Um (Gp:) + (Gp:) – (Gp:) Um+1 (Gp:) Um+1 (Gp:) + (Gp:) –
Interconexión de secciones: Cálculo de los coeficientes de reflexión:
4.- Análisis de predicción lineal Trabajando en tiempo discreto:
Si el periodo de muestreo T = 2 ? se puede demostrar que la respuesta en frecuencia del tracto vocal es un filtro todo polos
Los coeficientes ak del filtro se pueden obtener a partir de los coeficientes de reflexión km (Durbin)
4.- Análisis de predicción lineal Predicción lineal: Vamos a intentar predecir el valor de s[n] a partir de sus valores anteriores s[n-1], s[n-2], …, s[n-M]
Es decir, s[n] se puede calcular en función de sus muestras anteriores (podemos predecir su valor):
Si la función f es lineal: predicción lineal
4.- Análisis de predicción lineal Cálculo de la predicción de s[n]:
Coeficientes de predicción:
Error de predicción:
Página anterior | Volver al principio del trabajo | Página siguiente |