Descargar

Análisis de la voz – Parametrización (página 3)

Enviado por Pablo Turmero


Partes: 1, 2, 3, 4
edu.red La convolución se ha convertido en una suma: (Gp:) Periodo Fundamental

ce y ch son separables

edu.red Obtención de la envolvente espectral: Una vez calculado el cepstrum Extraemos ch con una ventana El espectro de ch es la envolvente espectral 0 1 2 3 4 5 6 7 8 -70 -60 -50 -40 -30 -20 -10 0 Frecuencia(KHz) Amplitud(dB)

edu.red Terminología empleada:

Spectrum ? Cepstrum Frecuency ? Quefrency Filtering ? Liftering Analysis ? Alanysis

edu.red Análisis de predicción lineal Modelo del tracto vocal: Suponemos que el tracto vocal es una serie de tubos de sección variable sin pérdidas Suponemos que el sonido se propaga como una onda plana a través de los tubos (Gp:) A1 (Gp:) A2 (Gp:) … (Gp:) AN (Gp:) Glotis (Gp:) ALabios

edu.red Modelo del tracto vocal

Estructura de filtro en celosía (lattice) ? tiempo de propagación para atravesar una sección (Gp:) A1 (Gp:) A2 (Gp:) AN (Gp:) Glotis (Gp:) ALabios??

(Gp:) ? (Gp:) ? (Gp:) ? (Gp:) ? (Gp:) ? (Gp:) ? (Gp:) Ug (Gp:) -1 (Gp:) ULabios (Gp:) 1-kN (Gp:) kN

edu.red Coeficientes de reflexión: (Gp:) -km (Gp:) km (Gp:) 1-km (Gp:) 1+km (Gp:) Am (Gp:) Am+1 (Gp:) Um (Gp:) Um (Gp:) + (Gp:) – (Gp:) Um+1 (Gp:) Um+1 (Gp:) + (Gp:) –

Interconexión de secciones: Cálculo de los coeficientes de reflexión:

edu.red Trabajando en tiempo discreto:

Si el periodo de muestreo T = 2 ? se puede demostrar que la respuesta en frecuencia del tracto vocal es un filtro todo polos

Los coeficientes ak del filtro se pueden obtener a partir de los coeficientes de reflexión km (Durbin)

edu.red Predicción lineal: Vamos a intentar predecir el valor de s[n] a partir de sus valores anteriores s[n-1], s[n-2], …, s[n-M]

Es decir, s[n] se puede calcular en función de sus muestras anteriores (podemos predecir su valor):

Si la función f es lineal: predicción lineal

edu.red Cálculo de la predicción de s[n]:

Coeficientes de predicción:

Error de predicción:

edu.red Cálculo de los coeficientes de predicción: Son aquellos que minimizan el error de predicción (la energía del error de predicción)

Minimizar: Para cada ak derivar e igualar a 0

Obtenemos un sistema de P ecuaciones con P incógnitas

edu.red Cálculo de los coeficientes de predicción:

edu.red Cálculo de los coeficientes de predicción:

Sistema de ecuaciones:

edu.red En forma matricial: R es una matriz Toeplitz Ecuaciones de Yule-Walker

edu.red Algoritmo de Durbin: Solución recursiva para calcular los coeficientes ak aprovechando que R es toeplitz. Inicio:

Recursión: i=1,…,P (Gp:) Energía residual

(Gp:) Coef. Reflexión (PARCOR)

(Gp:) Coef. LPC

edu.red Algoritmo de Durbin: Calcula los coeficiente de reflexión (PARCOR) Calcula los coeficientes de predicción lineal a partir de los de reflexión El filtro resultante siempre es estable: |km|<1

Filtro obtenido: IIR todo polos

edu.red Cálculo de las frecuencias de los formantes: A partir de los ak calcular las raíces del polinomio El cálculo de estas raíces debe hacerse de forma aproximada por métodos numéricos ya que no puede hacerse de forma analítica para polinomios grandes (Gp:) 0 Hz (Gp:) Fs/2 Hz

edu.red Orden de predicción: Un par de polos complejos conjugados por cada formante Añadir dos o tres polos más En general P suele estar entre 10 y 14 coeficientes LPC-5 LPC-14 LPC-10

edu.red Modelo de producción de voz: (Gp:) Excitación Periódica (Gp:) Ruido Aleatorio (Gp:) Pitch (Gp:) Envolvente espectral (Gp:) G (Gp:) Parámetros Espectrales (Gp:) Voz

edu.red A partir del error de predicción y del filtro LPC podemos obtener s[n]: (Gp:) e[n] (Gp:) s[n]

edu.red Con el filtro LPC inverso y la señal de voz podemos obtener la señal de error: (Gp:) s[n] (Gp:) e[n]

Partes: 1, 2, 3, 4
 Página anterior Volver al principio del trabajoPágina siguiente