Al pasar s[n] por el filtro LPC inverso obtenemos e[n] e[n] además de ser la señal de error es la señal de excitación del modelo de producción de voz
Método SIFT, estimación del Pitch Simplified Inverse Filtering Technique, Markel 1972. (Gp:) F. Paso Bajo 0-900 Hz (Gp:) Diezmado 5:1 (Gp:) Análisis LPC P=4 (Gp:) Filtro LPC Inverso (Gp:) Autocorrelación (Gp:) Localizar Máximo (Gp:) Interpolación (Gp:) ¿Sonoro / sordo? Estimar F0 (Gp:) x[n] (Gp:) e[n] (Gp:) S[n] Fs = 10 kHz
Filtrar paso bajo con fc = 900Hz. Esto nos permite reducir Fs de 10 kHz a 2 kHz. Desechamos 4 de cada 5 muestas. Realizamos un análisis LPC de orden 4. No es necesario más: hasta 1000Hz como máximo 2 formantes. Procesamos x[n] con el filtro inverso LPC. Obtenemos e[n] que será la señal de excitación. Calculamos la autocorrelación de e[n]. Localizamos el mayor valor dentro del rango de pitch probables. Para obtener mayor resolución en la estima del pitch, interpolamos la autocorrelación en la región del máximo. Si el máximo obtenido (normalizado por R[0]) no supera un umbral, suponer que el segmento es sordo.
Análisis espectral localizado 3.5.1.- Conceptos de percepción auditiva
MEL: Escala de frecuencias de distribución no lineal que responde al mecanismo de percepción auditiva
Con esta escala medimos la frecuencia en MELs, es la frecuencia percibida aparente.
Conversión de Hz a MELs
MEL-Frequency Cepstrum (MFCC) Coeficientes cepstrales derivados del análisis sobre la escala MEL Calculamos el espectro Calculamos el Log del módulo (cepstrum real) Aplicamos la escala MEL Agrupamos frecuencias en bandas críticas Calculamos la DCT
(Gp:) FFT (Gp:) DCT (Gp:) Escala MEL (Gp:) Log
0 1000 2000 3000 4000 5000 6000 7000 0 0.2 0.4 0.6 0.8 1 [Hz] 0 2 4 6 8 10 12 14 16 18 -10 -8 -6 -4 -2 0 Banco de filtros Espectro suavizado
Cepstrum obtenido: El número de coeficientes resultante es muy inferior El cepstrum obtenido es una aproximación (Gp:) 0 (Gp:) 2 (Gp:) 4 (Gp:) 6 (Gp:) 8 (Gp:) 10 (Gp:) 12 (Gp:) 14 (Gp:) 16 (Gp:) -0.5 (Gp:) 0 (Gp:) 0.5 (Gp:) 1
Cepstrum LPC (LPCC) Es posible obtener los coeficientes cepstrales a partir de los coeficientes LPC Obtendremos el cepstrum de una señal suavizada No es necesario calcular el espectro
Otros parámetros Existen multitud de representaciones distintas de los parámetros vistos
Unos parámetros se pueden obtener a partir de los otros
El empleo de unos u otros parámetros es indistinto en cuanto a mejoras en la síntesis/reconocimiento
La elección entre unos u otros se debe principalmente a: Robustez que ofrecen frente a fallos Tasa binaria mínima requerida
Coeficientes PARCOR: PARtial autoCORrelation coefficients. Se calculan como paso intermedio en el algoritmo de durbin. Son los coeficientes de Reflexión ya vistos.
Relación de áreas / Coefs. PARCOR
LAR: Log Area Ratios
Coeficientes LSF / LSP: Line Spectral Frequencies / Line Spectral Pairs Permiten una representación distinta de los coeficientes LPC El filtro inverso LPC, A(z), se puede descomponer en:
Donde P(z) representa la respuesta del tracto vocal con la glotis cerrada, y Q(z) con la glotis abierta.
A(z) tiene raíces dentro de la circunferencia unidad P(z) y Q(z) sólo tienen raíces sobre la circunferencia P(z) es un polinomio simétrico y Q(z) antisimétrico Las raíces de P(z) y Q(z) se encuentran de forma alternada en frecuencia Cálculo de las raices: Tomar z = exp(jw) y evaluar P(z) y Q(z) en una malla de puntos entre 0 y pi.
Recuperación de A(z):
Problemas de usar los coeficientes LPC: El error de cuantificación es problemático, el filtro se puede hacer inestable Se comportan muy mal al intentar interpolarlos
Ventajas de usar LSF/LSP: Son más robustos en cuanto a errores de cuantificación El filtro permanece estable Al ser una representación en frecuencia, un error solo altera un pequeño rango de frecuencias
Proceso de obtención de parámetros Pasos a realizar: Pre-énfasis de la trama Enventanado con solapamiento Cálculo de la autocorrelación Análisis LPC, obtención de los coeficientes Cálculo del cepstrum a partir de la LPC Análisis de los parámetros obtenidos
Página anterior | Volver al principio del trabajo | Página siguiente |