Descargar

Introducción a la codificación de imágenes (página 2)

Enviado por Pablo Turmero


Partes: 1, 2, 3
edu.red

Codificación JPEG: Ejemplo real I (RLE+VLC) (Gp:) Bloque de muestras cuantizadas

Codificación RLE+VLC de los coeficientes cuantizados Paso 1. Se codifica la DC usando codificación diferencial DPCM Si DC Bloque anterior es 98 ? codificar 102-98 Se codifica como: Num. bits necesarios (tabla VLC) + codif + signo DC se codifica como: 101 100 0 (Gp:) Tabla para la DC

edu.red

Codificación JPEG: Ejemplo real II (RLE+VLC) Paso 2: Se codifica en zig-zag pares (Gp:) Tabla para pares

(Gp:) Bloque de muestras cuantizadas

Parte del bloque codificado con VLC

Existe código de escape: 0000 01 RRRR RR NNNN NNNN

edu.red

Codificación JPEG: Ejemplo real III (RLE+VLC) Bloque de muestras cuantizadas Resultado final de la codificación RLE+VLC Bloque codificado con VLC Tasa de compresión: Stream final: 1011000010010100011100001101 … 000100110 (85 bits) Bits por píxel: (Núm bits/ Núm píxels) 85/64= 1’33 bpp Factor de compresión: Tam_comprimida:Tam_original= 85:(8*8*8)= 85:512 1:Tam_original/Tam_comprimida= (85/85):(512/85)= 1:6

edu.red

Codificación JPEG: Ejemplo real IV (Calidad) Medida objetiva del error: MSE (Mean Square Error)

Medida objetiva de la calidad: PSNR (Peak SNR)

Valores del ejemplo: MSE = 49’53 PSNR = 31’18 dB Bloque de muestras (pixels) Bloque recuperado de muestras

edu.red

JPEG escalado Motivación Fundamentos del JPEG escalado Compatibilidad con JPEG estándar Cuantificación variable Resultados

edu.red

Motivación Utilización de tamaño de bloque mayor: NxN. Mayor compactación de energía pero mayor tiempo de cálculo. Descartar coeficientes de alta frecuencia hasta quedarse con sólo una submatriz de 8×8.

edu.red

Fundamentos del JPEG escalado División de la imagen en bloques de NxN puntos conservando sólo los 8×8 primeros coeficientes. Utilización de la DCT recortada de N a 8, modificada. Utilización de nuevas matrices de cuantificación. Elección de N=16.

edu.red

El proceso de codificación/decodificación JPEG escalado (Gp:) Bloques de 16×16 (Gp:) Imagen (Gp:) IDCT 16×16 (Gp:) 8×8 a 16×16 (Gp:) Descuanti- (Gp:) Decodifica. (Gp:) de entropía (Gp:) Decodificador de JPEG escalado (Gp:) Imagen (Gp:) comprimida (Gp:) ficador (Gp:) IDCT 16×16 recortada

(Gp:) Bloques de 16×16 (Gp:) Imagen (Gp:) Imagen (Gp:) comprimida (Gp:) FDCT 16×16 (Gp:) 16×16 a 8×8 (Gp:) Cuantifi-cador (Gp:) Codificador de entropía (Gp:) Codificador de JPEG escalado (Gp:) FDCT 16×16 recortada

edu.red

Compatibilidad con JPEG estándar Aunque el bloque de imagen es de 16×16 el de coeficientes es de 8×8 puntos. Los coeficientes obtenidos se escalan para que estén en el rango de los que se obtienen en una DCT de 8×8. Las funciones básicas son similares. Se incluye información de tamaño real de la imagen, mediante códigos definidos para extensiones.

edu.red

Comparación de la DCT de 8 y 16 puntos Funciones básicas de las DCT de 8 y 16 puntos

edu.red

Mezcla de formatos Imagen Leída como Se obtiene JPEG estándar JPEG escalado JPEG estándar JPEG escalado

edu.red

Cuantificación variable En el proceso de cuantificación se consigue la compresión a base de anular coeficientes

Para conseguir más ceros hay que incrementar los valores Qvu, lo que afecta a todos los bloques (Gp:) é (Gp:) ë (Gp:) ê (Gp:) ê (Gp:) ê (Gp:) ê (Gp:) ê (Gp:) S (Gp:) 0 (Gp:) , (Gp:) 0 (Gp:) S (Gp:) 0 (Gp:) , (Gp:) 1 (Gp:) ­ (Gp:) S (Gp:) 0 (Gp:) , (Gp:) 7 (Gp:) S (Gp:) 1 (Gp:) , (Gp:) 0 (Gp:) S (Gp:) 1 (Gp:) , (Gp:) 1 (Gp:) ­ (Gp:) S (Gp:) 1 (Gp:) , (Gp:) 7 (Gp:) ® (Gp:) ® (Gp:) ¯ (Gp:) ® (Gp:) S (Gp:) 7 (Gp:) , (Gp:) 0 (Gp:) S (Gp:) 7 (Gp:) , (Gp:) 1 (Gp:) ­ (Gp:) S (Gp:) 7 (Gp:) , (Gp:) 7 (Gp:) ù (Gp:) û (Gp:) ú (Gp:) ú (Gp:) ú (Gp:) ú (Gp:) ú (Gp:) ® (Gp:) ¾ (Gp:) ¾ (Gp:) ¾ (Gp:) ¾ (Gp:) ¾ (Gp:) Cuantificación (Gp:) r (Gp:) e (Gp:) d (Gp:) o (Gp:) n (Gp:) d (Gp:) e (Gp:) o (Gp:) æ (Gp:) è (Gp:) ç (Gp:) S (Gp:) v (Gp:) u (Gp:) Q (Gp:) v (Gp:) u (Gp:) ö (Gp:) ø (Gp:) ÷ (Gp:) = (Gp:) S (Gp:) q (Gp:) v (Gp:) u (Gp:) é (Gp:) ë (Gp:) ê (Gp:) ê (Gp:) ê (Gp:) ê (Gp:) ê (Gp:) S (Gp:) q (Gp:) 0 (Gp:) , (Gp:) 0 (Gp:) S (Gp:) q (Gp:) 0 (Gp:) , (Gp:) 1 (Gp:) ­ (Gp:) S (Gp:) q (Gp:) 0 (Gp:) , (Gp:) 7 (Gp:) S (Gp:) q (Gp:) 1 (Gp:) , (Gp:) 0 (Gp:) S (Gp:) q (Gp:) 1 (Gp:) , (Gp:) 1 (Gp:) ­ (Gp:) S (Gp:) q (Gp:) 1 (Gp:) , (Gp:) 7 (Gp:) ® (Gp:) ® (Gp:) ¯ (Gp:) ® (Gp:) S (Gp:) q (Gp:) 7 (Gp:) , (Gp:) 0 (Gp:) S (Gp:) q (Gp:) 7 (Gp:) , (Gp:) 1 (Gp:) ­ (Gp:) S (Gp:) q (Gp:) 7 (Gp:) , (Gp:) 7 (Gp:) ù (Gp:) û (Gp:) ú (Gp:) ú (Gp:) ú (Gp:) ú (Gp:) ú

edu.red

Cuantificación variable: propuesta Utilización de una función de cuantificación con umbral.

Clasificación de los bloques en categorías. Utilización de un umbral distinto para cada categoría.

(Gp:) S (Gp:) q (Gp:) v (Gp:) u (Gp:) = (Gp:) ì (Gp:) î (Gp:) í (Gp:) ï (Gp:) ï (Gp:) r (Gp:) e (Gp:) d (Gp:) o (Gp:) n (Gp:) d (Gp:) e (Gp:) o (Gp:) æ (Gp:) è (Gp:) ç (Gp:) S (Gp:) v (Gp:) u (Gp:) Q (Gp:) v (Gp:) u (Gp:) ö (Gp:) ø (Gp:) ÷ (Gp:) , (Gp:) si (Gp:) S (Gp:) v (Gp:) u (Gp:) Q (Gp:) v (Gp:) u (Gp:) > (Gp:) u (Gp:) m (Gp:) b (Gp:) r (Gp:) a (Gp:) l (Gp:) 0 (Gp:) , (Gp:) en (Gp:) otro (Gp:) caso

edu.red

Relación Señal-Ruido para distintastasas de bits de la imagen Lena

edu.red

Relación Señal-Ruido para distintastasas de bits de la imagen Catedral

edu.red

Relación del SNR de las imágenes con JPEG escalado y adaptativo frente al estándar

edu.red

Una secuencia de vídeo es una sucesión de imágenes que producen sensación de movimiento. El proceso completo de transmisión de vídeo con compresión consiste en: Adquisición del vídeo a transmitir. Captura analógica de la secuencia de imágenes. Digitalización del vídeo. (Re)codificación y subsampling de las muestras. Típicamente se pasa de RGB a YCbCr Subsampling de la crominancia (de 4:4:4 a 4:2:0 ó 4:2:2) Compresión del vídeo. Transmisión progresiva del vídeo comprimido (a ser posible usando protocolos con soporte multimedia)

edu.red

Captura de vídeo analógico Las imágenes (dos dimensiones) son convertidas en una señal analógica. Se capturan las imágenes a intervalos regulares. Cada imagen (cuadro o frame) es barrida calculando la intensidad de cada punto (B&W). Para reproducir la imagen se realiza el proceso inverso. (Gp:) Líneas de barrido (Gp:) 1 (Gp:) 3 (Gp:) 5 (Gp:) 7 (Gp:) 9 (Gp:) 483 (Gp:) Líneas de barrido mostradas

(Gp:) t (Gp:) a (Gp:) Lentes (Gp:) Placa de barrido

edu.red

Captura de vídeo analógico II La captura (y reproducción) de imágenes en color es muy similar a la de blanco y negro. En este caso se utilizan tres haces de barrido (RGB). Conversión RGB a YUV (compatibilidad con señales B&W). Y: Luminancia (intensidad). U y V: Diferencias de color. El ojo humano es más sensible a la intensidad (brillo) que a la información de color (sub-sampling). (Gp:) Lentes (Gp:) Placa de barrido (Gp:) t (Gp:) a (Gp:) Divisor (Gp:) Filtros (Gp:) t (Gp:) a (Gp:) t (Gp:) a (Gp:) R (Gp:) G (Gp:) B

(Gp:) Cámara (Gp:) Demod. Conv. (Gp:) CRT (Gp:) TV Color (Gp:) R (Gp:) G (Gp:) B (Gp:) Y+C (Gp:) Filtro (Gp:) CRT (Gp:) TV B&W (Gp:) Y (Gp:) Y+C (Gp:) G (Gp:) B (Gp:) R (Gp:) Y (Gp:) U (Gp:) V (Gp:) C (Gp:) Modulador (Gp:) Codificador

edu.red

Captura de vídeo analógico III Parámetros de barrido: Relación de aspecto (ancho:alto): 4:3 Existen distintos estándares: NTSC (Usa y Japón): 525 líneas, 30 frames/s PAL/SECAM (Resto): 625 líneas, 25 frames/s. Algunas líneas (superiores e inferiores) no son visibles. Durante el retorno vertical, se puede insertar información adicional (teletexto).

Barrido entrelazado y progresivo. Entrelazado. Cada cuadro se representa con dos campos sucesivos (uno con las líneas impares y otro con las pares) (60 c/s ó 50 c/s).

Partes: 1, 2, 3
 Página anterior Volver al principio del trabajoPágina siguiente