Compresión de vídeo (PPT)

Partes: 1, 2

1. Introducción Una secuencia de vídeo es una sucesión de imágenes que producen sensación de movimiento. El proceso completo de transmisión de vídeo con compresión consiste en: Adquisición del vídeo a transmitir. Captura analógica de la secuencia de imágenes. Digitalización del vídeo. (Re)codificación y subsampling de las muestras. Típicamente se pasa de RGB a YCbCr Subsampling de la crominancia (de 4:4:4 a 4:2:0 ó 4:2:2) Compresión del vídeo. Transmisión progresiva del vídeo comprimido (a ser posible usando protocolos con soporte multimedia) 1

edu.red

2.1 Captura de vídeo analógico I Las imágenes (dos dimensiones) son convertidas en una señal analógica. Se capturan las imágenes a intervalos regulares. Cada imagen (cuadro o frame) es barrida calculando la intensidad de cada punto (B&W). Para reproducir la imagen se realiza el proceso inverso. 2 (Gp:) Líneas de barrido (Gp:) 1 (Gp:) 3 (Gp:) 5 (Gp:) 7 (Gp:) 9 (Gp:) 483 (Gp:) Líneas de barrido mostradas

(Gp:) t (Gp:) a (Gp:) Lentes (Gp:) Placa de barrido

edu.red

2.1 Captura de vídeo analógico II La captura (y reproducción) de imágenes en color es muy similar a la de blanco y negro. En este caso se utilizan tres haces de barrido (RGB). Conversión RGB a YUV (compatibilidad con señales B&W). 3 Y: Luminancia (intensidad). U y V: Diferencias de color. El ojo humano es más sensible a la intensidad (brillo) que a la información de color (sub-sampling). (Gp:) Lentes (Gp:) Placa de barrido (Gp:) t (Gp:) a (Gp:) Divisor (Gp:) Filtros (Gp:) t (Gp:) a (Gp:) t (Gp:) a (Gp:) R (Gp:) G (Gp:) B

(Gp:) Cámara (Gp:) Demod. Conv. (Gp:) CRT (Gp:) TV Color (Gp:) R (Gp:) G (Gp:) B (Gp:) Y+C (Gp:) Filtro (Gp:) CRT (Gp:) TV B&W (Gp:) Y (Gp:) Y+C (Gp:) G (Gp:) B (Gp:) R (Gp:) Y (Gp:) U (Gp:) V (Gp:) C (Gp:) Modulador (Gp:) Codificador

edu.red

2.1 Captura de vídeo analógico III Parámetros de barrido: Relación de aspecto (ancho:alto): 4:3 Existen distintos estándares: NTSC (Usa y Japón): 525 líneas, 30 frames/s PAL/SECAM (Resto): 625 líneas, 25 frames/s. Algunas líneas (superiores e inferiores) no son visibles. Durante el retorno vertical, se puede insertar información adicional (teletexto).

Barrido entrelazado y progresivo. Entrelazado. Cada cuadro se representa con dos campos sucesivos (uno con las líneas impares y otro con las pares) (60 c/s ó 50 c/s). 4

edu.red

2.1 Captura de vídeo analógico IV Parpadeo de imagen (flicker) Efecto que aparece cuando la imagen no es refrescada con suficiente rapidez. La retina mantiene una imagen durante un tiempo antes de que desaparezca. Valor mínimo: 50 imágenes/segundo

Continuidad de movimiento. Viene determinada por el número de cuadros diferentes por segundo. No se recomienda utilizar menos de 25 cuadros/s.

Ancho de banda de una señal de vídeo analógico: 6 MHz. 5

edu.red

2.2 Digitalización I ITU-R (CCIR-601): Estándar para la digitalización de señales de TV. Define los parámetros de muestreo, cuantificación, barrido y resolución de imagen que se deben tomar para digitalizar una señal de TV analógica.

Parámetros de barrido: Dos formatos (NTSC y PAL/SECAM) 525 líneas y 858 muestras/línea – 30 frames/seg. 625 líneas y 864 muestras/línea – 25 frames/seg. Las muestras corresponden a la luminancia (Y): Intensidad de luz de cada pixel (cantidad de blanco). Las diferencias de color Cr (U) y Cb (V) se muestrean a la mitad (429/línea, 432/línea): Sub-sampling 4:2:2. 6

edu.red

2.2 Digitalización II Cada línea tiene una zona visible (línea activa). Este estándar define una línea activa de 720 pixels. Se define un número de líneas visibles por cuadro: 480 (NTSC), 576 (PAL/SECAM). Barrido entrelazado: Un cuadro (frame) está formado por dos campos: El primero con las líneas impares y el segundo con las pares.

Frecuencia de muestreo única. 525x858x30* = 625x864x25 = 13,5 MHz. 7 (Gp:) Línea completa (Gp:) Línea activa 720 muestreos (Gp:) Tiempo

edu.red

2.2 Digitalización III Codificación y recodificación. Cada muestra RGB se codifica con 24 bits/color. La conversión de RGB a YCbCr (YUV) se realiza mediante una matriz de conversión (aproximada): Y = 0.3R + 0.6G + 0.1B U = B – Y (Diferencia de color azul) (equiv. Cb=U/2+128) V = R – Y (Diferencia de color rojo) (equiv. Cr=V/1.6+128) Cada uno de los componentes se codifica con 8 bits. Y (8 bits): rango 16-235 Cb (8 bits) y Cr (8 bits): rango 16-240

8 (Gp:)

R (Gp:)

G (Gp:)

B (Gp:) 720 (Gp:) 480 o 576 (Gp:)

Y (Gp:) 720 (Gp:) 480 o 576 (Gp:)

Cb (Gp:)

Cr (Gp:) 360 (Gp:) 480 o 576 (Gp:) Subsampling 4:2:2

edu.red

2.4 Tipos de vídeo (según su calidad) I La percepción de calidad de una señal de vídeo se basa en tres parámetros: La resolución de las imágenes. La frecuencia de reproducción (cuadros/s.). El tipo de barrido (progresivo o entrelazado)

Televisión de alta definición (HDTV). Existen diferentes variantes acerca HDTV. 1920×1080/60, 1920×1080/30-24, 1280×720/30-24 Relación de aspecto 16:9

Vídeo digital profesional (studio-quality). Estándar ITU-R (CCIR-601) de vídeo digital. 9

edu.red

2.4 Tipos de vídeo (según su calidad) II Vídeo de difusión (TV broadcast). Difusión de señales de televisión analógicas. Estándares NTSC y PAL/SECAM.

Reproductor de Vídeo (VCR-quality). Grabación de vídeo analógico (en VHS) Menor resolución de imagen (la mitad de PAL/SECAM).

Videoconferencia (Low-speed). Tasas de bits pequeñas (alrededor de 128 Kbps) Resolución de imagen 4 veces inferior al vídeo digital. ITU-TS H.261: Common Intermediate Format (CIF) 352×288 La secuencia de cuadros/s se reduce entre 5 y 10. 10

edu.red

2.5 Parámetros específicos de red I Lo que debe suministrar una red para el envío en tiempo real de una secuencia de vídeo.

Tasa de bits. 11

edu.red

2.5 Parámetros específicos de red II Retardo y varianza del retardo. Normalmente se envían una secuencia de vídeo sincronizada con el audio correspondiente. La sincronización es muy importante y necesaria desde HDTV hasta VCR. En Videoconferencia no es tan importante ya que la imagen no es continua (pocos cuadros/s). En estos casos, los requerimientos para estos parámetros los impone el audio (más sensible). Valores indicativos para la varianza del retardo: HDTV: 50 ms. Vídeo difusión: 100 ms. Videconferencia: 400 ms. 12

edu.red

2.5 Parámetros específicos de red III Tasa de error. El vídeo comprimido es más sensible a los errores. La degradación de la calidad de vídeo percibida depende: BER de la red Del tipo de error (simple, ráfaga, bloque, etc.) Donde se produce ese error. El índice de compresión de vídeo. Mecanismos de recuperación ante errores: Técnicas de protección de la señal. FEC (Forward Correction Codes). Marcas de resincronización. Reversible VLC. Técnicas de paquetización. Ocultación de errores (error concealment) Cuando se pierden bloques o llegan demasiado tarde. Técnicas de extrapolación e interpolación de cuadros. 13

edu.red

3.1 Redundancia temporal. Se basa en la similitud de cuadros sucesivos en una secuencia de vídeo. Ej.: Secuencias de plano estático. Se utilizan técnicas de codificación diferencial o transformada 3D Sólo se codificarán las diferencias entre cuadros sucesivos (DPCM). La reconstrucción de un cuadro puede estar basado en otro(s) anterior(es). Un algoritmo típico de eliminación de redundancia temporal (motion compensation) es el que emplea MPEG. 14

edu.red

Redundancia temporal (MPEG-1) Cuadros de referencia y cuadros auto-contenidos Si F1 lo usamos para construir F2, se dice que F1 es un cuadro de referencia (reference frame). Si un cuadro no se construye a partir de ningún otro, se dice que es auto-contenido (intracoded frame) Normalmente estos sirven de referencia para otros. Macrobloques (macroblocks) 16×16 pixels (6 bloques de 8×8: 4Y,1U y 1V). 15 (Gp:) F1

(Gp:) F2

(Gp:) F3

edu.red

Redundancia temporal (MPEG-1) Vectores de movimiento (motion vector) Identifican el desplazamiento de un determinado macrobloque en el cuadro actual respecto a la posición que tenía en el cuadro de referencia. Los vectores de movimiento se aplican cuando se identifica un macrobloque existente en el cuadro de referencia (matching blocks)

16 (Gp:) F1 (Gp:) F2 (Gp:) Macrobloques idénticos (Gp:) Vector de movimiento ?x = -20, ?y = 0 (Gp:) Cuadro de referencia

Partes: 1, 2

Página siguiente