Ventajas de TV digital Inmunidad a ruidos Mejor performance que equipos analógicos. Hay cosas que en analógico no se pueden hacer. Facilidad relativa de procesamiento Compresión Precio VideoTape: Multicopia sin pérdida
Historia 70s TBCs, Convertidores de norma 80s DVEs, Sistemas de Gráficos Dificultad: interconexionado digital
90 Normalización Muestreo, Cuantificación, Codificación
Error de cuantificación S / Qrms (dB) = 20 log10 ( 2n Q . ? 12 / Q ) = 6,02 n + 10,8 8 bits ? 58.96 dB
Teniendo en cuenta efecto de ancho de banda limitado y de rango ocupado por la señal de video activo: S/Qrms ( dB )= 6,02 n + 10,8 + 10 log10( fs/2 fmáx )20 log10 [ Vq / (Vw-Vb)]
Ej: NTSC S/Qrms = 6,02 n + 10,8 + 10 log10(14,3/8,4) 20 log10(1,22/0,714) = 56,62 dB
Estándares digital compuesto Estándar 4fSC PAL
subcarrier PAL: fsc = 285,75 fh + 25 Hz = 4,43361875 MHz
número de ciclos de subcarrier por cuadro es igual a : fsc/25 = 177.344,75 ciclos/cuadro
número mínimo de cuadros que contiene un número entero de ciclos de subcarrier es cuatro cuadros: 4 . 177344,75 = 709.379 o sea 8 campos.
Frecuencia de muestreo: fs = 4 fsc = 17.734.475,00 Hz
número de períodos de muestras entre dos pulsos de sincronismo horizontal digitalizados : fs / fh = 17.734.475 / 15.625 = 1135,0064 número total de muestras por cuadro: muestras/cuadro = muestras/línea . línea/cuadro = 1135,0064 . 625 = 709.379 Se precisa un número entero de muestras por línea?1135 Las líneas 313 y 615 (fuera del campo activo) tienen 1137 muestras
Rango de cuantificación
S/Qrms ( dB ) = 6,02 n + 10,8 + 10 log10[ fs/(2 fmáx) ] 20 log10[ Vq/( Vw Vb )]
n = 10 bits por muestra fs = 17,72 MHz fmáx = 5 MHz Vq = 1,2131 V Vw Vb = 0,7 V ? S/Qrms = 68,71 db
Distribución paralela de la señal digital 4fSC Un par trenzado con blindaje por cada bit Más otro con el reloj NTSC ? 14.31818 MHz PAL ? 17.73447 MHz
Ojo: Sirve para distancias cortas por si hay diferencias de largo entre pares.
Estándares digital compuesto Estándar 4fSC NTSC
Estándares de digital componentes R, G, B o Y, R-Y, B-Y Esfuerzos comunes de normalización entre Norteamérica y Europa resultaron en norma CCIR 601, actualmente ITU-R 601 Norma para sistemas de 625/50 y de 525/60 8 o 10 bits de resolución
NTSC EB-Y = 0.493 (EB – EY ) ER-Y = 0.877 (ER – EY )
EBU N10 PB = 0.564 (EB – EY ) PR = 0.713 (ER – EY )
Frecuencia de muestreo Mínimo doble del ancho de banda. >12MHz Muestreo ortogonal. fSC=n*fH Frecuencia común para 525/60 y 625/50
Múltiplo de 15625 y 15734.26573 2.25 MHz ? 13.5 MHz Luminancia 6.75 MHz Crominancia
Y low-pass filter
Color-difference low-pass filter
S/Qrms(dB)=6,02 n+10,8+10log10[ fs/(2 fmáx)] 20 log10[ Vq/(Vw-Vb) ] n = 10 bits por muestra fs = 13,5 MHz fmáx = 5,75 MHz Vq = 0,8174 V Vw Vb = 0,7 V ?S/Qrms = 70,35 dB
?con 8 bits 58.3dB
n = 10 bits por muestra fs = 6,75 MHz fmáx = 2,75 MHz Vq = 0,7992 V Vw Vb = 0,7 V S/Qrms = 70,74 dB
?con 8 bits S/Qrms = 58,7 db
La estructura de muestreo 4:2:2
La señal de referencia temporal Dos señales de referencia temporal se multiplexan en el stream de datos. Inmediatamente antes y después de la línea digital activa (SAV y EAV) Cada señal son 4 palabras. 3FF 000 000 XYZ Las primeras 3 palabras son fijas, reservadas para identificación temporal. Identifican el comienzo de la información de sincronismo SAV y EAV.
XYZ es una palabra variable 1 F V H P3 P2 P1 P0 1 0 F identificación de campo F=0 campo 1 F=1 campo 2 V identificación de borrado vertical V=0 video activo V=1 borrado vertical H identificación de borrado horizontal H=0 para SAV H=1 para EAV P3 P2 P1 P0 son para corrección de errores simples y detección de errores dobles en FVH
Ancillary data Se pueden poner en cualquier lugar en que no haya datos de video o de referencia temporal. Horizontal ancillary data (HANC) en borrado horizontal. Header: 000 3FF 3FF Vertical ancillary data (VANC) en borrado vertical. Header: 000 3FF 3FF. Permitido en líneas 1 a 19 y 264 a 282 MENOS líneas 14 y 277 que se usan para time code de intervalo vertical (DVITC).
La estructura de muestreo 4:4:4
El muestreo 4:1:1
Muestreo 4:1:1 NTSC Y ? 720 X 480 R-Y, B-Y ? 180 X 480 PAL Y ? 720 X 576 R-Y, B-Y ? 180 X 576
La estructura de muestreo 4:2:0
Muestreo 4:2:0 NTSC Y ? 720 X 480 R-Y, B-Y ? 360 X 240 PAL Y ? 720 X 576 R-Y, B-Y ? 360 X 288
Relaciones de aspecto 4/3 y 16/9
DISTRIBUCIÓN DE LA SEÑAL DIGITAL SERIE Y MULTIPLEXADO DE DATOS
Bit-serial rate ( Mbps ) = Parallel bit rate ( Mpalabras/s ) ? Número de bits por palabra 4:2:2 ? Bit-serial rate = 27 Mpalabras/s ? 10 bits/palabra = 270 Mbps 4fsc ? NTSC: 143Mbps PAL: 177Mbps
Teorema de Shannon ? C (bps) = B log2 [ 1 + (S/N) ] C = Capacidad del canal (bps) B = Ancho de banda (Hz) S = Potencia recibida (W) N = Potencia del ruido (W)
En estudios el ruido es principalmente térmico N = kTB C ( bps ) = B log2 [ 1 + ( S/kTB ) ]
Codificación de canal NRZI incorpora más transiciones, necesarias para enganchar PLL del receptor para regeneración del reloj. Para evitar secuencias largas de 0s se reserva la palabra 0000000000 para sincronismo. Aún tiene componente DC.
Scrambler: hace aleatoria la salida, eliminando secuencias largas de 0s y 1s y patrones de datos repetitivos. Ayuda a sacar la componente DC. G1(X) = X9 + X4 + 1 polinomio característico G2(X) = X + 1
Diagrama de ojo Si BW = ? ? transiciones instantáneas Si no:
Distribución de bits serial 4:2:2 Son 270 Mbps
Capacidad de datos auxiliares Audio digital Time code Error Detection and Handling (EDH) Datos de control para uso futuro
Señal Normal
Señal con mucho overshoot y poca amplitud. Problemas con cables cortos.
Señal al final de un cable de 30 m. Aumenta rise-time y fall-time. Disminuye amplitud
Señal al final de un cable de 100 m. Esta señal puede ser regenerada por la mayor parte del equipamiento comercial disponible.
Señal al final de cable de 300 m. Algunos equipos pueden regenerarla. Para 270 Mbps límite normalmente entre 200 m y 300 m.
Digital Audio Multiplexing
Multiplexor de audio
Demultiplexor de audio
Consideraciones de planificación Entender los requerimientos de operación Hacer una lista de equipamiento genérico necesario para el proyecto Contactar fabricantes, obtener documentación, para seleccionar los equipos que mejor se adecuan a la operativa prevista (EDH, reporte de fallas, ecualización automática y reclocking) Pedir muestras
Consideraciones de instalación Instalar en racks con buena ventilación o refrigerados. Usar cables con la mínima longitud para la interconexión. Si el largo de un cable supera la capacidad de ecualización del receptor prever un amplificador distribuidor para reclocking en la mitad. No hay necesidad de preocuparse por tiempos y fases en las entradas porque los equipos tienen buffers.
Mantenimiento Fallas más que nada por paso del tiempo. ?Cambio de tarjetas (tarjetas en stock). Personal: Conocimiento de tecnología analógica y digital básica. Conocimiento del sistema y de sus partes. Conocimiento de la operación del sistema.
Operación Si el estudio está bien proyectado e instalado se necesita menos cuidado que en analógico. El operador de equipamiento generador (CCU, generador de caracteres, VTR y switchers) debería: Ver que el video analógico que genera es legal. Ver que su salida digital es correcta. Recién en el Master Control Room es necesario un monitoreo analógico.
Compresión de la señal digital y su distribución
Reducción de la tasa de bits en video Redundancia estadística de datos. Redundancia espacial. Redundancia temporal. Redundancia psicovisual. El sistema visual humano no percibe de la misma forma todos los valores posibles de las muestras. Entropía Medida de la cantidad de información de la imagen. Un evento menos probable provee más información que que uno más probable. Si se reduce el bit rate por debajo del valor de la entropía de una imagen, parte de la información de la imagen se perderá.
Características del Sistema Visual Humano Sensibilidad de frecuencia espacial: altas frecuencias son menos visibles. Errores en regiones texturadas son difíciles de ver. Somos muy sensibles a errores en regiones uniformes. Errores cerca de los bordes son difíciles de ver. El umbral visual aumenta con la iluminación del fondo. Errores en porciones claras son más difíciles de ver. La sensibilidad es mayor a bajas frecuencias espaciales y menor en las altas
Técnicas de reducción de la tasa de bits
Transformada de coseno discreta – DCT
Matriz de cuantificación
Zigzag scanning
Codificación de largo variable (VLC)
Decodificador DCT – Transformada inversa
Medición de los errores e( j,k ) = f( j,k ) f*( j,k )
Root-mean-squared error Picture Signal Noise Ratio
En los ejemplos anteriores Ejemplo 1: RMSE = 3.26 PSNR = 37.9 Db
Ejemplo 2: RMSE = 7.47 PSNR = 30.66 dB
Técnicas temporales de reducción de datos Problema: no es satisfactorio cuando hay movimiento entre los cuadros
Técnica de predicción de compensación de movimiento Se calculan los vectores de movimiento en base a los macrobloques de la señal de luminancia Se transmiten los vectores de movimiento junto con los coeficientes DCT diferencia en el macrobloque actual
Se define una estructura llamada Group of Pictures (GOP) m que define el número de cuadros desde el primer I hasta el último B o P del GOP n que define el número de cuadros B entre dos cuadros P GOPs típicos: PAL ? 12, 2 NTSC ? 15, 2
Técnicas de procesado complementarias Prefiltrado: sacar altas frecuencias para evitar artifacts. Como contra: pérdida de resolución en la imagen. Reducción de ruido. Hay diversas técnicas para sacarlo, ya que el ruido es difícil de codificar y lleva mucho bitrate.
Jerarquía de datos de video MPEG-1 y MPEG-2 Bloque 8×8 píxeles. Base para DCT Macrobloque grupo de bloques. 16×16. El header del macrobloque tiene información de su tipo (Y, CB, CR) y de los vectores de movimiento correspondientes. Slice Formada por uno o más macrobloques contiguos. El header del slice contiene información sobre su posición en la imagen y el factor de cuantización usado. Protección de errores. El coeficiente DC de referencia es actualizado al comienzo de cada slice.
Jerarquía de datos de video MPEG-1 y MPEG-2 (continuado) Picture Dice qué tipo de cuadro es (I, B o P). En el header: orden de transmisión-despliegue, sincronización, resolución, y el rango de los vectores de movimiento. GOP Empieza siempre por un cuadro I. Provee puntos de comienzo para edición. El header tiene código de tiempos y control de 25 bits. Video Sequence Header, uno o más GOPs y un código de fin de secuencia. Información de tamaño horizontal y vertical, pixel aspect ratio, bit rate, picture rate, minimum decoder buffer size. Constituye el encoded bit stream o video elementary stream.
MPEG-1 ISO/IEC 11172 Desarrollado para uso de video y audio a 1.5 Mbps aprox. Usos: almacenamiento, video games, publicaciones electrónicas y educación. Formato CSIF (common source intermediate format) a 30fps, aceptable, similar o superior a VHS
Estándar MPEG-1 Parámetros restringidos para reducir la complejidad y el costo del decoder. 6 capas de jerarquía para la sintaxis del bit stream. Dos modos de funcionamiento: Intraframe: DCT, cuantificación, codificación VLC Interframe: Motion estimation, predicción motion-compensated para generar los cuadros P y B. NO ESPECIFICA EL ALGORITMO
Características MPEG-1 Un espacio de color posible (Y, CB, CR) Una estructura de muestreo (4:2:0) Máximo tamaño 720×576 Muestreo de 8 bits Precisión de 9 bits en proceso de DCT y cuantificación Cuantificador lineal DPCM para coeficiente DC Proceso de cuantificación adaptativa en capa de macrobloque
Características MPEG-1 La precisión máxima del coeficiente DC: 8bits Las matrices de cuantificación pueden ser cambiadas en el nivel de secuencia. Es única para Y, CB y CR . RLC usa un esquema de Huffman modificado Tablas VLC no downloadables Compensación de movimiento que permite compresión intraframe e intrafield. Sólo scanning progresivo
Características MPEG-1 Usa cuadros P y B Resolución de estimación de movimiento de medio pixel Algoritmo asimétrico Máximo bit rate de 1.85 Mbps Permite acceso aleatorio de los cuadros de video, fast-forward/fast-reverse search, edición Es un subset de MPEG-2. Un decoder MPEG-2, decodifica MPEG-1
MPEG-2 Extensión de MPEG-1. Mayor rango de aplicaciones a bit rates más altos, levantando muchas de sus restricciones El estándar sólo define la sintaxis del bit-stream y el proceso de decodificación
Características MPEG-2 Estructuras de muestreo 4:4:4, 4:2:2 y 4:2:0 Los coeficientes DC pueden ser expresados con precisión extra Las matrices de cuantificación pueden ser cambiadas en el nivel de cuadro Diferentes matrices de cuantificación para luminancia y componentes de crominancia Capacidad de scanning interlaceado y progresivo. Permite estimación de compensación basada en esquema predictivo de campos
Características MPEG-2 Predicciones por campo o por cuadro Capacidades de detección e indicación de errores reducen la sensibilidad de la señal a errores de transmisión. Frecuentes start codes permiten la resincronización de los decoders VLC. Vectores de movimiento ocultos se usan para reducir la visibilidad de slices perdidos Cada picture header puede tener su tabla de cuantificación
MPEG-2 Levels and Profiles Las características y las herramientas de MPEG-2 son muchas para una variedad de aplicaciones. La integración en una sola sintaxis de bit-stream es complicada Se definen PROFILES (perfiles) que son subconjuntos jerárquicos Cada profile se asocia a LEVELS (niveles) que describen un conjunto de parámetros como tamaño de imagen, estructura de cuadro (I, B, P), máximo data rate, máximo frame rate y estructura de muestreo
Distribución de señales comprimidas