Descargar

Estimación de movimiento

Enviado por Pablo Turmero


Partes: 1, 2

    edu.red

    Índice: 1.1 Introducción. 1.1.1 Proyección en perspectiva. 1.1.2 Proyección ortográfica. 1.2 Modelos paramétricos. 1.2.1 Movimiento 2D. 1.2.2 Estimación en perspectiva.. 1.2.3 Estimación afín. 1.3 Modelos no paramétricos. 1.3.1 Métodos (OFE). 1.3.2 Métodos por bloques. 1.3.3 Métodos recursivos. 1.3.4 Métodos bayesianos. 1.4 Nociones sobre compresión de vídeo (H.261, MPEG-1 y MPEG-2).

    edu.red

    1.1 Introducción. Se presentan modelos de la variación espacio-temporal de la intensidad espacial en la imagen sc(x1, x2, t) o sc(xc,yc,t). Esto supone la variación de los objetos de la escena 3D proyectados sobre el plano imagen 2D. Básicamente es:

    Movimientos de rotación, traslación y escalado. Cuerpos rígidos- Cuerpos no rígidos (modelos de deformidad). Supone pasar de un sistema (Xc, Yc, Zc, t) a un sistema (xc, yc, t)

    Modelo 3D de escena Formación de imagen + ruido Muestreo espacio-temporal

    edu.red

    1.1.1 Proyección en perspectiva. Modelo de cámara: En un plano ? llamado plano imagen, se forma la imagen mediante un operador llamado proyección en perspectiva. Componentes: A una distancia fija f del plano imagen, se localiza un punto Oc llamado centro óptico o punto focal. A esta distancia f se le denomina longitud focal del sistema óptico, y se usa para formar la imagen m en el plano imagen de un punto 3D. Así, denominamos m la intersección entre la línea OcM con el plano ?. El eje óptico es la línea que pasa por el centro óptico Oc y es perpendicular a plano imagen, cortando dicho plano en un punto c. Otro plano de interés (ver figura) es el plano F que pasa por el punto Oc y es paralelo al plano ?. A este plano se le denomina plano focal. Además, en el modelo podemos trabajar con el plano imagen por delante o por detrás del centro óptico, de manera que las imágenes que se forman en ambos planos, están invertidas una respecto de la otra (ver figura).

    edu.red

    1.1.1 Proyección en perspectiva.

    edu.red

    1.1.1 Proyección en perspectiva. Las coordenadas cartesianas del punto M respecto al centro óptico son M = (Xc, Yc, Zc)T. Este punto a su vez establece la dirección de un rayo respecto al centro óptico de forma que todos los puntos de la forma ?M = (?Xc, ?Yc, ?Zc)T pertenecen al rayo. Dicho rayo corta al plano imagen en el punto m = (xc, yc, f)T. Si dividimos por la longitud focal f podemos cambiar a coordenadas normalizadas de forma que el plano imagen a distancia unidad del centro óptico (xc?f, yc?f, 1)T. Entonces podemos establecer las siguientes relaciones:

    Este sistema puede ser escrito de forma lineal mediante álgebra proyectiva en coordenadas homogéneas dependiendo de un factor de escala ?:

    donde ? = Zc?f es un factor de escala, (Xc, Yc, Zc, 1)t son las coordenadas del punto M en 3D.

    edu.red

    1.1.2 Proyección ortográfica. Asume que todos los rayos de la escena, viajan paralelos unos a otros. Por esa razón también se le llama proyección paralela. El plano imagen es paralelo al plano formado por los ejes Xc y Yc del sistema de referencia mundo. Luego xc=Xc y yc=Yc y obtenemos la siguiente relación:

    donde xc y yc son las coordenadas del plano imagen. La distancia del objeto a la cámara no afecta a la distribución de intensidades de la imagen en el plano ortográfico. Da buenos resultados cuando la distancia del objeto a la cámara es mucho mayor que la profundidad relativa de puntos del objeto respecto al sistema de referencia del propio objeto. La observación de ruido en vídeo puede ser modelado en el proceso de discretización de la imagen. (filtraje y restauración)

    edu.red

    1.2 Modelos paramétricos.

    edu.red

    1.2.1 Movimiento 2D. Deseamos estimar el movimiento proyectado por un objeto en la imagen (velocidad y desplazamiento). Se observa el movimiento aparente (flujo óptico o correspondencia). Es necesario distinguir entre velocidad 2D y flujo óptico, y desplazamiento 2D y correspondencia entre regiones. Movimiento 2D o “movimiento proyectado” se refiere a la proyección en perspectiva u ortográfica del movimiento 3D en la imagen. Sea P un punto del objeto en tiempo t que se mueve a P’ en t’. La proyección en perspectiva en el plano imagen son p y p’ respectivamente. El desplazamiento entre tiempos t y t’= t+ l ?t donde l es un entero y ?t es el intervalo temporal de muestreo, permite definir una función del vector de desplazamiento dc(x, t; l ?t) a partir de variables continuas espacio-temporales (x,t)??3. El desplazamiento de coordenadas x de t a t’ basado en la variación de la intensidad sc(x, t) es llamado vector de correspondencia. El flujo óptico recoge ese cambio en velocidades (v1, v2)= (dx1/dt, dx2/dt) en un punto (x,t)??3. En la practica, obtenemos un campo de desplazamientos (velocidades).

    edu.red

    1.2.1 Movimiento 2D.

    edu.red

    1.2.1 Movimiento 2D. El flujo óptico, en general, es diferente al desplazamiento 2D (velocidad 2D): Falta de precisión en el gradiente espacial: Debe haber suficiente variación en la región de movimiento para que este sea observable. Cambios en la iluminación externa: El flujo óptico observable no siempre corresponde al movimiento actual. La iluminación externa varia entre frames (dirección de iluminación y sombras). En el problema de estimación de movimiento 2D se plantean 2 pasos: Estimación de los vectores de desplazamiento imagen-plano d(x,t;l?t) =(d1(x,t;l?t), d2(x,t;l?t)) entre t y t+l?t para todos los puntos. Estimación de los vectores de flujo óptico v(x,t) = (v1(x,t), v2(x,t))T. El problema de correspondencia puede realizarse hacia delante t+l?t o hacia atrás t-l?t. Registrado de imagen: Es un caso especial de correspondencia donde los dos frames son globalmente desplazados uno respecto del otro. Ej: Una escena estática tomada desde dos posiciones de la cámara.

    edu.red

    1.2.1 Movimiento 2D Movimientos relacionados con la cámara:

    edu.red

    1.2.1 Movimiento 2D Fig 5.2: Al hacer un zoom, las líneas salen de manera radial respecto de un punto que recibe el nombre de foco de expansión (FOE).

    Fig 5.3: En la figura de abajo se realiza una traslación pura en el eje X (hacia la derecha). Se puede observar como las líneas de flujo son paralelas y de modulo creciente a mayor profundidad.

    Fig 5.5: Se observa el flujo de imagen producido por movimiento combinado de traslación en el eje Z (hacia delante) y de rotación pura en el sentido negativo del eje Y. (a la derecha). El FOE parece que se ha desplazado hacia la derecha, aunque es un efecto engañoso y sigue situado en el centro.

    Partes: 1, 2
    Página siguiente