Descargar

Introducción al tratamiento de imágenes

Enviado por Pablo Turmero


    edu.red

    1 Preprocesamiento 1 Las entradas y salidas del sistema son imágenes de intensidad. Sus objetivos son: Rectificar distorsiones que se pueden modelar. Mejorar la calidad de la imagen. Se emplean como procesos generales en las etapas iniciales. Los métodos de preprocesamiento se clasifican en 4 categorías según el tamaño de la vecindad del pixel. Transformaciones de brillo del pixel. (Point Operations) Transformaciones geométricas. Transformaciones de vecindad del pixel. Otra clasificación es métodos de mejora o de restauración.

    edu.red

    2 Preprocesamiento 2 Para corregir efectos de la degradación de la imagen es importante la naturaleza de la información a priori: Grupo de métodos que no usan conocimientos acerca de la naturaleza de la degradación. Grupo que asume conocimientos acerca del dispositivo de adquisición de la imagen y las condiciones con que se adquirió. Grupo que usa conocimientos acerca de lo que se busca en la imagen.

    edu.red

    3 Transformaciones de brillo del pixel. La transformación depende del valor del pixel. 2 categorías. Corrección del brillo: Modifica el valor atendiendo al valor original del pixel y a su posición en la imagen. f(i,j) = e(i,j) * g(i,j) g(i,j) : imagen ideal e(i,j) : cambios en la imagen ideal (calcular) f(i,j) : imagen captada Transformación de escala de gris: No dependen de la posición del pixel en la imagen. q = T(p) [p0 , pk] ? [q 0 , q ] Estas transformaciones se realizan fácilmente con tablas LUT (tablas de consulta), hardware o software. En general no son reversibles, suele haber mapeos varios a uno. Se utilizan mucho cuando la imagen va a ser vista por un observador humano.

    edu.red

    4 Operaciones con LUT (Look Up Table) p1 p2

    q

    p 0 0 0 0 1 2 95 96 255 255 255 255 Tabla LUT (tabla de consulta) (Gp:) a (Gp:) a) transf. inversa

    (Gp:) b (Gp:) b) realce entre p1 y p2

    (Gp:) c (Gp:) c) umbralización

    edu.red

    5 Compresión de rango En comparación con la visión humana la imagen digital tiene un rango dinámico menor. El bajo contraste en las imágenes digitales las hace aparecer de baja calidad cuando nos enfrentamos a escenas en las que hay un contraste alto. Podemos perdernos detalles en las partes oscuras. Las partes brillantes se blanquean. El rango dinámico se puede incrementar por medio de la transformación ganma.

    Esta transformación aumente el rango dinámico en las partes más oscuras a costa de las partes más claras de la imagen. Se adapta así mejor a la característica logarítmica del ojo humano.

    edu.red

    6 Ejemplo de mejora del contraste Imagen original (Gp:) Imagen con mejor contraste

    (Gp:) Transformación del nivel de gris

    edu.red

    7 Corrección de iluminación no uniforme A pesar de nuestros esfuerzos por tener una iluminación homogénea esta no será posible de obtener por completo. Estos efectos se hacen más aparentes en casos de fondo uniforme. El propio dispositivo sensor introduce errores. Es posible corregir estos efectos teniendo un conocimiento a priori de su naturaleza y contando con imágenes de referencia. Asumimos que los valores de gris se deben a la irradiancia no homogénea de la imagen y la reflectividad del objeto. Se puede suponer un coeficiente de error multiplicativo g(i,j)=e(i,j)f(i,j) Se supone que puede tomar una imagen de referencia constante C, la imagen degradada de esta referencia será fc(i,j) => e(i,j)=fc(i,j)/c El error sistemático puede eliminarse con g(i,j)=(fc(i,j)/c ))f(i,j) Este método puede usarse si la degradación es estable.

    edu.red

    8 Ejemplo de iluminación no uniforme 1 Imagen con iluminación no uniforme Histograma de la imagen

    edu.red

    9 Ejemplo de iluminación no uniforme 2 Imagen del fondo Histograma del fondo

    edu.red

    10 Ejemplo de iluminación no uniforme 3 Imagen corregida, sustrayendo el fondo y estirando el histograma Histograma de la nueva imagen

    edu.red

    11 Transformación del histograma. El histograma es una representación de la distribución de pixels con un nivel de gris. Trata a cada valor r, nivel de gris como una variable aleatoria. Sobre ella puede aplicarse una transformación s=T(r). T debe cumplir ser monótona creciente. Debe abarcar todo el rango de valores de r. La función inversa r=T-1(s) cumple las mismas condiciones. Se pueden definir funciones de densidad de probabilidad pr(r) ps(s) entonces si se conoce T y se verifican las condiciones impuestas:

    Las técnicas de mejora siguientes se basan en modificar la apariencia del histograma mediante una transformación T.

    edu.red

    12 Ecualización Se define una transformación T(r), que es la integración

    Ejemplo Sea pr(r) una función de transformación entre 0 y 1 pr(r)=-2r+2

    edu.red

    13 Aplicación al caso discreto Se definen las probabilidades para los niveles de gris.

    Por efecto del cálculo discreto esta función de densidad de probabilidad ps(s) no resulta plana. La transformación inversa no se emplea en la ecualización de los histogramas aunque si en otras aplicaciones. Pueden realizarse ajustes a histogramas con distintas formas, esto se conoce como especificación de histograma. Es posible aplicar ecualizaciones locales dividiendo la imagen en regiones.

    edu.red

    14 Ejemplo de ecualización Imagen original Imagen ecualizada Transformación de nivel de gris

    edu.red

    15 Especificación de histogramas Se puede transformar una imagen de tal forma que su histograma se ajuste a uno cualquiera predeterminado. Como en el caso de la ecualización en el caso continuo la solución es exacta mientras que en el discreto solo se aproxima. Se parte de suponer conocida la imagen que deseamos obtener. (Gp:) Imagen g igualada de f (Gp:) T(r) (Gp:) s

    (Gp:) Imagen l igualada de h (Gp:) G(z) (Gp:) v

    (Gp:) G-1(s)

    (Gp:) Imagen f original (Gp:) r (Gp:) pf(r)

    (Gp:) Imagen h especificada (Gp:) z (Gp:) ? (Gp:) ph(z)

    edu.red

    16 Transformación de la escala de grises Con la dilatación (stretching) se pretende aprovechar todos los niveles de la escala de grises.

    También es posible dilatar un intervalo a la vez que se contrae otro.

    r0 a b rL-1 rk rk niveles de salida niveles de entrada rL-1

    edu.red

    17 Transformaciones geométricas Permiten eliminar distorsiones geométricas introducidas a la hora de la captura de la imagen. También se emplean en gráficos por computador (traslación, escalado, rotación, perspectiva). x’ = Tx (x , y) y’ = Ty (x , y)

    La transformación se realiza en dos pasos. Transformación de las coordenadas del pixel, tratándolas como números reales, luego se ajustan a la rejilla ya que en general no coincidirán con un punto de la misma. El brillo se ajusta como una interpolación de niveles de gris.

    edu.red

    18 Interpolación del brillo Se debe obtener el valor de nivel de gris para cada nuevo punto de la rejilla tras la transformación de coordenadas. La interpolación puede verse como una operación de convolución. Interpolación en la vecindad más cercana. Puede producir efecto de escalonado. Interpolación lineal (bilineal) Establece una recta entre dos puntos de la rejilla (muestreo) y calcula en ella el valor de un punto intermedio.

    Difumina un poco los contornos, efecto de promediado.

    4 3 2 1 1 (x,y)

    edu.red

    19 Interpolación lineal 1 La interpolación bilineal es separable, puede por tanto establecerse a partir de dos transformaciones lineales. Adoptando coordenadas espaciales normalizadas Dos puntos de la rejilla caerían en -1/2 1/2, entonces : Kernel de la convolución

    edu.red

    20 Interpolación lineal 2

    1/4 3/4 1/4 1/2 3/4 1/2 1 Transformada de la interpolación lineal

    edu.red

    21 Interpolación del brillo 2 Interpolación bicúbica. (polinomial de orden 3) Es más costosa computacionalmente.

    Interpolación por Spline Evita la perdida de derivabilidad en los puntos de la rejilla.

    edu.red

    22 Zoom e interpolación (Gp:) Interpolación por el más cercano

    (Gp:) Interpolación bilineal

    (Gp:) Interpolación bicúbica

    edu.red

    23 Preprocesamiento local 1 Usan los valores de brillo de una vecindad pequeña para calcular el brillo del pixel en la nueva imagen. Se pueden establecer varias clasificaciones con dos categorías en cada una: Suavizamiento (filtro pasa bajos, elimina ruido y difumina). Operadores de gradiente (filtro pasa altos, resalta los contrastes).

    Operadores lineales (convoluciones, filtros). Operadores no lineales.

    Operadores en el dominio del espacio. Operadores en el dominio de la frecuencia. Se usa poco conocimiento a priori.

    edu.red

    24 Preprocesamiento local 2 Debe fijarse un tamaño de vecindad, que se llama ventana o máscara del filtro. Puede ser rectangular o de cualquier otra forma, generalmente cuadrado y número de elementos impar. Debe definirse la posición del pixel de estudio respecto a la ventana, generalmente y por simetría el central. En una convolución las propiedades del filtro vienen dadas por los coeficientes de la máscara. Hay problemas de orlado del contorno. Duplicación periódica. Duplicación del borde. Puesta a cero del contorno. Suprimir borde

    edu.red

    25 Filtros recursivos. Incorporan los resultados que se están obteniendo durante la convolución en la operación que se realiza con el siguiente pixel. Si el filtro solo depende de valores anteriores de señal se denomina causal. En el dominio del tiempo los filtros deben ser causales, con imágenes pueden no serlo. Suelen actuar como filtros paso-baja. Entre las propiedades de los filtros recursivos están: La respuesta impulso (PSF) es infinita, por ello también se les conoce como filtros IIR en contraposición con los FIR (donde el tamaño de la respuesta es igual al de la máscara). Los filtros IIR, al contrario que los FIR, no son siempre estables. Cualquier filtro recursivo puede sustituirse por uno no recursivo, generalmente de máscara infinita (dada por la PSF del IIR).

    edu.red

    26 Filtros no recursivos (FIR) No incorporan los resultados que se están obteniendo durante la convolución en la operación que se realiza con el siguiente pixel. Solo dependen de los valores de la señal de entrada. En el procesamiento de imagen en el dominio temporal los filtros más empleados son FIR no causales. Trabajan sobre un conjunto infinito de frecuencias. Se emplean filtros lineales e invariantes (LSI). Entre sus propiedades destacan: Conmutatividad (no confundir con producto de matrices). Asociatividad (máscaras separables). 9 productos y 8 sumas pasan a 6 productos y 4 sumas. No todos los filtros son separables Distributiva respecto a la adición.

    edu.red

    27 Filtros combinados Hay filtros que pueden considerarse una combinación de los anteriores. Parten de un compromiso entre la actuación en el dominio del tiempo y el de la frecuencia. Marr y Hildreth establecieron un parámetro de incertidumbre donde ? y X son la extensión de actuación en el dominio de la frecuencia y espacial respectivamente. La incertidumbre está acotada inferiormente ?U ? 1/2 Un operador de suavizado es más óptimo cuanto más se acerque al valor 1/2 en su incertidumbre.

    edu.red

    28 Suavizamiento de imagen (smoothing) El objetivo es eliminar ruido. La idea básica es que en pixels pertenecientes a una región los valores deben ser semejantes. Puede hacerse tomando varias imágenes de una escena estática.

    Se calcula el valor promedio en una vecindad por convolución.

    Promediado : hay diversas máscaras posibles, todas ellas se normalizan.

    edu.red

    29 Suavizamiento de imagen 2 El ruido, cambio brusco de intensidad, es una señal de alta frecuencia. El principal inconveniente de este método es que difumina los contornos (bluring). A mayor ventana mayor difuminado. Para evitarlo se pueden emplear varias opciones: Promediar solamente pixels que cumplan cierta condición: El valor del pixel cae en un rango f(i,j) ?[min,max] La diferencia de pixels no excede de una cota. Utilización previa de gradientes, solo se emplearán los puntos cuyo gradiente sea inferior a un umbral. Promediar de acuerdo a un gradiente inverso. Promediar utilizando máscaras rotatorias, busca partes homogéneas en la vecindad del pixel.

    edu.red

    30 Propiedades de los filtros de suavizamiento No deben desplazar la posición de los objetos en la imagen. Deben ser de fase cero, por tanto su función de transferencia es real, deben tener una máscara simétrica. Deben preservar la media La componente de f=0 debe ser 1, la suma de todos los coeficientes de la máscara es 1. Función de transferencia decreciente monótona. Deben eliminarse los objetos pequeños antes que los grandes. La función de transferencia decrece monótonamente con la f. Isotropía, no debe favorecerse ninguna dirección (en los espacios discretos solo se consigue aproximadamente).

    edu.red

    31 Tipos de filtros de suavizamiento Filtros de caja (por convolución). Suavizamiento de la mediana. Reemplaza el valor del pixel por el de la mediana de un entorno de vecindad. No emplean técnicas de convolución, ordenación de números. Muy buen resultado con ruido impulsional. Son computacionalmente más costosos. Filtros definidos en frecuencia: El ruido es alta frecuencia, eliminable con filtros paso bajo: Filtros discretos finitos (FIR). Filtros discretos infinitos (IIR). Filtros analógicos discretizados (Buterworth u otros). Filtrado por convolución con una máscara de tipo Gaussianno. La desviación típica condiciona el tamaño de la máscara.

    edu.red

    32 Filtros de caja Funcionan promediando en un entorno de vecindad.

    Se observa su labor de suavizamiento, pero no respetan bien las escalas.

    R=1/3+2/3*cos(?K) El uso de filtros mayores no mejora significativamente los resultados Los filtros de caja son separables. No son isótropos (Gp:) 3 (Gp:) 5 (Gp:) 7 (Gp:) 9

    edu.red

    33 Filtros binomiales 1. A partir de un filtro sencillo B=1/2[11] pueden obtenerse por convolución filtros más complejos Bp=B*B*B…..*B (p veces). p f Coeficientes del filtro ?2 0 1 1 0 1 1/2 1 1 1/4 2 1/4 1 2 1 1/2 3 1/8 1 3 3 1 3/4 4 1/16 1 4 6 4 1 1 5 1/32 1 5 10 10 5 1 5/4 6 1/64 1 6 15 20 15 6 1 3/2 La función de transferencia se obtiene a partir de:

    edu.red

    34 Filtros binomiales 2. Ofrecen un mejor suavizado que los filtros de caja. Para máscaras grandes se aproxima a una distribución gaussiana. A mayor máscara menor es la frecuencia de corte. Es más isotrópico que los filtros de caja. Son separables para el caso 2D. Bp=Bpx Bpy.

    2 4 8 16

    edu.red

    35 Filtros Gaussianos 1. Se aplican mediante convolución con una máscara cuyo tamaño y valor depende de la varianza ? según la fórmula:

    A mayor ? más atenúa y más voluminoso y lento es el filtro. Mediante ? se afecta a la resolución del filtro, a menos varianza menor cantidad de detalle que se pierde. Se trata de un filtro separable

    Son también base para filtros detectores de contorno. Se puede asumir como ancho de caja W

    edu.red

    36 Filtros Gaussianos 2.

    edu.red

    37 Filtros de mediana Son filtros no lineales que funcionan bien con ruido impulsional. Su funcionamiento se basa en el ordenamiento de una vecindad contenida en el tamaño de una máscara. Tras ordenar los pixels de la vecindad el valor del pixel en estudio es sustituido por la mediana de la vecindad. Ejemplo con máscara 1*3 …..1 2 3 7 8 9 …… …..1 2 3 7 8 9 …… …..1 2 36 4 5 6 …… …..1 2 4 5 5 6 …… …..0 0 0 9 9 9…… ….. 0 0 0 9 9 9 …… Preservan bastante bien los contornos sin difuminarlos. Computacionalmente son más costosos que los basados en convoluciones.

    edu.red

    38 Comparación filtro de promediado y de mediana. Ventana 5*1 Imagen original Filtro promediado Filtro de mediana

    edu.red

    39 Suavizamiento de una imagen con ruido impulsional Imagen original Imagen con ruido Imagen filtrada Promediado 3*3 Mediana 3*3

    edu.red

    40 Suavizamiento de una imagen con ruido gaussiano Imagen original Imagen con ruido Imagen filtrada Promediado 3*3 Mediana 3*3

    edu.red

    41 Propiedades de los detectores de contorno 1 La detección de contornos es un paso típico, previo a muchos procesos de segmentación. La visión humana emplea mucho la detección de contornos. Hay dos tendencias: Uso de derivadas. Encaje de modelos. Un buen detector de contorno debería verificar: El contorno obtenido debe ser fino. (única respuesta). El contorno debe aparece en su lugar correcto, no estar desplazado. No debe mostrar respuestas en regiones uniformes. (Buena detección) Los contornos implican cambios bruscos en los niveles de gris: Esto es una señal de alta frecuencia. La derivada de la función de intensidad luminosa es alta, más cuanto más fuerte sea el contorno.

    edu.red

    42 Detectores de contorno derivativos (Gp:) Derivada primera

    (Gp:) Derivada segunda

    edu.red

    43 Propiedades de los detectores de contorno 2 Un filtro derivativo de orden p corresponde a una multiplicación por (ik)p en el espacio frecuencial (k=frecuencia). Sin desplazamiento: En los filtros de promediado implica que la función de transferencia es real y que la máscara de convolución es simétrica. Para un filtro derivativo de primer orden la función de transferencia debe ser imaginaria y la máscara de convolución antisimétrica. (h-n = – hn ). Para una máscara con nº pixels impar => pixel central=0. Un filtro derivativo de 2º orden debe ser simétrico, como los de suavizamiento. Supresión del valor medio, no deben responder a niveles continuos. La suma de los coeficientes debe ser cero La función de transferencia debe ser 0 para k=0.

    edu.red

    44 Propiedades de los detectores de contorno 3 Derivación no selectiva, amplifica más las escalas pequeñas que las grandes, la función de transferencia debería incrementarse con la frecuencia monótonamente. Propiedades de simetría, para permitir el cálculo de la convolución de manera más eficiente. También ayuda en el uso de la función de transferencia pues solo existen términos en senos (imaginarios). Isotropía, no debe haber direcciones privilegiadas. Esta propiedad se puede analizar mejor estudiando las funciones de transferencia.

    edu.red

    45 Detectores de contorno basados en derivadas Hay dos clases principales de detectores Emplean derivadas de primer orden. Emplean derivadas de 2º orden. Se puede utilizar el vector gradiente que da información de la dirección de máxima variación de la magnitud.

    El módulo del gradiente informa acerca de la fuerza del borde.

    La dirección de contorno viene dada por:

    edu.red

    46 Aproximaciones al gradiente Diferencias discretas de primer orden .

    Calculo en dos dimensiones Detección de filas Detección de columnas Combinación del gradiente F(j,k)

    edu.red

    47 Operadores de gradiente El gradiente se puede calcular por aproximación discreta:

    También es posible calcular la laplaciana de manera discreta.

    Este último operador no suele emplearse directamente, produce bordes dobles y es muy sensible al ruido. Sin embargo sus pasos por cero si son buenos indicadores de contornos.

    edu.red

    48 Detección con máscaras múltiples Se toma una base de vectores y se proyecta sobre ella una vecindad de pixels. En esencia se basa en realizar convoluciones con una serie de máscaras que forman una base. Se calcula el módulo para cada proyección. La respuesta mayor da ya el módulo y la dirección del gradiente.

    3 de las 12 máscaras de Kirsch. En esencia se correla la imagen con patrones en todas las direcciones posibles.

    edu.red

    49 Detección de contornos con operadores de gradiente 1

    Imagen original con borde en escalón 0 0 0 10 10 10 10 10 0 0 0 0 0 0 10 10 10 10 10 0 0 0 0 0 0 10 10 10 10 10 0 0 0 0 0 0 10 10 10 10 10 0 0 0 0 0 0 10 10 10 10 10 0 0 0 0 0 0 10 10 10 10 10 0 0 0 0 0 0 10 10 10 10 10 0 0 0

    edu.red

    50 Detección de contornos con operadores de gradiente 2

    (Gp:) 0 0 20 20 0 0 0 20 20 0 0 0 0 30 30 0 0 0 30 30 0 0 0 0 30 30 0 0 0 30 30 0 0 0 0 30 30 0 0 0 30 30 0 0 0 0 30 30 0 0 0 30 30 0 0 0 0 30 30 0 0 0 30 30 0 0 0 0 20 20 0 0 0 20 20 0 0 (Gp:) 1 0 -1 2 0 -2 1 0 -1 (Gp:) Sobel

    (Gp:) 0.1667 0.6667 0.1667 0.6667 -3.3333 0.6667 0.1667 0.6667 0.1667 (Gp:) Laplaciana (Gp:) 0 0 8 18 9 9 9 18 8 0 0 0 0 10 9 0 0 0 9 10 0 0 0 0 10 9 0 0 0 9 10 0 0 0 0 10 9 0 0 0 9 10 0 0 0 0 10 9 0 0 0 9 10 0 0 0 0 10 9 0 0 0 9 10 0 0 0 0 8 18 9 9 9 18 8 0 0

    edu.red

    51 Imagen de prueba, bordes en rampa

    edu.red

    52 Detección de contornos en rampa

    (Gp:) 0 0 0 12 24 24 24 24 12 0 0 0 0 0 0 16 32 32 32 32 16 0 0 0 0 0 0 16 32 32 32 32 16 0 0 0 0 0 0 16 32 32 32 32 16 0 0 0 0 0 0 16 32 32 32 32 16 0 0 0 0 0 0 16 32 32 32 32 16 0 0 0 0 0 0 16 32 32 32 32 16 0 0 0 0 0 0 12 24 24 24 24 12 0 0 0 (Gp:) Con operador de Sobel

    (Gp:) 0 0 0 3 3 8 11 15 23 19 19 19 0 0 0 4 0 0 0 0 3 0 0 0 0 0 0 4 0 0 0 0 3 0 0 0 0 0 0 4 0 0 0 0 3 0 0 0 0 0 0 4 0 0 0 0 3 0 0 0 0 0 0 4 0 0 0 0 3 0 0 0 0 0 0 4 0 0 0 0 3 0 0 0 0 0 0 3 3 8 11 15 23 19 19 19 (Gp:) Con operador de Laplace

    edu.red

    53 Detección de contornos con filtros de Sobel (Gp:) Imagen original

    Imagen filtrada

    (Gp:) Contornos horizontales Contornos verticales

    edu.red

    54 Detectores de gradientes Máscaras comunes para el cálculo de gradientes. (Gp:) Gradiente de fila (Gp:) Gradiente de columna (Gp:) Gradiente de fila (Gp:) Gradiente de columna

    Hf(i,j) Hc(i,j) | · | +| · | F(i,j) > umbral en (i0,j0) ? |G(i,j)| Si, es punto de borde No, no es punto de borde

    edu.red

    55 Combinación de suavizado y gradiente Para que el operador gradiente sea menos vulnerable al ruido puede suavizarse la imagen previamente.

    HG es un operador cualquiera de gradiente y HS lo es de suavizado. Un operador que combina gradiente y suavizado de manera más eficaz es DroG (“Derivative of Gaussian”).

    edu.red

    56 DroG Dado que gradiente y convolución son operadores lineales:

    El operador DroG se define, teniendo en cuenta el carácter separable de la gaussiana:

    Es preciso discretizar esta fórmula, dependerá del valor de ?.

    edu.red

    57 Detección con Laplaciana de la Gaussiana. Este tipo de detección se realiza en varios pasos: Convolución de la imagen con una máscara de Gauss G(x,i). Convolución del resultado con una máscara de Laplace. Detección de los pasos por cero de la imagen resultado. Tiene varias propiedades que simplifican su uso: Los operadores son conmutativos, por lo que para una varianza dada puede derivarse un filtro único llamado LOG.

    Es separable en 4 convoluciones unidimensionales (reduce las operaciones del orden n2 a 4n).

    edu.red

    58 El operador LOG El operador Laplaciana es muy sensible al ruido, por lo que se combina con la Gaussiana.

    El operador LoG presenta simetría radial y se parece a un sombrero mejicano. La combinación de un filtro pasa-baja (gaussina) y pasa-alta (Laplaciana) da lugar a un filtro pasa banda controlado por ?. Su calculo se puede separar.

    edu.red

    59 El operador DOG Una alternativa a la expresión anterior es aproximar el cálculo de LOG por una Diferencia de Gaussianas (DOG) para desviaciones típicas ?1 < ?2

    Marr y Hildreth demostraron que la proporción ?2 / ?1=1.6 es la que mejor se aproxima al operador LOG. Al igual que sucede con la Laplaciana los cruces por cero obtenidos tras aplicar el LOG suelen producir contornos cerrados. Tras aplicar LOG (DOG) se requiere detectar los cruces por cero.

    edu.red

    60 Detector de Marr y Hildreth Establecieron que los cambios de intensidad en imágenes reales ocurren sobre un amplio rango de escalas o resoluciones. Un único filtro no pude ser óptimo para todas ellas. Proponen un suavizado previo a distintas escalas o niveles. Después detectan los cambios de intensidad en cada nivel. A la hora de suavizar una imagen se considerará: Debe reducir el rango de escalas en el que se producirán cambio de intensidad. Su actuación debe estar localizada en frecuencia. Las discontinuidades se originan por distintos motivos. En el dominio espacial todos estos cambios pueden producirse a distintas escalas espaciales.

    edu.red

    61 Detección de contornos con laplaciana de la gaussiana (LOG) (Gp:) Imagen original

    (Gp:) Filtrada con varianza 2.3

    (Gp:) Filtrada con varianza 1.5

    (Gp:) Filtrada con varianza 0.8

    edu.red

    62 Detector de Canny Está basado en un desarrollo analítico de optimización partiendo de un modelo continuo unidimensional de un escalón. La función h buscada debe satisfacer los criterios: Buena detección maximizando la relación señal ruido Buena localización Respuesta única En señales bidimensionales discretas el operador de Canny se aproxima mediante la derivada de la Gaussina en la dirección perpendicular al borde. Calcular módulo y gradiente de la imagen suavizada aplicando DroG En la dirección del gradiente eliminar los puntos que no sean máximos locales (equivale a buscar pasos por 0)

    edu.red

    63 Segmentación de la imagen Es el proceso que divide la imagen en regiones u objetos cuyos píxeles poseen atributos similares (niveles de gris, textura etc.) Se pueden clasificar en : Técnicas basadas en la detección de fronteras Técnicas de umbralización. Técnicas basadas en el agrupamiento de píxeles.. En las dos últimas categorías se estima que: Píxeles de una misma región deben ser similares. Píxeles de regiones distintas deben ser no-similares. Las regiones resultantes deben tener cierto significado para el procesamiento posterior.

    edu.red

    64 Enlazado de bordes y detección de límites Idealmente, tras pasar un detector de contornos, se obtendrían líneas continuas de alta intensidad sobre un fondo oscuro pero: El ruido introduce puntos espureos. Una iluminación no uniforme falsea los contornos. Hay contornos que pueden aparecer debilitados. Se deben aplicar algoritmos de seguimiento de contornos, algunos métodos son: Procesamiento local. Procesamiento global con la transformada de Hough. Procesamiento global con técnicas de la teoría de grafos.

    edu.red

    65 Procesamiento local. Se analizan las características de los pixels en una pequeña vecindad (3*3 o 5*5) respecto a cada (x,y) susceptible de pertenecer a un contorno. Luego se enlazan. Las propiedades que se suelen analizar son: Intensidad (módulo) del gradiente. Dirección del gradiente. T,A umbrales Un punto en una vecindad de (x,y) estará enlazado con el mismo si satisface los criterios anteriores. El proceso se repite para cada punto de la imagen actualizandose un registro.

    edu.red

    66 Procesamiento global con la transformada de Hough 1. Busca enlazar puntos que se encuentran en una curva específica. Búsqueda de rectas en un subconjunto de n puntos.

    La ecuación de una recta se puede expresar como:

    Se hace un cambio de espacio paramétrico. (Gp:) y (Gp:) x (Gp:) (xi,yi) (Gp:) b (Gp:) (xj,yj)

    (Gp:) b (Gp:) a (Gp:) (a’,b’) (Gp:) yi (Gp:) yj

    edu.red

    67 Procesamiento global con la transformada de Hough 2. Se subdivide el nuevo espacio en células acumuladoras. Inicialmente todas las celdas a cero. Para cada (xk,yk) del plano imagen se prueba con cada ai de los acumuladores y se busca el b correspondiente según la expresión de la recta vista antes. Se redondea al b más próximo y se incrementa el acumulador ai,bj. Las rectas corresponderán a los acumuladores más altos. El algoritmo resulta computacionalmente más eficiente expresando la recta en coordenadas polares.

    Existen versiones generalizadas para detectar otras figuras geométricas (círculos, elipses etc.) (Gp:) bmin (Gp:) bmax (Gp:) 0 (Gp:) 0 (Gp:) amin (Gp:) amax

    edu.red

    68 Ejemplo de transformada de Hough Imagen con recta vertical en el centro Espacio de acumuladores

    edu.red

    69 Procesamiento global por medio de la teoría de grafos Es un proceso más complicado pero con buenos resultados aún con imágenes ruidosas. Se establece un grafo, formado por un conjunto N de nodos y un conjunto de pares desordenados de elementos de N (arcos). Los arcos se dirigen de nodo ni al nj, entonces nj se dice sucesor de ni. Se asocia un coste c(ni,nj) con cada arco. Una sucesión de nodos acarrea un coste. Se debe establecer un tipo de vecindad. Se decide cual es la función de coste que interesa. Se expande el grafo desde un nodo fuente hasta llegar a un nodo meta.