Download - Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Transcript
Page 1: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

GCII-FAIS-UPMDOC008-99 1

ResumenEl objetivo de este informe es indicar las distintas técnicas existentes para la

detección de bordes y extracción de contornos en imágenes digitales de intensidad.Nos centraremos más tarde en las posibilidades actuales para hallar líneas rectas, yaque son las más representativas para la reconstrucción de cualquier imagen. Existenvarios métodos para lograr este fin, pero principalmente utilizaremos el método de J.B. Burns donde los pixel son agrupados en regiones entorno de líneas de gradientede orientación similar y más tarde se extraen las propiedades del borde.

Page 2: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Extracción de contornos rectos Raúl Varas Martínez

2 GCII-FAIS-UPMDOC00X-99

Page 3: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Raúl Varas Martínez Extracción de contornos rectos

GCII-FAIS-UPMDOC00X-993

� IntroducciónLa tecnología digital moderna ha hecho posible la manipulación de señales

multi-dimensionales con sistemas que abarcan desde los circuitos digitales hastaavanzados sistemas de computadoras en paralelo. El objetivo de esta manipulaciónpuede ser dividida en tres categorías:

• Procesamiento de imágenes.- Partiendo de una imagen fuente, se obtieneotra imagen con el resultado deseado.

• Análisis de imágenes.- Partiendo de una imagen fuente, se obtienen medi-das interesantes de ella.

• Comprensión de imágenes.- Partiendo de una imagen fuente, se obtieneuna descripción de alto nivel.

En este documento nos centraremos en el análisis de imágenes bidimensio-nales, aunque se realizará una breve introducción al procesamiento general de imá-genes.

Comenzaremos con una breve reseña histórica del nacimiento de las imáge-nes digitales, pasando a continuación con lo que en realidad es el procesamiento delas mismas y la extracción de las características.

Page 4: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Extracción de contornos rectos Raúl Varas Martínez

4 GCII-FAIS-UPMDOC00X-99

Page 5: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Raúl Varas Martínez Extracción de contornos rectos

GCII-FAIS-UPMDOC00X-995

� Estado de la técnicaA diferencia del estudio de los mecanismos de la visión humana, el procesa-

miento y análisis de imágenes digitales nace en el momento en que se dispone derecursos tecnológicos para captar y manipular grandes cantidades de informaciónespacial en forma de matrices de valores. Esta distinción sitúa al procesamiento yanálisis de imágenes digitales como una tecnología asociada a las Ciencias de lacomputación y por tanto cabe pensar de ella como una proyección del término VisiónArtificial dentro del ámbito de la Inteligencia Artificial.

Históricamente la primera vez que se hizo uso de las técnicas de imágenes di-gitales fue en los años veinte en la transmisión de imágenes de fotografías periodísti-cas a través de cable submarino entre Londres y Nueva York. Esto supuso que eltiempo entre emisión y recepción de las imágenes pasase de una semana (por barco)a tres horas (por cable). A partir de esto y durante algún tiempo, se desarrollaron lastécnicas de codificación y reproducción de las imágenes logrando pasar en la repre-sentación de imágenes de cinco a quince tonos de gris.

Pero estos hechos pueden considerarse aislados y no es hasta los años 50-60en los que aparecen los primeros computadores digitales y la necesidad de disponerde técnicas para la transmisión y procesamiento de imágenes desde satélite, cuandoestas técnicas empiezan a ser desarrolladas de forma sistemática.

Cabe citar el empuje dado a las técnicas de transmisión, realce y restauraciónde imágenes por el Jet Propulsion Laboratory (EEUU), encargado del procesamientode las imágenes mandadas por los primeros satélites de la carrera espacial.

Page 6: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Extracción de contornos rectos Raúl Varas Martínez

6 GCII-FAIS-UPMDOC00X-99

Al mismo tiempo y como consecuencia de los resultados obtenidos sobre lasimágenes de satélite, distintas administraciones y organismos llevaron a cabo durantefinales de los años sesenta y principios de los setenta grandes proyectos de investiga-ción para el desarrollo de técnicas relativas tanto al estudio de los mecanismos de lavisión como al tratamiento y análisis de imágenes digitales. Así, el National Instituteof Health (EEUU) dedicó considerable esfuerzo al estudio de imágenes de rayos X,microscopía óptica y electrónica.

El MIT (Massachusetts Institute of Technology) junto con la Universidad deStanford trabajaron durante los años setenta en temas de visión aplicada a robóticabajo el proyecto Hand-Eye. Otros proyectos que también han influido en el desarro-llo de estas técnicas son el PIPS (Pattern-Information Processing System) japonés yel norteamericano IUS (Image Understanding System). Este último proyecto marcael comienzo del uso de estas técnicas en aplicaciones de tipo militar lo que ha su-puesto, desde entonces, una fuente importante de inversiones para su desarrollo.

Dentro del contexto europeo tan solo cabe destacar la investigación desarro-llada durante los años setenta por los profesores G. Matheron y J. Serra de la ÉcoleNational Supérieure des Mines de Paris (Francia) con base a resultados de la geome-tría integral y el cálculo de probabilidades para la caracterización y medición de for-mas. Esta metodología se denomina Morfología Matemática y ha tenido susprincipales áreas de aplicación en los campos de la geología, la biología y la medici-na.

Es a partir de este momento cuando se puede observar el comienzo de ciertaespecialización y catalogación de las técnicas existentes. Así, aparecen los conceptosde técnicas para el procesamiento de imágenes digitales como el conjunto de todasaquellas técnicas asociadas a la captura, codificación y representación de las imáge-nes que no introducen sobre las mismas ningún tipo de interpretación, y técnicaspara el análisis de imágenes digitales, técnicas de visión por computador o visiónmediante robot como acepciones que se refieren a aquellas técnicas que tratan deextraer la información presente en la imagen con el fin último de hacer una interpre-tación de la escena representada por dicha imagen.

Durante los años ochenta las técnicas de análisis de imágenes se desarrollande forma vetiginosa como consecuencia de la gran cantidad de aplicaciones que apa-recen y la madurez alcanzada en el diseño de arquitecturas de computadores. Losdesarrollos más teóricos han seguido en gran medida las pautas marcadas por Marr,habiendo sido la línea marcada por el MIT la que más influencia ha tenido. Las ma-yores contribuciones se han centrado en el desarrollo de algoritmos para la detecciónde características (bordes, líneas, texturas) que ayudan a definir lo que Marr llamó elesbozo primitivo, así como en el desarrollo de técnicas globales de segmentación deuna imagen en regiones. A este último respecto cabe destacar aquellas aproximacio-nes que introdujeron la información de contexto en los procesos de clasificación ysegmentación de Besag, Cross, German o Rosenfeld.

De especial significación han sido también los numerosos trabajos que hanusado técnicas de representación del conocimiento para los problemas de interpreta-ción de imágenes, en relación con aplicaciones de ambiente industrial, iniciando unafuerte hibridación entre las técnicas de la Inteligencia Artificial para la representa-ción del conocimiento y las técnicas de interpretación de escenas a partir de imáge-nes digitales.

Page 7: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Raúl Varas Martínez Extracción de contornos rectos

GCII-FAIS-UPMDOC00X-997

A partir de la segunda mitad de la década de los 80 se inicia un creciente inte-rés hacia el desarrollo de nuevas teorías y algoritmos para la interpretación de laimagen 2D como proyecciones de escenas 3D. En particular cabe mencionar los pro-blemas asociados a la reconstrucción de escenas a partir de distintas proyecciones, elestudio del flujo óptico y sus múltiples aplicaciones a la caracterización de superfi-cies 3D, la caracterización de superficies a partir del estudio del movimiento, el estu-dio de las formas a partir de las sombras, las técnicas de representación y búsquedade objetos, el estudio de la orientación a partir de texturas.

Este interés por el estudio de problemas de mayor complejidad ha ido para-lelo al desarrollo de nuevas generaciones de ordenadores que a precio asequible per-miten la experimentación con imágenes cada vez más complejas en su interpretación.

De forma paralela, en el tiempo, al desarrollo de las técnicas y métodos ma-temáticos hasta ahora expuestas, se han venido desarrollando diferentes arquitecturasde computadores específicos para el procesamiento de datos de imágenes digitales.

El concepto de arquitectura paralela SIMD (Single Instruction Multiple Data)ha sido sin lugar a duda la más usada en este tipo de aplicaciones. Los conceptos deprocesadores con pipeline y procesadores vectoriales han sido también de ampliouso. Aunque en sus comienzos estas arquitecturas específicas fueron caras y con po-co soporte de software básico, en la actualidad pueden considerarse como opcionesrazonables en los sistemas de procesamiento de imágenes. En cualquier caso, cabedestacar que el rápido aumento de las prestaciones en los computadores que llama-remos estandar, ha desechado el uso de este tipo de arquitecturas en muchas aplica-ciones de tipo rutinario.

Page 8: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Extracción de contornos rectos Raúl Varas Martínez

8 GCII-FAIS-UPMDOC00X-99

Page 9: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Raúl Varas Martínez Extracción de contornos rectos

GCII-FAIS-UPMDOC00X-999

� Algoritmos de detección debordes en las imágenes digitales

Para los ordenadores, una imagen digital está compuesta de una gran parrillade números mezclados de forma aleatoria. La imagen de la derecha es una imagenampliada de un detalle de la imagen de la izquierda. A su lado, se encuentra la tablade valores que se corresponde con este detalle de la imagen.

Las imágenes en escala de grises con una profundidad de 8 bits por pixel tie-nen un rango comprendido entre 0 (negro puro) y 255 (blanco puro).

Fig 1. Estructura de la imagen digital.

Page 10: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Extracción de contornos rectos Raúl Varas Martínez

10 GCII-FAIS-UPMDOC00X-99

Existen distintas categorías para la manipulación de las imágenes, pero lasbásicas son:

a) Operaciones basadas en el histograma de la imagen.b) Operaciones basadas en matemáticas simples.c) Operaciones basadas en la convolución.d) Operaciones basadas en la morfología matemática.

3.1 Operaciones basadas en el histograma de la imagen

El histograma de una imagen es una distribución de intensidad de los valoresde los pixel y es generada mediante el recuento del número de veces que aparece unvalor de intensidad en la imagen. Esta información es muy útil para muchas aplica-ciones. En particular es útil para seleccionar un nivel umbral cuando se binariza unaimagen y para cambiar la distribución de intensidad cuando tratamos de incrementarel contraste de la imagen.

3.1.1 Aumento del contraste

Una importante clase de operaciones está basada en la manipulación del his-tograma o de regiones de histograma.

Fig 2. Histograma de la imagen.

Fig 3. Manipulación del histograma. Aumento del contraste.

Page 11: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Raúl Varas Martínez Extracción de contornos rectos

GCII-FAIS-UPMDOC00X-9911

Dentro de este grupo de operaciones se encuentra el aumento del contraste,que trata de adecuar el rango del histograma actual para que tome todos los valoresposibles de la codificación de la imagen. Si la imagen actual tiene su valor mínimoen el valor 25 y el máximo en 250 (sobre un rango de 0 a 255), todos los pixel convalor 25 pasarán a tener 0 y los de valor 250 pasarán a tener 255. El valor de salidapara los pixel de valor intermedio será determinado mediante el cambio de escalacorrespondiente.

3.1.2 Ecualización del histograma

Otro tipo de operación utilizada es la ecualización del histograma, en la cualse trata de obtener una distribución más uniforme de los valores de gris en la imagen.

3.2 Operaciones basadas en matemáticas simples

Distinguiremos entre aritmética binaria y aritmética ordinaria. En el caso dela aritmética binaria, existen dos valores de brillo “0” y “1”. En el caso de aritméticaordinaria, comenzaremos con 2N valores o niveles de brillo.

3.2.1 Aritmética binaria

Las operaciones basadas en la aritmética binaria (booleana) comprenden ope-raciones de tipo AND, OR, NOT, X-OR, ...

Fig 4. Manipulación del histograma. Equilización.

Fig 5. Imagen (A). Fig 6. Imagen (B).

Page 12: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Extracción de contornos rectos Raúl Varas Martínez

12 GCII-FAIS-UPMDOC00X-99

Algunos ejemplos de operaciones binarias con las imágenes anteriores puedenser los siguientes:

3.2.2 Aritmética ordinaria

Incluye todas las operaciones clásicas que se pueden realizar con númerosenteros: la suma, la diferencia, la multiplicación, la división, el logaritmo, ...

Se trata de operaciones que se realizan pixel a pixel y en algunas de ellas noexiste la propiedad conmutativa, pues no es lo mismo Imagen1 – Imagen2 que Ima-gen2 – Imagen1.

Ejemplos de este tipo de operaciones, se muestran a continuación:

Fig 8. Operación NOT(B).Fig 7. Operación (A) OR (B). Fig 9. Operación (A) AND (B).

Fig 10. Operación (A) XOR (B). Fig 11. Operación (A) SUB (B).

Fig 12. Imagen 1. Fig 13. Imagen 2.

Page 13: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Raúl Varas Martínez Extracción de contornos rectos

GCII-FAIS-UPMDOC00X-9913

3.3 Operaciones basadas en la convolución.

La convolución es una operación matemática ampliamente utilizada en elprocesamiento de imágenes actual.

Para un espacio bidimensional discreto, la idea básica de convolución es queun núcleo de un determinado tamaño y forma se desplaza a lo largo de la imagen.

El valor de salida del pixel es la suma ponderada de los valores de los pixelde la ventana sobre la cual está el núcleo y responde a la fórmula

Para el caso de imágenes digitales, la fórmula queda simplificada pues existeuna serie finita de valores.

[ ] [ ] [ ] [ ] [ ]∑ ∑+∞

−∞=

+∞

−∞=−−×=⊗=

j k

knjmbnmanmbnmanmc ,,,,,

Fig 14. Imagen 1 – Imagen 2. Fig 15. Imagen 2 – Imagen 1.

Fig 16. Funcionamiento de la máscara de convolución.

Page 14: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Extracción de contornos rectos Raúl Varas Martínez

14 GCII-FAIS-UPMDOC00X-99

Por ejemplo, el valor de salida del pixel Q0 (que será R0), se obtendrá me-diante la siguiente fórmula:

Las máscaras de convolución más comunes se basan en filtros paso bajo, pasoalto y de detección de bordes.

Los filtros paso bajo reducen los componentes de alta frecuencia, que sonaquellos que determinan los bordes definidos, aunque al permitir que pasen las fre-cuencias más bajas se obtiene una imagen que parece borrosa.

887766

110055

223344

QPQPQP

QPQPQP

QPQPQP

×+×+×+×+×+×+×+×+×

=0R

Fig 17. Máscara paso bajo.

Original Con máscara Núcleo

Fig 18. Máscara paso alto.

Original Con máscara Núcleo

Page 15: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Raúl Varas Martínez Extracción de contornos rectos

GCII-FAIS-UPMDOC00X-9915

Fig 19. Máscara Prewitt horizontal.

Original Con máscara Núcleo

Fig 20. Máscara Prewitt vertical.

Original Con máscara Núcleo

Fig 21. Máscara Sobel horizontal.

Original Con máscara Núcleo

Page 16: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Extracción de contornos rectos Raúl Varas Martínez

16 GCII-FAIS-UPMDOC00X-99

Además de estas máscaras, existen otras de mayor tamaño utilizadas funda-mentalmente para eliminar y/o preparar la imagen para procesamientos posteriores.

Distinguiremos entre algoritmos lineales y no lineales, donde los primerospueden ser tratados mediante análisis de Fourier y los últimos no.

3.4 Operaciones basadas en detección matemática.

Existen otras técnicas matemáticas que tratan de detectar cambios dentro de lainformación de la imagen. Los bordes están situados en áreas de la imagen donde elnivel de intensidad cambia bruscamente, de tal forma que a mayor cambio de inten-sidad, mayor es la potencia del borde.

A este respecto existen las técnicas que utilizan la primera y la segunda deri-vada de la imagen. De acuerdo con la definición de derivada, esto no sería posible,ya que una imagen digitalizada no es una función continua a(x,y) de variables espa-ciales sino que es más bien una función discreta a[m,n] de coordenadas espacialesenteras. Los algoritmos presentados son una aproximación de la verdadera derivadaespacial de la imagen originalmente continua.

3.4.1 Primera derivada

Como una imagen es una función de dos (o más) variables, es necesario defi-nir la dirección en la cual tomaremos la derivada. Para el caso bidimensional, tene-mos la dirección horizontal, la dirección vertical u otra dirección arbitraria que puedeser considerada como una combinación de las dos. Si usamos la notación hX y hY paraindicar las matrices del filtro derivativo vertical y horizontal respectivamente, y hθ esla matriz del filtro derivativo en la dirección arbitraria, podríamos descomponerlasegún la ecuación:

][sen][cos YX hhh ⋅+⋅= θθθ

Fig 22. Máscara Sobel vertical.

Original Con máscara Núcleo

Page 17: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Raúl Varas Martínez Extracción de contornos rectos

GCII-FAIS-UPMDOC00X-9917

Los filtros derivativos básicos son:i) [hX] = [h Y]

t = [1 -1]ii) [hX] = [h Y]

t = [1 0 -1]donde “t” significa la matriz traspuesta.El filtro gradiente es una matriz vectorial de descripción del gradiente de la

imagen, ∇a[m,n], que responde a la fórmula

donde iX e iY son vectores unitarios en la dirección horizontal y vertical, res-pectivamente. Esto conlleva a dos descripciones distintas, por un lado el módulo omagnitud del gradiente y por otro lado el argumento o dirección del gradiente.

Las máscaras más utilizadas para la convolución en este punto son las dePrewitt y Sobel mostradas anteriormente.

( ) ( ) YYXXYX iahiahiy

ai

x

aa

&&&&&

⋅⊗+⋅⊗=⋅∂∂+⋅

∂∂=∇

( ) ( )22 ahaha YX ⊗+⊗=∇& ( ) ( )

( )ah

aharctana

Y

X

⊗⊗

=∇&

ψ

Original.

Modulo del gradiente. Dirección del gradiente.

Fig 23. Primera derivada.

Page 18: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Extracción de contornos rectos Raúl Varas Martínez

18 GCII-FAIS-UPMDOC00X-99

Operador de Canny

Fig 26. Operador de Canny.

Borde ideal Resultado

3.4.2 Segunda derivada

En el procesamiento de imágenes, la aplicación de la segunda derivada o La-placiana juega un papel importante. La Laplaciana está definida como

donde h2X y h2Y son filtros derivativos de segundo orden.El filtro derivativo básico es [hX] = [h Y]

t = [1 –2 1], pero pueden ser usadosotro tipo de filtros propios de dos dimensiones, como son los de vecindad 4 y ven-cindad 8. Este tipo de filtros trata de ver cuántos pixel están rodeando a uno en con-creto.

El principal algoritmo basado en la segunda derivada es el implementado porCanny. El borde es detectado donde la convolución alcance un máximo. Después deesto es necesario aplicar una umbralización para que el ese máximo no sea debido alruido.

Debido a que el operador de Canny es simétrico, la suma de todos los pesoses cero. La mitad de los pesos son positivos y la otra mitad negativos. Podemos sepa-rar nuestra suma en dos partes a lo largo de esas líneas, en las cuales se divide la se-ñal en dos lados separados por el borde propuesto. Consideraremos positivo el ladoizquierdo y negativo el derecho. El lado positivo es sumado como anteriormente,pero podemos hacer que el lado negativo se convierta en positivo haciendo un reflejosobre el eje de sus pesos.

( ) ( ) YYXXYX iahiahiy

ai

x

aa

&&&&&

⋅⊗+⋅⊗=⋅∂∂+⋅

∂∂=∇ 222

2

2

22

Fig 25. Conectividad 8.Fig 24. Conectividad 4.

Page 19: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Raúl Varas Martínez Extracción de contornos rectos

GCII-FAIS-UPMDOC00X-9919

Por supuesto, ahora debemos restar la parte negativa total del total positivopara conseguir la respuesta, pero realmente todo lo que hemos hecho es añadir unospocos signos negativos.

Ahora veamos qué ocurre en uno de los lados. La intensidad de cada pixel esmultiplicada por su peso. Imaginemos que estamos creando un histograma de inten-sidad, donde la cantidad que contribuye cada pixel es igual a su correspondiente pe-so. ¿Quiere decir que el significado de añadir esos números es que nuestro eje xrepresenta la intensidad y no la localización? Si el peso total de un lado es 1, enton-ces la respuesta es el centro de masa del histograma.

Anteriormente hemos comentado que tenemos que restar la parte negativa dela positiva. Ahora podemos hacer algo mejor que esto, si calculamos la distancia en-tre el centro de masa negativo y el positivo, tenemos la misma respuesta, excepto queahora es siempre no negativo. Esto significa que no nos debemos preocupar si nosdesplazamos de una región oscura a una región clara o viceversa.

Existe un riesgo con el desenfocado. El desenfocado es una media ponderadade un conjunto de pixel donde los pesos se añaden a uno. Los pesos son a menudoasignados usando una distribución Gaussiana normal, debido a las muy atractivaspropiedades de la Gaussiana. De hecho, la distribución Gaussiana (más concreta-mente su derivada) forma la base del detector de bordes de Canny, siendo elegidotodavía por multitud de personas a causa de su velocidad y su facilidad de imple-mentación.

La fórmula de distribución Gaussiana, y sus derivadas son mostradas a conti-nuación.

Las funciones equivalentes para señales bidimensionales se expresan más fá-cilmente en coordenadas polares, donde r representa la distancia radial desde el ori-gen. La función es simétrica e independiente del valor del ángulo θ.

2

2

2

2

1)( σ

σπ

x

exG−

= 2

2

232

)(' σ

σπ

x

ex

xG−−=

−−=

2

22

31

2

1)(''

2

2

σσπσ x

exGx

2

2

222

1)( σ

πσ

r

erG−

= 2

2

242

)(' σ

πσ

r

er

rG−−=

−−=

2

22

31

2

1)(''

2

2

σπσσ r

efGr

Fig 27. Operador de Canny dividido en dos lados, con uno reflejado para hacer todos los pesos positivos.

Page 20: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Extracción de contornos rectos Raúl Varas Martínez

20 GCII-FAIS-UPMDOC00X-99

Si ahora consideramos un borde ideal y realizamos la convolución de es fun-ción con una función Gaussiana aparece un perfil como el mostrado más a la izquier-da. A continuación se muestran la primera y la segunda derivada; la presencia delborde está marcada por un pico y por un paso por cero respectivamente.

Se pueden utilizar dos técnicas para la localización de los bordes: 1) utilizan-do la primera derivada, trata de encontrar el máximo local de la función y 2) utili-zando la segunda derivada, localiza cuándo la función cambia de signo (paso porcero).

3.5 Operaciones basadas en la morfología matemática.

En secciones anteriores hemos definido una imagen como una función de dosvariables reales a(x,y) o dos variables discretas a[m,n]. Una definición alternativa deuna imagen puede estar basada en la noción de ser un conjunto (o colección) de am-bas coordenadas continuas y discretas. En un sentido el conjunto corresponde a lospuntos o pixel que pertenecen a los objetos de una imagen. Esto se muestra en la fi-gura 28, en la que existen dos conjuntos u objetos A y B. Véase que se necesita de unsistema de coordenadas. Por el momento consideraremos que el valor de los pixel esbinario, más adelante nos centraremos en el espacio discreto Z2.

Borde desenfocado

Fig 27. Convolución de un borde con una distribución Gaussiana.

Primera derivada Segunda derivada

Page 21: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Raúl Varas Martínez Extracción de contornos rectos

GCII-FAIS-UPMDOC00X-9921

El objeto A consiste en aquellos pixel que comparten propiedades comunes:

En el ejemplo, el objeto B está compuesto por los pixel {[-1,0], [0,0], [1,0],[2,0], [-1,1], [0,1], [1,1], [2,1], [-1,2] [0,2], [-1,3], [0,3]}.

El segundo plano de A está dado por AC (complementario de A) que es defi-nido como aquellos elementos que no están en A:

En secciones anteriores se introdujo el concepto de conectividad. En funciónde que se defina una conectividad C de 4 u 8 pixel, el segundo plano tendrá la co-nectividad complementaria de 8 y 4 pixel respectivamente.

Las operaciones fundamentales asociadas con un objeto son las estándarunión, intersección, complemento {∪, ∩, C) más la traslación. Para la traslación, esnecesario un vector, el cual será sumado al objeto seleccionado, realizando un des-plazamiento en el plano de la imagen.

3.5.1 Dilatación y erosiónLa dilatación y la erosión parten de la definición de suma y resta de Min-

kowski. Así, se definen

{ }VERDADpropiedadA === )(/ αα

{ }AAC ∉= αα /

�B

ABABADilatación∈

+=⊕=β

β )(),(

�B

ABABAErosión∈

−=−⊕=β

β )()(),(

Fig 28. Imagen binaria conteniendo dos objetos denominados A y B.

Page 22: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Extracción de contornos rectos Raúl Varas Martínez

22 GCII-FAIS-UPMDOC00X-99

La dilatación en general causa que los objetos se dilaten o crezcan de tamaño,mientras que la erosión causa que los objetos se encojan. La cantidad que crecen oque se encogen los objetos depende de la elección de la estructura del elemento. Ladilatación o la erosión sin la especificación de la estructura del elemento no es mássensible que si tratamos con un filtro paso bajo una imagen sin especificar el filtro.Las dos estructuras de elementos más comunes son la conectividad a 4 y conectivi-dad a 8.

3.5.2 Apertura (opening) y cierre (closing)Podemos combinar la dilatación y la erosión dos operaciones de mayor im-

portancia.

La operación de apertura (opening) tiene dos pasos. El primero de ellos esuna erosión de la imagen para seguir a continuación con una dilatación. Medianteesta operación se rompen las conexiones entre objetos adyacentes.

La operación de cierre (closing) es el proceso contrario al de apertura. Enprimer lugar se realiza una dilatación de la imagen y seguidamente una erosión. Lasoperaciones de cierre son muy útiles para rellenar huecos en los objetos.

3.5.3 Adelgazamiento (thinning) y engorde (thickening)Se puede reducir o aumentar los objetos de primer plano de una imagen me-

diante la utilización de operaciones basadas en rígidos emparejamientos de vecindadde pixel y de estructura de elementos.

)),,((),( BBAErosiónDilataciónBABAApertura == $

)),,((),( BBADilataciónErosionBABACierre =•=

Fig 29. Dilatación de la imagen Fig. 28. Fig 30. Erosión de la imagen Fig. 28.

Page 23: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Raúl Varas Martínez Extracción de contornos rectos

GCII-FAIS-UPMDOC00X-9923

Al igual que en el caso de la dilatación y la erosión aparecieron operacionesque combinaban sus efectos para conseguir mejores resultados, con el adelgaza-miento y el engorde sucede algo parecido. En este caso se realizan secuencias deadelgazamiento y engorde en un número determinado con el objetivo de segmentar laimagen y conseguir fundamentalmente líneas de gran tamaño.

Fig 31. Técnicas de adelgazamiento y engorde.

Engorde Original Adelgazamiento

Page 24: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Extracción de contornos rectos Raúl Varas Martínez

24 GCII-FAIS-UPMDOC00X-99

Page 25: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Raúl Varas Martínez Extracción de contornos rectos

GCII-FAIS-UPMDOC00X-9925

� Extracción de líneas rectasUno de los primeros pasos para la comprensión de una imagen es la obtención

de sus contornos más relevantes. En el capítulo anterior se han visto distintas técni-cas que obtienen las características importantes de la estructura de la imagen, peronuestro objetivo prioritario es el análisis de imágenes y, por tanto y según la defini-ción dada en la introducción de este documento, tenemos que obtener medidas inte-resantes de ellas.

Nos vamos a fundamentar en dos métodos. El primero de ellos es la técnicade extracción de líneas de Hough que es fundamentalmente un método matemático yla técnica de extracción de líneas rectas de Burns, que trata de analizar la imagenpara conseguir la determinación analítica de rectas.

4.1 Transformada de Hough

Fue pensada y patentada por Paul Hough en 1962 como una técnica para de-tectar curvas en una imagen binaria. Utilizando un detector de bordes para localizarpuntos que puedan formar un borde perceptible, el método determina si los puntosson componentes de un tipo específico de curva parametrizada. Cada punto del bordees trasladado del espacio de la imagen a un espacio parametrizado mediante la in-crementación de elementos de una tabla (acumulador) usando los parámetros de lacurva como índices de la tabla. Las celdas del acumulador que contienen los mayores

Page 26: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Extracción de contornos rectos Raúl Varas Martínez

26 GCII-FAIS-UPMDOC00X-99

Fig 32. Traslación del sistema de la imagen XY al sistema paramétrico MB.

Puntos de la imagen (XY) Líneas paramétricas Celdas del acumulador

valores indican las posibles localizaciones de las curvas en la imagen. La transforma-ción de los puntos del borde en la imagen a la representación paramétrica, transformala laboriosa tarea de la localización de una curva en la imagen en el simple problemade localización del máximo en la tabla.

El objetivo de la transformada de Hough original es la detección de líneasrectas utilizando la intersección por la pendiente. Para cada uno de los puntos delborde encontrados en la imagen (plano XY), el acumulador (plano MB) es incre-mentado usando el valor de la pendiente y su intersección con el eje Y que satisfacela ecuación b = y – mx como indica:

Cada punto del borde tiene asociado una línea paramétrica en el acumulador.La intersección de la línea paramétrica indica la existencia y la posición de puntoscolineales. Cuanto mayor sea el número de puntos colineales, mayor será la probabi-lidad de encontrar la línea en la imagen. Esta técnica está ampliamente extendidapara detectar otras curvas mediante el incremento del número de dimensiones en latabla.

La eficiencia computacional de la transformada de Hough llega a ser aparentecuando la comparamos con los requerimientos de una técnica exhaustiva. Para cadauno de los n puntos en la imagen existen n-1 puntos colineales y (n-1)/2 posibleslíneas que pasen a través de cada punto. Comparando las líneas que pasan por cadapunto n·(n-1)/2 para cada uno de los otros puntos n·(n·(n-1))/2 conduce a una com-plejidad de n3.

Por otro lado, la complejidad del método de Hough depende del número deincrementos requeridos para la pendiente. Para k incrementos de m, la complejidad esk·m a que es mucho menor que n3, a condición de que k no sea función o no sea tangrande como n.

En 1972, Richard Duda y Peter Hart propusieron que los parámetros podíanser descritos mejor mediante la longitud (ρ) y la orientación (θ) de un vector normala la línea y que pasa por el origen de la imagen.

1),(),( += bmAbmA

Page 27: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Raúl Varas Martínez Extracción de contornos rectos

GCII-FAIS-UPMDOC00X-9927

De la misma manera que la transformación original, para cada punto encon-trado en la imagen (del plano XY), el acumulador (plano ρθ) se incrementa usandovalores para el radio y el ángulo que satisfagan la ecuación ρ=x·cosθ+y·sinθ.

Esta parametrización normal produce curvas sinusoidales en el acumulador.La intersección de las curvas indican las localizaciones probables de líneas en laimagen y el valor de la intersección indica el número de puntos colineales en la línea.Como la forma normal es periódica, el rango de valores se limita y las dificultadesencontradas con grandes pendientes en la técnica de Hough general se elimina.

4.1.1 Generalización de la transformada de HoughA pesar de que la transformada de Hough consigue buenos resultados para la

detección de tipos de curvas específicas, la detección de formas arbitrarias requierede la generalización de la técnica. Una posible solución sería tratar todas las curvascomo un conjunto de pequeños segmentos rectos. Cada segmento incrementaríaA(ρ,θ) con un valor proporcional a su longitud. Los contenidos del acumulador po-drían ser comparados con la configuración característica de una particular figura.Aunque este método pudiera parecer atractivo, la presencia de extraños segmentos delínea en una imagen podrían introducir un factor de ruido que pudiera corromper losdatos. Serían necesarios cálculos adicionales para filtrar el acumulador y extraer losdatos relevantes.

Otro método, descrito por Dana Ballard, utiliza el gradiente de dirección deun conjunto de puntos del límite cercanos a una figura especificada para determinarqué celdas del acumulador deben ser incrementadas. El radio (r) y la dirección (a) deuna colección de puntos del límite de la figura, relativos a una referencia o al puntocentral, son almacenados en una lista denominado tabla R. Los valores del punto dellímite (r, a) son asignados a posiciones en la tabla R usando el gradiente de direcciónde los puntos como un índice. El algoritmo usa el gradiente de dirección para cadapunto del borde encontrado en una imagen (y) para referenciar la tabla R. Cada espe-cificación del punto del límite (r, a) encontrado como una referencia particular en la

Fig 32. Representación de una línea en coordenadas (ρ,θ).

1),(),( += θρθρ AA

Page 28: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Extracción de contornos rectos Raúl Varas Martínez

28 GCII-FAIS-UPMDOC00X-99

tabla R es usado para calcular los posibles puntos centrales de la figura. Los puntoscentrales (xC, yC) especifican los índices del elemento del array acumulador a serincrementado. Los índices de las celdas del acumulador con mayores valores indicanlos posibles puntos centrales para la figura en una imagen. La generalización de Ba-llard de la transformada de Hough está representada en el algoritmo listado a conti-nuación.

Extendiendo el método para implementar la rotación y el escalado de figurases complicado mediante la ampliación del array acumulador para incluir los paráme-tros S y θ y recurrir a otra vuelta para adecuar los cálculos adicionales.

Obviamente, cualquier incremento en las dimensiones del acumulador tam-bién incrementa el tiempo de cálculo requerido para completar la transformada. En laimplementación que se describirá a continuación, se propone una técnica que amino-ra el problema considerablemente.

El algoritmo de Ballard para la detección de figuras utilizando la técnica deHough parece bastante simple y directo. La implementación del método no es

4.1.2 Transformada de Hough aleatoriaLa transformada aleatoria de Hough utiliza un mecanismo diferente para la

generación de valores en el histograma que está definido sobre el espacio parametri-zado. Considera la detección de líneas. En la transformada estándar de Hough, unpixel en la imagen corresponde a una curva en el espacio parametrizado y es discreti-zado y grabado en el histograma. En la transformada aleatoria de Hough, un parejade pixel son escogidos aleatoriamente y se calculan los parámetros de una única líneaque pasa a través de esos pixel. Esta línea es grabada como una entrada simple en elhistograma. Este mecanismo se itera un número de veces preestablecido, donde elnúmero de veces es mucho menor que el número de parejas de pixel en la imagen.De este modo, las entradas son acumuladas en el espacio parametrizado.

4.1.3 Transformada de Hough probabilísticaLa transformada de Hough probabilística afirma lo siguiente: para detectar

objetos es suficiente calcular la transformada de Hough de solo una porción α(0<α≤100%) de los pixel en la imagen. Estos pixel son escogidos aleatoriamente deuna función de densidad de probabilidad uniforme definida en la imagen. Esto esequivalente a calcular la transformada de Hough de la versión sub-muestreada de unaimagen.

Kiryati, encontró la relación entre α y el número de falsas alarmas expuestasal efecto de umbralización. Para α > αUMBRAL ocurren pocas alarmas. Para α < αUM-

BRAL, el número de alarmas crece rápidamente. Así, la elección de α ≈ αUMBRAL re-sulta considerable computacional con una función de degradación insignificante. Losresultados sugieren que el valor de αUMBRAL debe estar en un rango del 5 al 15% delvalor de α en función de la aplicación.

Page 29: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Raúl Varas Martínez Extracción de contornos rectos

GCII-FAIS-UPMDOC00X-9929

4.1.4 Transformada de Hough jerárquicaLa transformada de Hough jerárquica combina una estructura piramidal con

la transformada de Hough.La imagen es organizada en una rejilla de sub-imágenes y se desarrollo la

transformada de Hough para la detección de líneas rectas en cada una de ellas. Típi-camente, cada sub-imagen contendrá como mucho dos líneas. Los resultados sonpropagados a través de la pirámide. Para cada nodo en el siguiente nivel, tomamos unsolapamiento de vecindad de 4x4 sub-imágenes del nivel previo. Las líneas de esassub-imágenes son mezcladas utilizando un algoritmo comparable al de Hough. Laslíneas que no son mezcladas no se propagan al siguiente nivel de jerarquía. Esto serepite hasta que en el nivel más alto de la pirámide exista un nodo único que describala imagen entera.

Como la transformada de Hough inicial está desarrollada para pequeñas sub-imágenes, este algoritmo está a la espera de mayor desarrollo para imágenes quecontengan muchas líneas, partiendo de que pocas líneas pasarán a través de cada sub-imagen.

4.2 Algoritmo de Burns

Esta técnica de extracción de líneas rectas está basada en dos observacionesrealizadas sobre muchos algoritmos de extracción de líneas: 1) carecen de una vistaglobal de la estructura fundamental de la imagen prioritaria para la toma de decisio-nes acerca de los sucesos de bordes y 2) relegan la información de la orientación delos bordes a un plano secundario en el procesamiento. En la mayoría de los algorit-mos de extracción de bordes y líneas, el cambio en la magnitud de la intensidad seusa de algún modo como una medida de la importancia local del borde. Mientras quela información de la orientación de los bordes puede ser usada para modular el pro-ceso de agrupación aplicado a las líneas importantes, la magnitud del borde normal-mente tiene la influencia dominante y central. Según Burns, la orientación del bordetransporta la información importante sobre la colocación de los pixel que participanen la variación de intensidad que delimitan la línea recta, particularmente en su ex-tensión espacial.

El gradiente de orientación es definido como la dirección de máximo cambiode nivel de gris medido sobre un área pequeña alrededor del pixel, o de forma equi-valente, como la dirección local de incrementos ascendentes (o descendentes) enintensidad superficial. El modelo de pixel tiene dos características:

1) el gradiente de magnitud local (medido sobre una pequeña ventana local)variará significativamente sobre la superficie de intensidad, por razonescitadas antes, particularmente en la dirección ortogonal a la línea; y

2) el gradiente de orientación local variará relativamente poco a lo largo dela superficie de intensidad completa.

Estas características son ciertas en la mayoría de las líneas rectas que nosotrosdeseamos extraer en las imágenes digitalizadas. Por encima de basarse en la consis-tencia del gradiente de orientación local, se desarrolla un algoritmo simple para la

Page 30: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Extracción de contornos rectos Raúl Varas Martínez

30 GCII-FAIS-UPMDOC00X-99

extracción de “regiones entorno de líneas”, que son conjuntos de pixel que se inclu-yen en cada superficie de intensidad. De este modo, en un suceso de gran envergadu-ra el paso difícil de la extracción de todas las líneas puede ser reducido a simplesagrupaciones y a un proceso de conexión de componentes. El beneficio adicional dela separación de estas regiones entorno es que otros aspectos de la línea, como elcontraste y la anchura (o el rizado), pueden ser medidos más exactamente.

Sorprendentemente, las aproximaciones globales para la extracción de líneasrectas, como los métodos de la transformada de Hough, no explotan la orientacióntanto como se podría pensar. Aunque los grupos de histograma de coordenadas (ρ, θ)codifican la orientación de los bordes en términos de puntos colineales, una vez másdominan las magnitudes de los bordes. El proceso global para la extracción de líneasdepende de la búsqueda de cumbres importantes en la transformada. Todas las técni-cas de Hough usan de alguna manera la magnitud del borde en el proceso de vota-ción, por un peso proporcional o por umbralización de tal modo que sólo acceden losbordes importantes. Así, es muy difícil extraer líneas grandes, coherentes, de bajocontraste porque su respuesta en el espacio (ρ, θ) se reduce por el proceso de vota-ción, pudiendo ser ocultadas por la información de alto contraste y pudiendo existirpresente otro tipo de ruido.

La técnica presentada aquí fue motivada por un método de extracción de lí-neas que encontraría líneas rectas en imágenes razonablemente complejas, particu-larmente aquellas líneas que son grandes pero no necesariamente de alto contraste.Una característica clave de la aproximación que la distingue de los trabajos previoses la organización global del contexto de entorno de líneas prioritario a cualquierdecisión sobre la relevancia de los cambios locales de intensidad.

Una estimación de la orientación local de cada uno de los pixel es la base deeste primer proceso de organización. La agrupación de pixel en regiones entorno delíneas evita el exceso de respuesta de las máscaras de tamaños y orientaciones varia-bles, así como la complejidad innecesaria en la organización de mecanismos subsi-guientes. Permite la extracción de líneas rectas a pesar de las debilidades en laclaridad de la línea debido a variaciones locales en la anchura, contraste y orienta-ción. Esto traslada directamente el problema asociado con el tamaño del operador delborde y determina la extensión de entorno dada a los bordes y líneas directamentedesde de los datos fundamentales.

La aproximación tiene su origen en el proceso de colección de gradientes deHanson, Riseman y Glazer. El proceso de colección de gradientes utiliza un meca-nismo de datos directos para organizar el contexto completo del borde en una direc-ción para cada instante de tiempo (la componente vertical y horizontal) por encimade la anchura de una sección de incremento o decremento monótono del perfil deintensidad contribuyente al borde (por ejemplo, donde el signo del gradiente seaconstante). El gradiente total del contraste fue entonces distribuido alrededor de lalocalización del centroide del gradiente de magnitudes local en el perfil del borde.Este proceso organizaba la información del contraste de un lado al otro de la anchurade un borde sin comprometerse con ningún tamaño fijo o con tamaños establecidospara el operador de bordes. Ambas técnicas capturan el gradiente de informaciónglobal que resulta de una tasación más exacta de la magnitud total del borde de unlado al otro de su anchura.

Haralick también procesa la superficie de intensidad en el orden de crear de-cisiones acerca de las líneas, pero la diferencia clave es que sus tramos de superficie

Page 31: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Raúl Varas Martínez Extracción de contornos rectos

GCII-FAIS-UPMDOC00X-9931

son locales, y afronta el mismo tipo de dificultades en la organización de esta infor-mación como lo hace el resultado de los operadores locales de bordes.

La aproximación aquí tomada ha generalizado el proceso global de organiza-ción contextual hacia dos dimensiones, agrupando los pixel de la imagen de un ladoal otro de la anchura de un borde así como disminuyendo la longitud del borde, paraformar la base para la extracción de una línea recta. Todos los pixel en esas regionesentorno de línea contribuyen tanto a la representación final de la línea como a la ge-neración de un conjunto de atributos descriptivos que son útiles para procesamientosposteriores de los datos de la línea. Las regiones entorno de línea podrían también serusadas en la separación de líneas rectas en imágenes intrínsecas representando bordesy líneas de diferentes tipos, tal como iluminación, textura, reflejo, orientación, etc.

4.2.1 Representación y proceso para la extracción de líneas rectasLa aproximación general para la extracción de líneas rectas es agrupar los pi-

xel en regiones entono de línea basadas en el gradiente de orientación, y más tardeextraer de cada región un segmento de línea recta. Hay que ver que cada una de lasvariaciones de intensidad, incluyendo los cambios de baja magnitud, inicialmenteserán extraídas como segmentos de líneas débiles (a menudo de gran anchura). Du-rante la interpretación de estas líneas, las regiones entorno adyacentes de bajo con-traste pueden ser agrupadas en regiones homogéneas y filtradas para que no seanvistas como líneas rectas débiles.

Hay cuatro pasos básicos en la extracción de líneas rectas:1) Agrupación de pixel en regiones entorno de líneas basadas en la simili-

tud del gradiente de orientación. Esto permite una organización directa delos datos de contexto de borde sin comprometerse a ningún tamaño parti-cular de máscara.

2) Aproximación de la superficie de intensidades por una superficie plana.La aproximación plana es ponderada por el gradiente de magnitud asocia-do con los pixel de modo que dominará la intensidad en las partes másempinadas.

3) Extracción de atributos de las regiones de entorno de líneas y aproxima-ción plana. Los atributos extraídos incluyen la línea representativa y sulongitud, contraste, anchura, colocación, orientación y rectitud.

4) Filtrado de líneas sobre los atributos para aislar los variados sucesos de laimagen como grandes líneas rectas de cualquier contraste, líneas pequeñasde bajo contraste (textura pesada), líneas cortas de bajo contraste (texturaligera), regiones homogéneas de líneas adyacentes de muy bajo contraste,y líneas en posiciones y orientaciones particulares.

4.2.1.1 Agrupación de pixel en regiones entorno de líneas vía gradientede orientación

La figura muestra una imagen de intensidad de 32 x 32 pixel que representaun borde real. A su lado se encuentra la visión en tres dimensiones .

Page 32: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Extracción de contornos rectos Raúl Varas Martínez

32 GCII-FAIS-UPMDOC00X-99

Podemos observar el salto de intensidad que se produce entre las zonas declaridad-oscuridad y de oscuridad-claridad.

4.2.1.1.1 Elección de la máscara para el cálculo del gradiente

Como ya se ha visto en puntos anteriores, existe una gran variedad de másca-ras que pueden ser empleadas en el cálculo del gradiente. Las máscaras grandes tien-den a suavizar la imagen y reducir la calidad del detalle, e incluso eliminarlocompletamente. Optaremos entre dos máscaras de distintos tamaño: 2x2 y 3x3.

El resultado de la aplicación de la máscara de 3x3 es el mostrado en lassiguientes imágenes, tanto a nivel de módulo de gradiente como a orientación delmismo.

Fig 33. Representación de una escalón real y visión en 3D.

Original

Page 33: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Raúl Varas Martínez Extracción de contornos rectos

GCII-FAIS-UPMDOC00X-9933

El resultado de la aplicación de la máscara de 2x2 es el mostrado en lassiguientes imágenes, tanto a nivel de módulo de gradiente como a orientación delmismo.

Fig 34. Aplicación de la máscara de 3x3.

Horizontal Vertical

Módulo del Gradiente Dirección del Gradiente

Horizontal Vertical

Dirección del GradienteMódulo del Gradiente

Fig 35. Aplicación de la máscara de 2x2.

Page 34: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Extracción de contornos rectos Raúl Varas Martínez

34 GCII-FAIS-UPMDOC00X-99

Vemos que la máscara de 2x2 como se proponía al principio de este punto,tiende a realzar más los detalles más pequeños, mientras que la máscara de 3x3 con-tribuye más uniformemente al suavizado de la imagen, eliminando esos detalles. Porlo tanto, la elección de la máscara dependerá del propósito concreto. En nuestro caso,como pretendemos seleccionar líneas largas y de gran tamaño, utilizaremos la másca-ra de 3x3.

4.2.1.1.2 Segmentación de la dirección del gradiente de una imagen utilizandoparticiones fijas

Una vez que la dirección del gradiente se ha calculado, los pixel son agrupa-dos en regiones. El problema puede ser visto como una segmentación de la direccióndel gradiente de una imagen, apareciendo así las dificultades de los algoritmos desegmentación en regiones. Aunque las agrupaciones locales puedan asegurar simili-tud local, las regiones pueden estar constituidas de tal forma que incluyan pixelescon atributos de orientación muy poco similares debido a pequeños arrastres en laorientación de un pixel a otro. Así, las técnicas de crecimiento de regiones, no sonaplicables porque en algunas ocasiones los errores del exceso de agrupación puedencausar resultados desastrosos. Los cambios en la orientación de líneas en las esquinasy en uniones de líneas rectas, pueden producir gradientes de orientación intermediosen lugar de una discontinuidad clara en el gradiente de orientación; el resultado po-drían ser indeseables agrupaciones de pixel al emplear el crecimiento local de regio-nes.

Se utilizó un proceso de agrupación que evita algunos de estos problemas.Introduciremos la idea básica con una aproximación simplificada de la utilización delparticionamiento fijo de la característica de orientación; en el siguiente punto lo ex-tenderemos a un proceso más efectivo utilizando solapamiento de particiones. En elesquema de particiones fijas, el rango de 360 grados de la dirección del gradiente escuantificado arbitrariamente en un pequeño conjunto de intervalos regulares, es de-cir, ocho intervalos de 45 grados o dieciséis intervalos de 22’5 grados, y cada vectorgradiente es etiquetado de acuerdo con la partición en la que cayó. Más tarde, se uti-

Fig 36. Esquema de 8 particiones de 45 º con la primera centrada a los 0º.

Page 35: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Raúl Varas Martínez Extracción de contornos rectos

GCII-FAIS-UPMDOC00X-9935

liza un algoritmo simple de conexión de componentes para formar distintas regionesetiquetas por grupos de pixel adyacentes con la misma etiqueta de orientación. Sinuestras conjeturas sobre la orientación de los bordes es correcta, entonces los pixelparticipantes en el contexto de entorno de línea de una línea recta estarán en la mis-ma (o algunas veces en particiones adyacentes), y los pixel adyacentes que no sonparte de la misma línea recta tendrán normalmente diferentes orientaciones.

4.2.1.1.3 Segmentación de la dirección del gradiente de una imagen utilizandosolapamiento particiones

Los problemas con la aproximación simple del agrupamiento descrito en elpunto previo están relacionados con el emplazamiento arbitrario de los límites de lasparticiones fijadas y la intensidad resultante para las posibles distribuciones de ladirección del borde de la línea recta. En primer lugar, líneas rectas visualmente dis-tintas que están espacialmente contiguas pueden ser mezcladas impropiamente por-que tienen orientaciones similares y encuadrarse (parcialmente) en el mismo grupode orientación. En segundo lugar, una línea recta puede producir regiones entorno delínea fragmentadas si la distribución del gradiente de orientación parece inclinarse alo largo del límite de la partición. El problema de la mezcla tiende a reducirse a me-dida que el tamaño de la partición se hace más pequeño, pero el problema de lafragmentación requiere de lo contrario.

Una extensión simple y efectiva del esquema de particionamiento fijo conlle-va el uso de dos conjuntos de particiones solapadas: cuando una partición fragmentauna línea porque se tumba a lo largo de un límite de partición, la otra tenderá a situaresa misma línea de forma completa en una partición.

El problema crítico de esta aproximación es la mezcla de las dos representa-ciones en la medida de que una línea simple en la imagen es asociada principalmentecon una región entorno de línea. La región mejor considerada por la asociación depixel es la única que suministra la mayor interpretación de la línea. Se utiliza el si-guiente esquema para seleccionar regiones y líneas de representaciones solapadas: 1)la longitud de las líneas son conocidas para cada una de las regiones; 2) desde que

Fig 37. Esquema de 8 particiones de 45 º con la primera centrada a los 22,5º.

Page 36: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Extracción de contornos rectos Raúl Varas Martínez

36 GCII-FAIS-UPMDOC00X-99

cada pixel es miembro de dos regiones (una en cada segmentación), vota y es asocia-do con la región que de las dos suministra la mayor interpretación; 3) cada regiónrecibe la cuenta del número de los pixel que votan por ella; y finalmente, 4) el entor-no de cada región de las dos representaciones es dada en el porcentaje del númerototal de pixel que han votado por él. Las regiones seleccionadas son aquellas quetienen una mayoría, por ejemplo, de entorno mayor al 50 por ciento.

4.2.1.2 Interpretación de la región entorno de línea como una línea rec-ta

Cada región entorno de línea representa un área candidata a ser línea rectadesde el momento en que el gradiente local estima la posición común de la orienta-ción. La primera vez que la línea se determina, sus parámetros posicionales serviráncomo alma de la descripción simbólica de la estructura, así como de sistema de coor-denadas local sobre el cual serán medidos otros atributos (como su longitud, anchura,contraste y rectitud). El problema clave es utilizar la información contenida en lasuperficie fundamental de intensidad para encontrar la línea.

La superficie de intensidad asociada con cada región de entorno de líneaasume ser una representación ruidosa de una rampa ideal, que puede ser caracteriza-da por una superficie plana. Los parámetros de este plano deben ser obtenidos poruna ponderación de mínimos cuadrados de los valores característicos. La pondera-ción es una función lineal del gradiente de magnitud local y determina la contribu-

Fig 39. Regiones solapadas en las dos particiones.

Original Segunda segmentaciónPrimera segmentación

Fig 38. Modo de trabajo de particiones solapadas.

Page 37: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Raúl Varas Martínez Extracción de contornos rectos

GCII-FAIS-UPMDOC00X-9937

ción de la intensidad de un pixel para el ajuste final del plano. Esto tiene el efecto depermitir importantes variaciones locales de intensidad para dominar el ajuste. En lapráctica, la ponderación es necesaria para reducir la contribución de pixel cercanos alos extremos de cambios de intensidad donde la magnitud del cambio es a menudobastante pequeña.

Ahora que el plano ajustado a la superficie de intensidad está disponible, unarestricción obvia sobre la orientación de la línea es que debe ser perpendicular al

Fig 41. Representación de una escalón real con ruido y visión en 3D.

Fig 40. Representación de una escalón ideal con ruido y visión en 3D.

Fig 42. Determinación del borde por intersección planar.

Page 38: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Extracción de contornos rectos Raúl Varas Martínez

38 GCII-FAIS-UPMDOC00X-99

gradiente del plano. Así, esto deja solo el problema de la localización de la línea a lolargo de la proyección del gradiente. Una aproximación simple es determinar la in-tersección del plano ajustado con un plano horizontal representativo de la intensidadmedia de la región ponderada por el gradiente local de magnitud.

4.2.2 Atributos de la región entorno de líneaLa región entorno de línea proporciona una excelente oportunidad para estu-

diar el aspecto del comportamiento de la línea más allá de la orientación base y losparámetros de posición. Veamos como la región entorno de línea puede ser usadacomo una fuente de información detallada sobre la línea, mediante la utilización fun-damental de la intensidad para caracterizar la línea y su región asociada como unaestructura con longitud, anchura, contraste, pendiente y, finalmente, rectitud. Lasmedidas definidas aquí podrían ser consideradas primeras aproximaciones para aná-lisis más complejos. Estas propiedades proporcionan criterios de selección para lí-neas con propiedades particulares.

Algunas propiedades de la línea derivan inmediatamente del proceso de ex-tracción de parámetros. La longitud es simplemente la distancia entre dos puntosfinales. Otra medida es el nivel medio del gradiente ponderado de intensidades delplano usado para encontrar la posición lateral de la línea.

4.2.2.1 Contraste, pendiente y anchura de la líneaAlgunos otros atributos potencialmente interesantes de una línea son las pro-

piedades de su perfil (perpendicular al borde). Las características del perfil de la su-perficie de intensidad a lo largo de línea incluyen: 1) contraste – el cambio de laintensidad acumulada que ocurre de un lado al otro de la línea; 2) anchura o espesor– el tamaño del intervalo, a lo largo del perfil, dentro de cual ocurre el cambio devolumen de intensidad, y finalmente 3) pendiente – la inclinación de la superficie

Segmentación obtenida

Fig 43. Extracción de una línea de una región entorno de línea.

Región entorno de línea

Línea detectada

Page 39: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Raúl Varas Martínez Extracción de contornos rectos

GCII-FAIS-UPMDOC00X-9939

dentro de este intervalo. Ciertamente, estas tres propiedades están relacionadas tos-camente por la fórmula

y tendiendo medidas dos, se pueden utilizar para determinar de forma rápida la otra.Estas relaciones son muy claras y precisas en la estructura de rampa ideal.

Desafortunadamente, muchos perfiles de intensidad son altamente no linealesy la manera en la que cambia la intensidad es concentrada a lo largo del perfil va-riando considerablemente.

La inclinación del plano de ajuste a la superficie de intensidad es una posiblemedida de la pendiente del borde. Sin embargo, la presencia de amplios salientessuaves sobre el perfil disminuirán la pendiente por debajo de la que se hubiera obte-nido mediante una medición de la inclinación sobre el área de mayor radio de cambiode la superficie de intensidad.

El contraste parece estar menos afectado por la forma actual del perfil, desdeque compromete estrictamente el cambio de intensidad acumulado. Para una rodajasimple de un lado a otro de la línea, el contraste será simplemente definido como ladiferencia entre el máximo y mínimo de los valores en la región entorno de línea.Una versión más efectiva podría ser la media de los valores característicos altos deun lado de la línea y la media de los valores característicos bajos del otro lado de lalínea. Esto puede ser conseguido mediante el promedio de los valores característicosde los pixeles en los N mayores y menores porcentajes de la región de entorno delínea, donde N debería estar en un rango del 10 por ciento.

Con estas dos características, llegamos a la anchura de la línea. Puede ser me-dida directamente o tomada de su relación como el contraste dividido de la pendien-te. Se podría pensar que el desarrollo del cambió total de intensidad a través delperfil sería el mayor factor para determinar la anchura. Sin embargo, es complicadorelacionar de forma clara el desarrollo del algunas “anchuras” medidas porque sonmuchos los salientes de bajo gradiente que pueden distorsionar la medida.

4.2.2.2 Pendiente de una línea vía variación de orientación e iso-contornos

Un atributo final que es bastante importante para determinar la pendiente es elgrado con el cual la superficie de intensidad de la región entorno representa real-mente una línea recta. Una línea ondulante cuya orientación local permanezca con elrango de una partición simple puede producir una región entorno de línea y una su-perficie de ajuste plano tal que sea equivalente a una línea recta. Los atributos glo-bales de contraste, orientación, longitud, posición y anchura media de una líneaondulante y una recta podrían ser los mismos. Sin embargo, la distribución espacialdel gradiente de orientación de los vectores en la región entorno de línea pueden serbastante diferentes.

Una medida simple de rectitud es la variación de la orientación, partiendo deque disminuirá si todos los vectores tienen orientación similar. Por supuesto, estamedida es ligeramente complicada porque se calcula sobre una escala circular. Lamedida de Mardia del término medio minimiza la longitud de la curda acumulativa

pendienteanchuracontraste ×=

Page 40: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Extracción de contornos rectos Raúl Varas Martínez

40 GCII-FAIS-UPMDOC00X-99

partiendo de los datos de la estimación. El centro de la masa se encuentra localizadopor el muestreo establecido a través de la suma de vectores seguido por una divisiónpor la magnitud total. El vector resultante, centro de masa, apunta en la dirección dela muestra y el arco coseno de su magnitud (radio) es la desviación estándar (ángulode desviación estándar) de la dirección de la muestra.

Otro método para generar una medida de la rectitud es calcular propiedadesde intensidad de iso-contorno pasando de un lado a otro de la región. Los contornosson generados mediante el cálculo de la intersección de un plano horizontal que re-presenta un valor de intensidad con la superficie de intensidad actual. En general, losiso-contornos tienden a desplazarse paralelos a la línea extraída, porque, por supues-to, la orientación estará forzada a encuadrarse dentro de una partición simple deorientación en la segmentación del gradiente. Sin embargo, los iso-contornos varia-rán localmente como una función de la superficie de intensidad y pueden reflejarcualquier falta de rectitud.

La idea básica es la de medir la distancia media de los puntos contorno a unalínea recta ajustada con ellos y luego dividir esta cantidad por la longitud de la línea.Este último paso es para crear una escala independiente de la medida.

4.2.2.3 Rectitud de una línea vía orientación media por tramosEsta medida es más compleja, pero las distancias focales en la distribución

espacial de la orientación de los vectores son las que transportan la mayor de la in-formación acerca de la curvatura de la línea. Una vez que se determina la línea repre-sentativa para cada región, puede ser calculado el mejor ajuste plano de los pixelasociados secuencialmente con cada subsección (es decir, en secciones de 1/2, 1/4,1/8, ..., dependiendo de su longitud). En otras palabras, estamos aplicando el mismoalgoritmo para el cálculo de la superficie ajustada y de la orientación de la línea detodo el conjunto de región entorno a regiones entorno espacialmente contiguas. Estonos indicará la orientación de cualquier línea, curvada o recta, al margen de la reso-lución angular de las subsecciones. Si se presenta una característica lineal, todas lasporciones producirán aproximadamente la misma orientación; sin embargo, la distri-bución espacial de las líneas onduladas, irregulares o con curvatura suavemente cón-cava o convexa puede ser determinada aproximadamente. En el límite, se calcula elgradiente de dirección en cada punto de la línea representativa. Más bien, el cálculose debería realizar para las regiones seleccionadas, por ejemplo, aquellas cuya va-rianza es mayor que un determinado umbral.

4.2.3 Resultados del algoritmo de Burns en la detección de líneas aé-reasEn las secciones anteriores se ha visto un desarrollo teórico de la técnica de

detección de bordes correspondiente al método de Burns. A continuación se procede-rá a la utilización de dicha técnica para la detección de líneas aéreas en imágenesdigitales proporcionadas por una cámara de vídeo. En general la secuencia de vídeoproporcionada por la cámara tiende a tomar los cables de las líneas aéreas sobre unfondo con pocos objetos y por ello nos centraremos en el fotograma utilizado paramostrar la introducción a las imágenes digitales. Al final de todo el proceso para estefotograma, se pondrán de manifiesto los resultados de este mismo algoritmo para la

Page 41: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Raúl Varas Martínez Extracción de contornos rectos

GCII-FAIS-UPMDOC00X-9941

detección de líneas aéreas cuando estas se encuentran sobre un ambiente mucho me-nos estructurado.

El primer paso a seguir sería la determinación del módulo y la dirección delgradiente de la imagen. Para este paso se ha utilizado, por razones expuestas ante-riormente, la máscara de 3x3 para detección de bordes horizontales y verticales.

Una vez que hemos realizado este paso, la siguiente operación es la segmen-tación de la dirección del gradiente utilizando el mecanismo de particiones solapa-das. Para ello se ha optado por tomar un particionamiento en ocho tramos de 45º deamplitud cada uno. La primera partición tendrá el origen del grupo en los 0º, mien-tras que la segunda partición lo tendrá en los 22’5º.

Original.

Modulo del gradiente. Dirección del gradiente.

Fig 44. Determinación del módulo y la dirección del gradiente.

Page 42: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Extracción de contornos rectos Raúl Varas Martínez

42 GCII-FAIS-UPMDOC00X-99

(a) Segmentación I (0º-45º). (b) Segmentación I (45º-90º).

(c) Segmentación I (90º-135º). (d) Segmentación I (135º-180º).

(e) Segmentación I (180º-225º). (f) Segmentación I (225º-270º).

Page 43: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Raúl Varas Martínez Extracción de contornos rectos

GCII-FAIS-UPMDOC00X-9943

Fig 45 (a-h). Primera segmentación.

(g) Segmentación I (180º-225º). (h) Segmentación I (225º-270º).

(a) Segmentación II (337,5-22,5º). (b) Segmentación II (22,5º-67,5º).

(c) Segmentación II (67,5-112,5º). (d) Segmentación II (112,5º-157,5º).

Page 44: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Extracción de contornos rectos Raúl Varas Martínez

44 GCII-FAIS-UPMDOC00X-99

Se puede observar como en algunas de las particiones aparecen regiones en-torno de línea que reflejan fielmente los bordes de los cables. En otras, sin embargo,aparecen pequeñas regiones entorno de línea que marcan la textura ligera del fondo.

Necesitamos ahora de un criterio de selección para aislar los sucesos que nosinteresa. Como en nuestro caso tratamos de buscar líneas grandes, podemos recurriral criterio de seleccionar las regiones que cuenten con un número importante de pixely que se encuentren unidos con un entorno de vecindad de ocho (en todas las direc-ciones). Esto indicará que corresponde a una línea de envergadura. De este modoeliminaremos las pequeñas regiones entorno correspondientes a la textura pesada delfondo y a líneas menos representativas.

Tomando esta base, el proceso de selección nos deja con las regiones entornode línea siguientes:

• Regiones números 1 y 2, de la segmentación I (b).• Regiones números 3 y 4, de la segmentación I (f).• Región número 5, de la segmentación II (c).

(e) Segmentación II (157,5-202,5º). (f) Segmentación II (202,5º-247,5º).

(g) Segmentación II (247,5-292,5º). (h) Segmentación II (292,5º-337,5º).

Fig 46 (a-h). Segunda segmentación.

Page 45: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Raúl Varas Martínez Extracción de contornos rectos

GCII-FAIS-UPMDOC00X-9945

Las regiones de los números 1, 2, 3 y 4 al ser del mismo particionamiento(aunque de distinto grupo), no podrán estar solapadas. Si puede existir solapamientoentre estas regiones y la región número 5. Comprobamos ahora el área solapada entrela región número 5 y aquellas de las anteriores con las cuales tiene zona común.

Región entorno de línea #1.(Segmentación I – b)

Región entorno de línea #2.(Segmentación I – b)

Región entorno de línea #3.(Segmentación I – f)

Región entorno de línea #4.(Segmentación I – f)

Región entorno de línea #5.(Segmentación II – c)

Page 46: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Extracción de contornos rectos Raúl Varas Martínez

46 GCII-FAIS-UPMDOC00X-99

Todos los pixel mostrados pertenecen a las dos regiones. En este punto escuando interviene el proceso de votación.

Cada pixel vota por una región. Para hacerlo, se basa en lo que representa pa-ra el conjunto total de la región y dará el voto a la región que tenga mayor número depixel, lo que indica que representa más fielmente el borde. Las regiones solapadasque no hayan sido suficientemente votadas, serán eliminadas. En nuestro caso, laregión número 5 es la menos representativa de la parte inferior de la línea, por tantose elimina para el siguiente paso.

Entramos ahora en el propio proceso de extracción de la línea recta. Cada unade las regiones entorno de línea podemos considerarla constituida por un conjuntofinito de pequeños tramos rectos horizontales adyacentes de longitud variable. Va-mos a considerar por cada uno de esos tramos rectos un punto. La forma de determi-nar la ubicación de ese punto es sencilla, basta con tomar en la imagen del módulodel gradiente la intensidad de cada uno de los pixel del segmento, tomar un umbralpara determinar qué pixel es en realidad el que da comienzo y final al segmento ycalcular el punto medio del mismo.

Con toda esta colección de puntos, se realiza un ajuste para ver qué recta es laque representa de forma más real el borde. Podemos utilizar el método más sencillode ajuste por mínimos cuadrados o recurrir a mecanismos de regresión lineal.

Tras este proceso, estamos en condiciones de mostrar la información relativaa las rectas halladas. El resultado se acerca en gran medida a lo deseado.

Área solapada entre las regiones #2 y #5. Área solapada entre las regiones #4 y #5.

Fig 47. Estructura de las regiones entorno de línea.

Page 47: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Raúl Varas Martínez Extracción de contornos rectos

GCII-FAIS-UPMDOC00X-9947

Además de los parámetros propios de la línea recta (pendiente, ordenada en elorigen, coordenadas x e y de inicio y final), se pueden extraer los valores del nivelmedio de gris, la varianza y de éstos la anchura (en pixel).

A lo largo de la secuencia de vídeo proporcionada con la cámara, nos encon-tramos con distintos ambientes. Algunos ejemplos se muestran a continuación, en-contrándose en todos ellos una buena respuesta por parte del algoritmo desarrollado.

Fig 48. Líneas detectadas.

Fig 49. Ejemplo A.

Page 48: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Extracción de contornos rectos Raúl Varas Martínez

48 GCII-FAIS-UPMDOC00X-99

Fig 50. Ejemplo B.

Fig 51. Ejemplo C.

Page 49: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Raúl Varas Martínez Extracción de contornos rectos

GCII-FAIS-UPMDOC00X-9949

� ConclusionesLa extracción de contornos tiene hoy en día una vital importancia para la

comprensión de las imágenes digitales. Cuando nosotros tratamos de obtener infor-mación de una imagen, los contornos de la misma proporcionan el esqueleto para darsoporte al resto de la estructura. Por este motivo es necesario contar con una técnicarobusta que nos proporcione esta característica.

El algoritmo de Burns para la extracción de contornos rectos resuelve esteproblema. A diferencia del resto de técnicas de detección de contornos rectos, tomacomo marco de referencia la orientación del gradiente de la convolución de la infor-mación de la imagen con la máscara de detección de bordes, sin relegar por ello laimportancia de la magnitud del gradiente a la hora de la toma de decisiones sobre lapotencia del borde.

Gracias a esta técnica es posible llegar a objetivos que otros métodos de de-tección de bordes no conseguían, como la detección de líneas en zonas de bajo con-traste que el módulo del gradiente no consigue detectar o extraer pequeñas líneascorrespondientes a las texturas pesadas.

La aplicación de este algoritmo a las imágenes de prueba, ha puesto de mani-fiesto su buen funcionamiento a la hora de detectar las líneas aéreas. En todos loscasos ha cumplido su objetivo sin problemas y con una precisión muy alta.

Dentro de este punto, cabe mencionar que es recomendable la eliminación deun marco de los primeros pixel de la imagen para evitar la detección de líneas que nocorresponden a la imagen. Esto sucede sobre todo cuando tratamos imágenes queprovienen de una cámara de vídeo y que, generalmente, suelen llevar acoplado unpequeño marco de pixel con información que no se corresponde con la imagen.

Page 50: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Extracción de contornos rectos Raúl Varas Martínez

50 GCII-FAIS-UPMDOC00X-99

Otro punto importante a favor de este algoritmo es el bajo coste computacio-nal del mismo. Al producirse la segmentación de la imagen en regiones entorno delínea, la cantidad de información con la que el algoritmo tiene que trabajar es menorque la utilizada por otros algoritmos.

En nuestro caso, nos han servido de soporte librerías específicas para el pro-cesamiento de imágenes digitales proporcionadas por Matrox. Este conjunto de libre-rías llamadas MIL (Matrox Imaging Library) compatibles con los programas dedesarrollo de software más habituales, proporcionan una herramienta cómoda deprogramación con gran potencia de análisis.

Para trabajos futuros queda la labor de la realización del algoritmo sin tener lanecesidad de recurrir a librerías de terceros. Este paso agilizaría aún más la velocidadde proceso, pues aunque estas librerías están especializadas en el procesamiento deimágenes, no dejan de ser de carácter general, con las desventajas que eso conllevade cara a la eliminación de partes que no son necesarias para el propósito concreto.

En resumen, podemos asegurar que el método ideado por J. B. Burns es unode los más importantes dentro del ámbito de la extracción de contornos rectos y tienea su favor, además de su rapidez, su buena respuesta ante los casos en los que otrosalgoritmos perdían fuerza.

Page 51: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Raúl Varas Martínez Extracción de contornos rectos

GCII-FAIS-UPMDOC00X-9951

� Bibliografía[Burns86] Burns J. B., Hanson A. R. Extracting Straight Lines. IEEE Transac-

tions on Pattern Analysis and Machine Intelligence, Vol. PAMI-8 Nº4,1986.

[Burre99] Burrel R. Generalized Hough Transform. Dirección de Internet:http://www.enetis.net/~rburrell/hough.html, 1999.

[Fishe99] Fisher R. The Evolving, Distributed, Non-Proprietary, On-Line Com-pendium of Computer Vision. CVonline. Dirección de Internet:http://www.dai.ed.ac.uk/CVonline/CVentry.htm, 1999.

[Marsh94] Marshall D. Vision Systems. World Scientific. Dirección de Internet:http://www.cm.cf.ac.uk/Dave/Vision_lecture/Vision_lecture_caller.html, 1944.

[Marti96] Martínez J.M., Zhang Z., Montano L. Segment-Based Structure froman Imprecisely Located Camera. IEEE Int. Symposium on ComputerVision, ISCV'96. pp182-187. Dirección de Internet:http://www.cps.unizar.es/~josemari/, 1999.

[McLau97] McLaughlin R., Alder M. The Hough Transform versus theUpWrite. Technical Report. Dirección de Internet:http://ciips.ee.uwa.edu.au/~ram/papers/Tech_Reports/Technical_Repo

Page 52: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Extracción de contornos rectos Raúl Varas Martínez

52 GCII-FAIS-UPMDOC00X-99

rt_The_Hough_Transform_versus_the_UpWrite/hough_vs_upwrite/hough_vs_upwrite.html, 1997.

[Pérez95] Pérez de la Blanca, Nicolás. Fundamentos del Tratamiento de Imáge-nes. Visión por Computador. Dirección de Internet:http://bucanero.ugr.es/wwwcurso/ccordoba/ccordoba.html, 1995.

[Pérez99] Pérez Sánchez E. Aplicación y desarrollo de algoritmos de procesa-miento de imágenes para la extracción de rectas en un entornoestructurado. Proyecto final de carrera UPV. Dirección de Internet:http://bernia.disca.upv.es/src/vision/vision/kike/proyecto/Pfc.html,1999.

[Ruzon95] Ruzon M. Early Vision Using Distributions. Dirección de Internet:http://www.robotics.stanford.edu/~ruzon/compass/canny.html, 1995.

[Sonka98] Sonka M., Hlavac V., Boyle R. Image Processing, Analysis and Ma-chine Vision. Brooks and Coole Publishing. Dirección de Internet:http://www.icaen.uiowa.edu/~dip/LECTURE/lecture.html, 1998.

[Young95] Young I. T., Gerbrands J. J., van Vliet L. J. Image Processing Funda-mentals. Fundamentals of Image Processing. Dirección de Internet:http://www.ph.tn.tudelft.nl/Courses/FIP/noframes/fip.html, 1995.

[Young95] Young D. Sussex Computer Vision Teach Files. Dirección de Internet:http://www.cogs.susx.ac.uk/users/davidy/teachvision/vision0.html,1995.

[Wolff98] Wolff A. Basic Image Processing Operations For Computer Vision.Dirección de Internet:http://www.cs.jhu.edu/~wolff/course600.461/week2.2/, 1998.

Page 53: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Raúl Varas Martínez Extracción de contornos rectos

GCII-FAIS-UPMDOC00X-9953

INDICE

RESUMEN 1

�� INTRODUCCIÓN 3

�� ESTADO DE LA TÉCNICA 5

�� ALGORITMOS DE DETECCIÓN DE BORDES EN LAS IMÁGENESDIGITALES 9

3.1 OPERACIONES BASADAS EN EL HISTOGRAMA DE LA IMAGEN 103.1.1 AUMENTO DEL CONTRASTE 103.1.2 ECUALIZACIÓN DEL HISTOGRAMA 113.2 OPERACIONES BASADAS EN MATEMÁTICAS SIMPLES 113.2.1 ARITMÉTICA BINARIA 113.2.2 ARITMÉTICA ORDINARIA 123.3 OPERACIONES BASADAS EN LA CONVOLUCIÓN . 133.4 OPERACIONES BASADAS EN DETECCIÓN MATEMÁTICA . 163.4.1 PRIMERA DERIVADA 163.4.2 SEGUNDA DERIVADA 183.5 OPERACIONES BASADAS EN LA MORFOLOGÍA MATEMÁTICA . 203.5.1 DILATACIÓN Y EROSIÓN 213.5.2 APERTURA (OPENING) Y CIERRE (CLOSING) 223.5.3 ADELGAZAMIENTO (THINNING) Y ENGORDE (THICKENING) 22

�� EXTRACCIÓN DE LÍNEAS RECTAS 25

4.1 TRANSFORMADA DE HOUGH 254.1.1 GENERALIZACIÓN DE LA TRANSFORMADA DE HOUGH 274.1.2 TRANSFORMADA DE HOUGH ALEATORIA 284.1.3 TRANSFORMADA DE HOUGH PROBABILÍSTICA 284.1.4 TRANSFORMADA DE HOUGH JERÁRQUICA 294.2 ALGORITMO DE BURNS 294.2.1 REPRESENTACIÓN Y PROCESO PARA LA EXTRACCIÓN DE LÍNEAS RECTAS 314.2.1.1 Agrupación de pixel en regiones entorno de líneas vía gradiente de orientación 314.2.1.2 Interpretación de la región entorno de línea como una línea recta 364.2.2 ATRIBUTOS DE LA REGIÓN ENTORNO DE LÍNEA 384.2.2.1 Contraste, pendiente y anchura de la línea 38

Page 54: Resumen - elai.upm.es · Comenzaremos con una breve reseña histórica del nacimiento de ... dedicó considerable esfuerzo al estudio de imágenes de rayos X, ... raciones de tipo

Extracción de contornos rectos Raúl Varas Martínez

54 GCII-FAIS-UPMDOC00X-99

4.2.2.2 Pendiente de una línea vía variación de orientación e iso-contornos 394.2.2.3 Rectitud de una línea vía orientación media por tramos 404.2.3 RESULTADOS DEL ALGORITMO DE BURNS EN LA DETECCIÓN DE LÍNEAS

AÉREAS 40

�� CONCLUSIONES 49

�� BIBLIOGRAFÍA 51