ECIMAG08 Introduccion a las wavelets - dc.uba.ar · Introducción a las wavelets y sus aplicaciones...
Transcript of ECIMAG08 Introduccion a las wavelets - dc.uba.ar · Introducción a las wavelets y sus aplicaciones...
Introducción a las waveletsy sus aplicaciones
al procesamiento de imágenes
ECImag 2008
Ana Ruedin
Departamento de Computación,
Facultad de Ciencias Exactas y Naturales,
Universidad de Buenos Aires
1. Como surgieron las wavelets. Qué son.
2. Transformada wavelet continua.Detección de dígitos manuscritos.
3. Transformada wavelet discreta.Compresión (con pérdida)
4. Transformada wavelet de enteros a enteros.Compresión (sin pérdida)
5. Transformada wavelet invariante.Detección de bordes de una imagen. Reconstrucción a partir de los bordes.
Descriptores para la identificación de texturas y búsqueda en bases de datos de imágenes
6. Transformada wavelet continua discretizada sobre una grilla especial.Análisis y síntesis de música
Bases de cosenos
(Parte real de la transf Fourier)
{ })cos(kx
∑=k
k kxbxf )cos()(
)cos( x
)3cos( x
)7cos( x
Coeficientes b
Bases de cosenos
{ })cos(kx
∑=k
k kxbxf )cos()(
)cos( x
)3cos( x
)7cos( x
coeficientes b)(xf
(Parte real de la transf Fourier)
Coeficientes b
Bases de cosenos
{ })cos(kx
∑=k
k kxbxf )cos()(
)cos( x
)3cos( x
)7cos( x
∑k
k kxb )cos( Reconstrucción con los 5 coeficientes de mayor magnitud
coeficientes b)(xf
(Parte real de la transf Fourier)
Bases de cosenos | FourierNo hay información temporal
Excelente información frecuencialCuando la señal es 0, las bases se cancelan
Bases de cosenos | FourierNo hay información temporal
Excelente información frecuencialCuando la señal es 0, las bases se cancelan
Jean Morlet 1980 Prospección de petróleo.
eco sensoresbombas de estruendo
conocimiento sobre capas de suelo
Las ondas sonoras atraviesan las capas de materiales diferentes a distintas velocidades
Bases de cosenos | FourierNo hay información temporal
Excelente información frecuencialCuando la señal es 0, las bases se cancelan
Jean Morlet 1980 Prospección de petróleo.
eco sensoresbombas de estruendo
conocimiento sobre capas de suelo
Sistemas de ecuaciones en 4 d. Grandes volúmenes de datos
Se resuelve por Fourier.
En los intervalos entre el estallido de las bombas de estruendo, la solución no era nula.
Las ondas sonoras atraviesan las capas de materiales diferentes a distintas velocidades
0.9239
0
-1
0
-0.5
∑=i
ii yxyx,0.5
⎟⎠⎞
⎜⎝⎛ −Ψ
a
bxTraslaciones
dxa
bx
axf∫
∞
∞−
⎟⎠⎞
⎜⎝⎛ −Ψ1
)(
0=b
2=b
4=b
)2( =a
Transformada: un producto escalar
¿Qué son las wavelets?
)(xΦFunción de escala
⎭⎬⎫
⎩⎨⎧
⎟⎟⎠
⎞⎜⎜⎝
⎛ −Ψ=j
j
j
kxspanW
2
2
Wavelet )( xΨ
0)( =Ψ∫∞
∞−
dxx
⎭⎬⎫
⎩⎨⎧
⎟⎟⎠
⎞⎜⎜⎝
⎛ −Φ=j
j
j
kxspanV
2
2
1)( =Φ∫∞
∞−
dxx
Subespacios de aproximación Subespacios de detalle
Transformada wavelet discreta
...012 ⊂⊂⊂ VVV
Transformada wavelet discreta
0V1V2V
1W
2W
jjj VWV =⊕ ++ 11
Transformada rápida: promedio ponderado de la señal con 8 coeficientes.
...012 ⊂⊂⊂ VVV
⎟⎠⎞
⎜⎝⎛ −Ψ+⎟
⎠⎞
⎜⎝⎛ −Φ= ∑∑ 2
2
2
2)( )1()1( kx
dkx
cxfk
kk
k
Transformada: proyección sobre los subespacios de aproximación y detalle
Transformada wavelet discreta
0V1V2V
1W
2W
jjj VWV =⊕ ++ 11
1V∈1W∈
detalles
aproximación {
Señal original ≈ suma de detalles a diferentes escalas + una aproximación burda
Transformada wavelet discreta
Esquema de la transformada : 2 pasos
Convolución o filtrado
2 Decimación o submuestreo
de a 2; se eliminan los impares
2h
2h
2g2h
2h 2g
)0(c
)1(c
)2(c
)1(d
)2(d
)(wH )(wG
h filtro pasa bajos
g filtro pasa altos
)1(c )1(d
)2(c )2(d
w
1 pasoA1
D1
V1
H1
A AproximaciónV detalle VerticalH detalle HorizontalD detalle Diagonal
Transformada wavelet discreta
A1
D1
V1
H1
A2
D1
V1
H1
H2
V2
D21 paso 2 pasosA AproximaciónV detalle VerticalH detalle HorizontalD detalle Diagonal
Transformada wavelet discreta
Umbrales de 25, 10 y 5%
Representación rala de una imagen
Separación en detalles de ubicación y escala diferentes: textura, bordes, etc.
Concentra la energía en pocos coeficientes: compresión.
JPEG (24.43 dB) DCT 8 x 8 Usando wavelets (27.74 dB)
Comprimida 2 KB !!!
0.065277 bpp Compresión 122:1
Compresión (con pérdida)Original 256 KB
Tesis de licenciatura: Manzano y Martínez Ricci 1999
– 8 bandas– Respuestas a ciertas frecuencias del espectro
electromagnético– Objetivo: aprovechar correlación entre las bandas
...
Investigación conjunta con Daniel Acevedo
(estudiante de doctorado)
Problema: grandes volúmenes de datos
1 banda 50 MB8 bandas 400 MB
Compresión sin pérdidade imágenes satelitales
...
Wavelets de enteros a enteros
Imagen
Pixeles: 0-255
Imagen transformada
biyección
Coeficientes: -300 - 300
DH1 DD1
DV1
DH2
DV2
DD2
DV3
DH3 DD3
Investigación conjunta con Daniel Acevedo
(estudiante de doctorado)
Compresión sin pérdidade imágenes satelitales
• Wavelet: se reduce la correlación espacial.• Se clasifica la imagen.• Se predice cada coeficiente (utilizando coefs ya codificados).• Se codifican las diferencias de predicción• Codificador aritmético (basado en la entropía)
COMPRESOR
136,65125,10118,83179,80116,72Mendoza
117,92111,30105,33159,24103,98San Luis
105,6199,5498,43139,9490,37Santa Cruz
121,67113,53106,88161,05104,76Buenos Aires
PNGJPEG2000LOCO-IWINZIPNUESTROMETODO
4.23 :1Tasa de compresión
Resultados en MB Imágenes originales: 400MB
Compresión sin pérdidade imágenes satelitales
Investigación conjunta con Daniel Acevedo
(estudiante de doctorado)
Transformada wavelet invariante
Los detalles horizontales, verticales y diagonales tienen el mismo tamaño que la imagen original.
Transformada redundante.
Invariante a traslaciones.
Sin submuestreo (o decimación).
0 50 100 150 200 250
0
0.5
10 50 100 150 200 250
0
0.5
1
0
1
2
−1
0
1
0
1
2
−1
0
1
0
2
4
−1
0
1
0
2
4
−2
0
2
0
5
−2
0
2
2
4
6
−2
0
2
4
5
6
−2
0
2
7.56
−1
0
1
Aproximaciones Detalles
Detección de bordes
Máximos locales del móduloDetalles
Las singularidades más importantes se propagan hacia las escalas más gruesas
Detección de bordes
Fig. 2: Brodatz texture collectionFig. 2: Brodatz texture collection
16 imágenes de 64x64 de cada textura
Identificación de texturas
Histograma conjunto de detalle horizontal y vertical
Nivel 1 Nivel 2 Nivel 3
TransformadaWaveletDiscreta
TransformadaWavelet
Invariante
De Ves, Ruedin, Acevedo, Benavent, Seijas, CAIP 2006
Identificación de texturas
Histograma de módulos
Identificación de texturas
Nivel 1 Nivel 2
TransformadaWavelet
Invariante Histograma circular de ángulos
Nivel 3
Recuperación en una base de diferentes texturasEn promedio
De Ves, Ruedin, Acevedo, Benavent, Seijas, CAIP 2006 89 %
Distancia basada en la diver-genciaKullbackLeibler
Algunas muestras de la base de dígitos CENPARMI, de la Universidad de Concordia
Se utiliza una red neuronal.
Tesis de licenciatura en curso. Alumno: D.J.Romero. Codirección: L.Seijas.
Reconocimiento de dígitos manuscritos .
4000 dígitos para entrenamiento. 2000 para testeo.
Reconocimiento de dígitos manuscritos .
Transformada wavelet continua para imágenes
2121
211
)/)(,(),(),,,,( dxdx
a
bxbxRxxfbbaW yx
ayxf ∫∫∞
∞−
∞
∞−⎟⎟⎠
⎞⎜⎜⎝
⎛ −−Ψ=
εεθ θ
f(x)
b
a
1 D
Se estira la wavelet
Se hace una rotación
Son 5 parámetros.
i. Curvaturaii. Suma de cuadrados de los módulos del gradienteiii. Entropía de módulos del gradienteiv. Entropía de los ángulos del gradientev. Suma de cuadrados de la transf. Sombrero Mejicano para distintos ángulosvi. Entropía de módulos de la transf. Sombrero Mejicano para distintos ángulosvii. Densidad escala-ángulo
Reconocimiento de dígitos manuscritos .
V
(i,v) (ii,vi)
Dígito
Versión suavizada
+
Vector V
Red Neuronal
Perceptrón
multicapa
Clase
PREPROCESAMIENTO
BASADO EN LA
TRANSFORMADA
WAVELET
Reconocimiento sobre el conjunto de entrenamiento
Reconocimiento sobre el conjunto de testeo
99.28 %
92.70 %
Reconocimiento de dígitos manuscritos .
Bases estables para música en dominio tiempo-frecuencia
Investigación conjunta con Juan Vuletich, tesista de licenciatura
Bases wavelets para música.
Gabor Weyl-Heisenberg
{ })(2 katge tbji −π
establesframesab
inestablesbasesab
1
1
<=
tiempo
frecuencia
g Gaussiana
Localización tiempo- frecuencia óptima
Representaciones redundantes
Grilla uniforme
21≥ft σσ
Principio de incertidumbre Heisenberg
a
b
Bases wavelets para música.
Música
102 FaF =
102 FaF =1F
1112
013 2 FFaF ==
1 octava
1210 2=a irracional
progresión geométrica
Cociente de 2 frecuencias de notasadyacentes = constante
Bases wavelets para música.
Wavelets usadas para la trasformada
wavelet discreta
⎭⎬⎫
⎩⎨⎧
⎟⎟⎠
⎞⎜⎜⎝
⎛ −Ψj
j
j
kt
2
2
2
12/
1 octava
1 octava= 12 notas
Bases estables
Excelente localización en el tiempo
Localización de las frecuencias: no muy buena
Mosaico: área constante
Se necesita mayor tiempo para identificar una frecuencia baja
Bases wavelets para música.
Grilla especial para una octava
1F
12F
tiempo
Mosaicos: área constanteMosaicos más largos para frecuencias más bajas
Bases wavelets para música.