Clasificación Digital de imágenes: Métodos
description
Transcript of Clasificación Digital de imágenes: Métodos
-
1Clasificacin DigitalMtodos
Noviembre de 2007
Muchos de los materiales utilizados en esta presentacin han sido elaborados y facilitados por el Dr. Hctor del Valle
Fundamentos de la clasificacinLa clasificacin multiespectral es el proceso de ordenar los pxeles de una imagen en un nmero finito y definido de clases en base a caractersticas comunes
Mas espec ficamente, es el reconocimiento de patrones espectrales, que categoriza los nmeros digitales (ND) de los pxeles de una imagen continua (cuantitativa), en un nmero determinado de clases
El resultado es una capa temtica (cualitativa), que representa categoras (clases) especficas, basado en propiedades espectrales, datos auxiliares, trabajo de campo, etc.
Fases de la clasificacin
Entrenamiento (definir numricamente las categoras):
SupervisadoNo supervisado
Asignacin (categorizar los pxeles de la imagen)Verificacin de resultados
EntrenamientoTipo de la leyenda:
Jerrquicas (Anderson, LCCS, USGS; Corine)No jerrquicas
Propiedades de la leyenda:Clases mutuamente excluyentesClases ExhaustivasA tener en cuenta: evitar mezcla de criterios, ajustarse a los datos disponibles
v Un esquema de clasificacin define la leyendav Hay distintos esquemas de clasificacin disponibles:
v Los esquemas de clasificacin pueden ser jerrquicos y no jerrquicos
v Otros atributos que pueden ser mapeados incluyen: estructura de la vegetacin, disturbios de la cobertura terrestre, edad de la vegetacin (primarias y secundarias), distribucin de taxa, uso de la tierra, etc.
http://www.africover.org/LCCS.htmFAO Land Cover Classification System
http://landcover.usgs.gov/classes.aspNational Land Cover Data
http://landcover.usgs.gov/pdf/anderson.pdf
Anderson
URLClasificacin
-
2Entrenamiento supervisado
Pastizal
Agua reasforestales
Cultivos de riego
Sealar reas caractersticasen la imagen
Apoyo de radiometrade campo
Fuente: Chuvieco(1996)
Caractersticas de las reasde entrenamiento
Bien identificados:LocalizacinActualizacin
Suficientemente homogneos:Ruido de la escenaAuto-correlacin espacial
Que cubran todas las clases
Cmo obtener estadsticas de entrenamiento?
Muestreando pxeles:Se asume mxima variabilidadPueden seleccionarse p xeles aislados o pxeles en el interior de polgonosMtodos estandarizados
Segmentando la imagen en manchas:Se asume coherencia espacialMs ajustado a cartografa convencional
A partir de p xeles
Digitalizar polgonos:Tamao: autocorrelacinEfecto de bordeForma: Figuras geomtricas regulares Trazado irregular
Semillado:Distancia espectralDistancia espacial
Fuente: Chuvieco(1996)
A partir de manchas: Segmentacin de imgenes
Clasificacin sobre manchas:Criterio espectral (dispersin)Criterio espacial (contigidad)
Fuente: Chuvieco(1996)
Anlisis de estadsticas
Medidas de centralidad y dispersinGrficos de valores promedioGrficos de separabilidadMedidas estadsticas de separabilidad
Distancia normalizadaDivergencia
-
3Valores estadsticos
Banda
Urbano
Pastizal
Matorral
Pinar-Encinar
Suelo
Cultivo
Agua
ETM X DT X DT X DT X DT X DT X DT X DT 1 10,45 2,20 5,57 0,77 5,31 1,95 1,35 0,61 13,16 5,03 4,49 0,83 2,82 0,41 2 11,12 1,93 7,51 0,68 6,29 2,32 2,49 0,79 15,74 5,66 5,39 1,08 3,21 0,29 3 15,65 2,66 9,44 1,12 9,52 3,94 3,32 0,83 22,76 7,64 5,84 1,28 3,29 0,38 4 19,33 2,5428,80 3,85 16,80 4,02 17,53 3,86 25,71 4,77 30,84 3,28 1,60 0,19 5 21,88 2,5926,50 1,26 22,62 6,67 9,39 1,75 34,34 8,71 14,87 2,11 2,95 0,18 7 17,04 2,7015,54 1,54 15,18 4,73 5,42 0,94 26,76 8,15 7,75 1,15 2,65 0,27
Fuente: Chuvieco(1996)
Grficos de signaturas
0
5
10
15
20
25
30
35
40
1 2 3 4 5 7
urbano
pastizal
matorral
pinar-enc
suelo
cultivo
agua
Fuente: Chuvieco(1996)
Separabilidadgrfica
0
5
10
15
20
urbano pastizal matorral pinar-enc suelo cultivo agua
Banda 1
Banda 5
Banda 4
0
5
10
15
20
25
30
35
40
urbano pastizal matorral pinar-enc suelo cultivo agua
05
10
15
2025
30
35
40
4550
urbano pastizal matorral pinar-enc suelo cultivo agua
Fuente: Chuvieco(1996)
Separabilidad grfica
Banda 3 Banda 4
Fuente: Chuvieco(1996)
Elipses de dispersin
Banda 3
Foresta
Banda 4
Pastizal
Cultivo
Matorral
Urbano
Suelo
Agua
Fuente: Chuvieco(1996)
Separabilidad estadstica
Distancia normalizada:
Divergencia:DivAB = 0,5 Tr [(VA - VB) (VB-1 - VA-1)] + 0,5 Tr
[(VA-1 + VB-1) (MA - MB)(MA - MB)T]
Divergencia transformada:DTAB = c (1 - exp (-DivAB /8))
Bs
ND
+A
BA
BA, s
ND - = dn
-
4Ejemplo de separabilidad
Urbano Pastizal Matorral Pinar-Enc Agua Suelo Pastizal 2.000 Matorral 1.998 1.999 Pinar-Encinar 2.000 2.000 2.000 Agua 2.000 2.000 2.000 2.000 Suelo 1.942 2.000 1.999 2.000 2.000 Cultivo 2.000 2.000 2.000 1.993 2.000 2.000
Fuente: Chuvieco(1996)
Inters de las medidas de separabilidad
Determinar las clases problemticasRevisar el proceso de entrenamientoRevisar las bandas seleccionadas
Seleccionar las bandas con mayor poder discriminante
Evaluacin rea de entrenamiento
Las muestras de entrenamiento que han sido creadas pueden sen modificadas, renombradas, eliminadas, y fusionadas, segn sea necesario luego de haber sido evaluadas
Criterios de asignacin
Mnima distanciaParaleleppedosMxima probabilidadrboles de decisinRedes neuronales
Asignacin: Mnima distancia
R
IRCa
c
b
?
Fuente: Chuvieco(1996)
La regla de decisin de la mnima distancia calcula la distancia espectral entre el valor del p xel candidato y el valor media de cada firma, en cada banda.El clculo de la distancia se hace a travs de la ecuacin de la distancia euclidiana.
Asignacin: Mnima distancia
Ventajas:Rpido de ejecutarTodos los pxeles son clasificados
Inconvenientes:No considera varianzaProclive a errores de comisin
-
5Asignacin: Paraleleppedos
R
IRC a
c
b
?
?
Fuente: Chuvieco(1996)
En la regla de decisi n del paraleleppedo los niveles digitales del pxel candidato se comparan con los lmites superior e inferior de la firma. Estos lmites pueden ser: los valores mnimo y mximo de los ND para cada banda; la media de cada banda +/- n desviaciones estndar, u otros lmites definidos por el usuario en base a las distintas tcnicas de evaluacin de firmas espectrales.Considera reglas de no-clasificacin y de superposici n.
Asignacin: Paraleleppedos
Criterio de inclusin: si Inf < ND < Sup
Problemas:Pxeles en dos gruposPxeles sin clasificar
Ventajas:RpidoConsidera dispersin
Asignacin: Mxima probabilidad
R
IRC a
c
b
? La regla de decisi n de la mxima verosimilitud o mxima probabilidad est basada en la probabilidad que un pxel pertenezca a una clase en particular.La ecuacin bsica asume que estas probabilidades son iguales para todas las clases y que las bandas de entrada tiene distribuciones normales.La modificaci n Bayesiana permite asignar factores de peso para clases particulares, basado en conocimientos a priori.
Asignacin: Mxima probabilidad
Criterio bayesiano:p (x/A) p (x/B)
Problemas:Lento de c lculo
Ventajas:Considera dispersinPueden introducirse lmites
Clasificacin No-Supervisada
Clasificacin No-SupervisadaEs un proceso automatizado que le permite al usuario especificar algunos parmetros que se utilizan para revelar patrones estadsticos inherentes a los datos Estos patrones son conglomerados de pxeles con caracter sticas espectrales similares que ordenan los pxeles en categoras
Clasificacin No-Supervisada
La clasificacin no supervisada es un proceso iterativo que utiliza la distancia espectral para asignar pxeles a un n mero definido de categoras o clasesEn cada iteracin, las estadsticas se re-calculan, y las agrupaciones van cambiando, hasta que se cumplan ciertas condiciones definidas por el usuario
-
6Imagen Digital
El analista pide a la mquina que revise la imagen y extraiga un nmero de clusters espectralmente distintos
Clusters Espectralmente Distintos
Cluster 3
Cluster 5
Cluster 1
Cluster 6
Cluster 2
Cluster 4
Clusters Guardados
Cluster 3
Cluster 5
Cluster 1
Cluster 6
Cluster 2
Cluster 4
Imagen de salida clasificada
Desconocido
Pxel a ser Clasificado
El resultado de la Clasificacin no supervisada no es todava informacin hasta que
el analista determina la cobertura del suelo para cada uno de los clusters
??? Agua
??? Agua
??? Confera
??? Confera
??? Algarrobo
??? Algarrobo
???
???
???
???
???
???
Conif .
Algarr.
Agua
Mapa de cobertura Leyenda
Agua
Agua
Conferas
Conferas
Algarrobos
Algarrobos
Etiquetas
Es un simple proceso de reagrupar (recodificar) los clusters en clases de informacin significativa (leyenda).
El resultado es esencialmente idntico al de la clasificacin supervisada:
Ventajas:Saca la mxima ventaja de la variabilidad espectral de la imagen
Desventajas:Los clusters ms separables en el espacio espectral pueden no concordar con nuestra percepcin de las clases importantes en la escena
Clasificacin No Supervisada Otros criterios de asignacin
Clasificadores en rbolIncorporar el contexto espacial:
AntesDuranteDespus
Clasificadores borrososClasificacin orientada a objetosRedes neuronales
-
7Clasificacin en rbol
Establecer reglasde decisin:
Si rx > 0.3 y ry < 0.2 y altitud < 900 m
- Complejo de entrenar+ Independiente del tipo de variables
< 10%
Agua
Regado
MDE
Caducifolios
< 40% > 40%
> 30% Urbano Cereal(muy probable) (probable)
< 30% Urbano Cereal(probable) (muy probable)
ROJO
SWIR
IRC
> 10%
Verde
> 30% < 30%
< 800m > 800m
Fuente: Chuvieco(1996)
Suavizacin de resultados
Fuente: Chuvieco(1996)
Suavizacin de resultados
Fuente: Chuvieco(1996)
Suavizacin de resultados
original 3 x 3 7 x 7
Imagen de Rapel , Chile, 1998Fuente: Chuvieco(1996)
Productos de la clasificacin
Archivo:Correccin geomtricaTabla de colorInformacin auxiliar (leyenda, escala grfica, vectores, rtulos, etc.)
Inventario:Superficie ocupada por cada categora.Pureza de reas de entrenamiento
-
8Correccin geomtrica
Fuente: Chuvieco(1996)
Generacin tabla de color
Fuente: Chuvieco(1996)
Ejemplo de tabla de color
Clase Red Green Blue ColorAgua 0 0 255AzulRegado 0 255 0Verde claroSuelo 255 255 0AmarilloHerbceas 255 180 0NaranjaMatorral 150 75 0MarrnConferas 0 125 0Verde oscuroUrbano 255 0 0RojoResidencial 255 0 255Magenta
Fuente: Chuvieco(1996)
Suavizacin de resultados
Fuente: Chuvieco(1996)
Vectorizacin
Fuente: Chuvieco(1996)
Leyenda temtica
Fuente: Chuvieco(1996)
-
9Inclusin de elementos cartogrficosCarreteraRo
Arganda
Velilla
Rivas- UrbJa
ram
a
N-III
Fuente: Chuvieco(1996)
Resultado final
Fuente: Chuvieco(1996)
Inventario de la clasificacin
Fuente: Chuvieco(1996)
Validacin de resultados
vNecesidades:
Comprobar cumplimiento de objetivos
Probar la validez de una metodologa
v Inconvenientes:
Muestreo adicional: costo y tiempo
Dificultad de obtener una estimacin NO
sesgada
Consideraciones
vDisear el muestreo: cuntas?, dnde?
vRecolectar datos de referencia
v Comparar datos realidad y resultados (test
estadsticos y matr iz de confusin)
v Analizar los errores encontrados
-
10
Mtodos
v Comparar estadsticas
v Verificacin sobre las reas de
entrenamiento:
estimacin sesgada (muestras
dependientes)
v Indicar reas de verificacin y tipos de
muestreo
Fuentes de errorv Limitaciones del sensor
Leyenda, escala, resolucin
vMtodos de anlisis:
Tipo de interpretacin
v Estructura del rea de estudio:
Pxeles de borde (+resolucin espacial de las imgenes)
Mezcla de coberturas
v Proceso de verificacin
Criterios de toma de datos, sensores terrestres...
Pxelesde borde
Presencia de p xeles mixtos
Tipos de muestreo
Obtencin de la informacin
v En campo:
Costosa precisa
Calibrar bien el instrumental
homogeneizar criterios
Geo-referenciacin
v Fotografa area - cartografa:
Actualizacin - interpretacin
Matriz de confusin
Referencia
Clase 1 Clase 2 Clase 3 Clase n Total Exactitud Usuario
Error Comisin
Clase 1 X11 X1+ X 11/X1+ 1-X11/X 1+ Clase 2 X 22 X2+ X 22/X2+ 1-X22/X 2+
Clase 3 X33 X3+ X 33/X3+ 1-X33/X 3+ Clase n X nn Xn+ X nn/Xn+ 1-Xnn/X n+ Total X+1 X +2 X+3 X +n S Xi j
Exactitud Productor
X11/X+1 X22/X +2 X33/X+3 X nn/X+n
Cla
sifi
caci
n
Error Omisin
1-X11/X+1 1-X 22/X+2 1-X33/X+3 1-X nn/X+n
Bien clasificados
Errores de comisin
Errores de omisin
-
11
Medidas de fiabilidad
v Fiabilidad global:
v Fiabilidad por categor as:Usuario: Error comisin:
Productor: Error omisin:
ijnjni
iini
xx
F,1,1
,1==
=
SSS
=
i
iiip X
XF
+
=,
+
=i
iiiu X
XF ,
F = F z*ESnpqES =
i
iiiio X
XXE
+
+ -=,
+
+ -=i
iiiic X
XXE ,
Medidas de fiabilidad
vGrado de acuerdo (Kappa):
v Significacin:
iinii
iiniiiini
XXnXXXn
++=
++==
S-S-S
=,
2,,1k
22
12
21
kk ss
kk
+
-=z
ANALISIS CATEGORICO MULTIVARIANTE
INDICE KAPPA K
K = 0 -> es ajuste al azar
K = 1 -> ajuste plano entre realidad y mapa