Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em...
-
Upload
ricardo-alcantara-sanches -
Category
Documents
-
view
222 -
download
8
Transcript of Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em...
Processamento de dados multiespectraisOs dados de detecção remota podem ser usados, em particular, para obter: • Cartas temáticas (informação qualitativa);• Informação quantitativa sobre a área de estudo.
Cartas temáticas são cartas em que a superfície do terreno é distribuída por um número relativamente reduzido de classes. Cartas de ocupação do solo e as cartas de ocorrência de incêndios são exemplos de cartas temáticas. Em certos casos a produção de cartas temáticas pode ser feita de forma automática usando imagens de satélite e informação sobre as assinaturas espectrais das classes.
Informação quantitativa é informação sobre uma característica da superfície que varia continuamente (por exemplo, quantidade de vegetação).
Classificação: produção de cartas temáticas
Duas principais abordagens:
Hipótese do “pixel puro”. Postula-se que cada pixel de uma imagem pode ser associado a uma única classe.
Misturas espectrais. Considera-se que a assinatura de cada pixel é uma combinação das assinaturas de várias classes.
Legenda da carta temática
A legenda é o conjunto de classes a considerar, escolhidas em função do objectivo do processamento e em função da informação contida na imagem de satélite e outra informação adicional usada na classificação.
As classes devem ser “suficientemente distintas”, no espaço de representação considerado (informação multiespectral, etc).
Uma legenda hierárquica permite mais facilmente definir com precisão cada classe e ajustar o conjunto de classes para que a “condição” acima seja verificada.
Exemplo: classes de ocupação do solo
Possível legenda (hierárquica)
• Urbano (residencial, industrial, estradas,…)• Agricultura (culturas arvenses, pomares, pastos,..)• Floresta (resinosas, folhosas, misto,...)• Baldios (herbáceo, arbustivo, …)• Água (rios, lagos, barragens, águas costeiras)• Solo descoberto
Num problema de classificação, em que cada pixel é
associado a uma e só uma classe, dispõe-se de• Assinaturas espectrais dos pixels (imagem de satélite) e,
eventualmente, outro tipo de informação (dados auxiliares),
• Conjunto de k classes prédefinidas (legenda),• Subconjunto de pixels para os quais é conhecida a classe
a que está associado cada pixel (amostra de treino),e pretende-se associar cada pixel da imagem a uma das
classes por forma a minimizar um certo critério de erro dependente da amostra.
Imagem:Banda 1Banda 2,…
Amostra
Legenda
Classificação assistida
Fotointerpretação, recolha de informação no terreno, ...
Assinaturas espectraisExemplo: imagem SPOT-HRV
51 37 110 51 39 10174 59 92 83 71 10983 71 11490 84 116101 89 12760 44 10453 38 9051 35 9249 33 9550 32 10849 31 12248 31 116
Pixel 1
Pixel 2...
Banda 1 Banda 2...
Como o número radiométrico de cada pixel em cada banda pertence a {0,1,...,2b}, em que b é a resolução radiométrica, as assinaturas espectrais são elementos do produto cartesiano {0,1,...,2b}n, se houver n bandas.
Por exemplo, as assinaturas espectrais para as 3 bandas SPOT-HRV são elementos de {0,1,...,255}3 e as as assinaturas espectrais para as 7 bandas Landsat-TM são elementos de {0,1,...,255}7 .
Assinaturas espectrais
Assinaturas espectrais médias de quatro classes de ocupação do solo
Imagens SPOT-HRV: 3 bandas
urbano
água
floresta
agricultura
Representação das classes no espaço das assinaturas espectrais
Se cada classe tivesse uma assinatura espectral única, então seria representada por um ponto em Rn. No entanto, uma classe é tipicamente composta por pixels com assinaturas distintas. Por isso, cada classe tem uma certa localização e uma certa dispersão no espaço das assinaturas espectrais.
Os indicadores de localização e de dispersão mais usados são, respectivamente, o vector média e matriz de variâncias-covariâncias.
Vector média e matriz de variância-covariânciaConsidere-se uma matriz Anxm
Seja xj a j-ésima coluna de A, com j=1,...,m
O vector média é um vector com n componentes, dado por µ=(x1+...+xm)/m
(xj-µ) é o vector desvio entre a j-ésima coluna de A e o vector média
A matriz de variância-covariância é uma matriz simétrica com n linhas e n colunas e define-se como
S=(1/m) Σj=1,..,m(xj-µ) (xj-µ)T
Regra de decisão baseada no vector média e nas matrizes de variância-covariância das classes
Dado uma assinatura espectral x, e um conjunto de classes com médias µ1,…, µk e com matrizes de variância-covariância Σ1,..., Σk, x deve ser associado à classe mais próxima.
Para definir esta regra é preciso escolher, para todo o i, uma medida de distância entre um vector x e a i-ésima classe caracterizada por (µi, Σi)
Algumas distâncias entre objectos e classes
Distância de x à média da i-ésima classe (é o quadrado da distância euclideana entre x e µi):
d2(x,i)=(x-µi)T (x-µi).
Distância de Mahalanobis de x à i-ésima classe:
D2(x,i) = (x-µi)T Σi-1 (x-µi).
A distância de Mahalanobis é uma generalização da distância euclideana e é preferível para classificação se as matrizes de variância-covariância das classes são conhecidas.
urbano
água
floresta
agricultura
Assinatura espectral de um novo pixel a classificar: a que classe deve ser associado?
Um pixel com assinatura espectral (30,50) nas bandas 2 e 3 está a uma distância de Mahalanobis de 23.73 da classe “urbano” e a uma distância de 60.18 da classe “água”
urbano
água
média
média
Pomares: 6.4, 5.5, 13
Variâncias nas bandas: Residential: 45, 38, 70
Culturas: 23, 36, 42
Distância às médias Distância normalizada
Estimar médias e matrizes de variância-covariância
Dado que os parâmetros de localização e dispersão das classes não são conhecidos, é necessário estimá-los recorrendo a uma amostra (de treino). Essas estimativas são obtidas do seguinte modo:
1. Delinear um esquema de amostragem de pixels na imagem para definir amostras: subconjuntos de pixels de cada classe
2. Identificar a classe a que pertence cada pixel (usando fotografia aérea, ou trabalho de campo, etc);
3. A partir da amostra de treino, calcular estimativas do vector média e da matriz de variância-covariância para cada classe (por exemplo, usando um estimador de máxima verosimilhança).
Esquemas de amostragem
Esquemas mais usados:• aleatório simples: as classes menos frequentes no terreno
podem não ser bem representadas; a imprecisão localização das parcelas no terreno limita a aplicação.
• sistemático: erros podem ser introduzidos se os dados tiverem um padrão espacial correlacionado com o esquema de amostragem.
• aleatório estratificado: baseia-se numa pré-classificação da área para definir estratos, mas garante a representação de todas as classes.
• polígonos amostrais: podem ser usados nos esquemas acima. O interesse é limitado pela correlação espacial.
Efeito da precisão posicional na obtenção de informação amostral
realidade mapa
Deslocamento de 1 pixel na posição
Exemplo: produção de carta temática com dados Landsat
Imagem Landsat-TM (1996): foram usadas as bandas 1,2,3,4,5 e 7
Concelho de Castanheira-de-Pera Área: 67 Km2, Altitudes entre 400 e 1200 metrosDeclives entre 0 e 40 graus7 classes de ocupação de solo: urbano, agricultura, folhosas,
resinosas, floresta mista, ocupação arbustiva, zonas descobertas
Ocupação real do solo(7 classes)
Estimar a localização e dispersão de classes no espaço das assinaturas espectrais
Cada amostra origina uma estimativa diferente. Quanto maior for a amostra (para um delineamento amostral semelhante), mais limitado é o erro cometido.
Exemplo: distância de Mahalanobis entre uma assinatura espectral de um pixel e a classe agricultura, considerando uma amostra dessa classe entre 10 e 200 pixels
Distância máx
Distância média
Distância mínima
20 amostras com 200 pixels
Resultados para 20 amostras diferentes com 10 pixels
Densidades de amostragem diferentes podem conduzir a resultados diferentes.Exemplo: distância da mesma assinatura espectral a duas classes.
Dimensão da amostra
Classe “urbano”Classe “floresta”
Dimensão da amostra
Dimensão da amostra Número e dimensão dos polígonos amostrais
O número de pixels da amostra deve crescer com o número de variáveis (bandas espectrais,...), dado que o número de parâmetros a calcular (em particular, dimensão da matriz de variância covariância) depende do número de variáveis.
Alguns autores recomendam dimensões de amostra de pelo menos 10p, 30p, ou 100p pixels por classe, em que p é o número de variáveis.
No caso de serem usados polígonos amostrais, não é vantajoso em geral usar polígonos com um número superior a 10 ou mesmo 25 pixels (Congalton, 1998).
Esquema amostral aleatório com polígonos
Número e dimensão de polígonos: exemplo
num.poli
mea
n of
pre
cisa
o
0.55
0.56
0.57
0.58
0.59
0.60
25 50 100 150
dim.poli
124
A precisão da classificação aumenta significativamente com o número de polígonos
Classificação: regra de afectação baseada na distância de Mahalanobis
5 6 7 8 9 10 11
1314
1516
1718
1 1
1
1
1
1
1
1
1
1
1
1
1
1
11
1
1
1
11
1
12
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
222
2
2
2
2 2
2
2
2
2
3
33
333
33
3
3
3
3
3
33
3
3
3
3
3
3
3
33
4
4
4
4
4
4
4
444
44
4
44
4
44
4
4
4
4
4
5
5
5
5 55
5
5 5
5
5
5
5
5
5
55
55
5
5
55
5
6
6
6
6
6
6
6
6
6
6
66
6
6
66
6
6
6
6
6
6
6
6
6
6
6
66
7
7
7
7
7
7
7
7
7
7
7
7
77
7
7
77 77
7
urbanoagricultura
folhosas
resinosas
misto
arbustivo
descoberto
UrbanoAgricultura
Folhosas
Misto
Solo descobertoResinosas Arbustivo
Representação no plano discriminante principal: subespaço de R6
Outros classificadores: redes neuronais, árvores de classificação, vizinhos mais próximos,...
|x7<632.5
x6<30.5
x4<110.5
x7<573.5
x7<550.5
x7<490.5
x7<459.5 x4<70.5
x10<0.875
x3<45
x7<498
x7<468
x6<69.5
x6<22.5
x8<36
x7<923.5
x5<91.5
x6<33.5
5 4 4 3
5
3
2
2 1
2 1 1
7
3 4
6
6 6
7
Exemplo: árvore de classificação
Comparação de métodos de classificação: exemplo0.
20.
40.
60.
8
prec
isao
lda qda nnet tree knn maioria multi
metodoBaseado na distância de Mahalanobis
A variação para cada método corresponde a diferentes densidades e esquemas de amostragem
Métodos de classificação contextuais
Dado que a informação geográfica é espacialmente correlacionada, a classificação automática de imagens pode ser melhorada se se considerar o contexto espacial. Dessa forma, a classificação de um pixel será dependente da classificação dos pixels adjacentes.
Muitos métodos de classificação tirando partido do contexto espacial foram propostos: (1) na fase de préprocessamento; (2) integrando outras variáveis na classificação; (3) “filtrando” a imagem após a classificação.
Uma forma simples de incorporar informação contextual num método de classificação é simplesmente considerar que as variáveis que descrevem um pixel correspondem às assinaturas espectrais desse pixel e dos pixels vizinhos (janelas 3x3, 5x5,...), e proceder como anteriormente.
Filtros em pós-processamento
Após a classificação, a aplicação de um filtro de moda à carta temática obtida reduz a variabilidade local da classificação.
O resultado depende da dimensão do filtro (número de linhas e colunas)
Exemplo: aplicação de um filtro de moda 3x3
Carta não filtrada Carta filtrada
Avaliação da precisão de uma carta temática
Informação espectral (imagem de satélite)
Dados auxiliares: DTM, pontos de controle,...
Pré-processamento Legenda
Imagem georeferenciada e corrigida
Trabalho de campoFotografia aérea
Amostra
treino teste
Classificação
Carta temáticaAvaliação da
precisão
(Pós-processamento)
Avaliação da precisão da classificação com uma matriz de erro
nnet primeiro nível (flor. é a classe agrupada) 5-nn segundo nível (classificação de flor.)
urb. agri. flor. desc. class. folh. resi. misto arbu. class. urb. 9.4 1.9 0.3 0.6 0.77 folh. 27 2.3 13.2 5.1 0.567 agri. 3.6 17.7 3.3 0.5 0.705 resi. 3.6 26.8 5.4 7.8 0.615 flor. 1.2 6.2 191.1 5.4 0.937 mist. 14.1 4.5 27.2 2.7 0.561 desc. 0 0 2.7 5.5 0.671 arbu. 2.6 4.4 3.2 44.6 0.814 map. 0.662 0.68 0.968 0.458 0.897 map
a 0.571 0.705 0.555 0.741 0.646
Precisão do “produtor”: proporção dos pixels da classe bem classificados
Precisão do “utilizador”: proporção dos pixels na carta temática que pertencem à classe
Precisão global