Classificazione e Data Mining di immagini satellitari · Classificazione e Data Mining di immagini...

26
Classificazione e Data Mining di immagini satellitari EnginSoft SpA Manolo Venturin, Filippo Furlan Bologna, 12 aprile 2017

Transcript of Classificazione e Data Mining di immagini satellitari · Classificazione e Data Mining di immagini...

Classificazione e Data Mining

di immagini satellitari

EnginSoft SpA

Manolo Venturin, Filippo Furlan

Bologna, 12 aprile 2017

Mesagne

Trento

Padova

Bergamo

Torino

Firenze

Competence Center

Fatigue and durability

Crash and fast

dynamics

Fluid Dynamics

Mechanics

Tolerance Analysis

Enviromental and

Vibroacustics

High Perfomance Computing

Multibody

Optimitation

Applied mathematics

EnginSoft

CONSULENZA

4.000

TECNOLOGIE

1.500+

FORMAZIONE

130+

RICERCA

60+

Esempi di attività di Data Mining svolte

Ottimizzazione delle prestazioni di un bruciatore in funzione dei

parametri di input. Analisi di sensitività. Determinazione valori ottimali.

Azienda: Worgas Bruciatori S.r.l

Analisi dati sperimentali di una colata con l’obiettivo di ridurre il numero

di pezzi affetti da difettosità eccessiva.

Azienda: Verona Steel

Strumenti utilizzati:

SOM, Neural network, RSM, …

Data Mining su immagini satellitari

Immagini da: http://www.worgas.it/Products/Premix-Burners.html e

Landsat 8

Lancio: 11 Febbraio 2013

Fornisce immagini a moderata

risoluzione della superficie terrestre e

delle regioni polari (dai 15 metri fino

a 100 metri)

Opera nel visibile, vicino infrarosso, infrarosso a onda breve e spettri

infrarossi termici

Cattura più di 700 scene al giorno (con un ciclo di ripetizioni di 16

giorni e dimensione 170 km x 183 km)

Ha dei sensori OLI (Operational Land Imager) e TIRS (Thermal

Infrared Sensor) per una migliore caratterizzazione del suolo

Immagini da: https://landsat.gsfc.nasa.gov/landsat-data-continuity-mission/ e https://lta.cr.usgs.gov/L8

Landsat 8

La banda è la misura della

riflessione/emissione di radiazione

in un determinato di lunghezza

d’onda (λ)

Maggiori il numero di bande

disponibili

Maggiori possibilità di riconoscere

differenze nella riflettanza

Possibilità di distinguere

maggiori aree diverse

Bands Wavelength

(micrometers)

Resolution

(meters)

Band 1 - Coastal aerosol 0.43 - 0.45 30

Band 2 - Blue 0.45 - 0.51 30

Band 3 - Green 0.53 - 0.59 30

Band 4 - Red 0.64 - 0.67 30

Band 5 - Near Infrared

(NIR) 0.85 - 0.88 30

Band 6 - SWIR 1 1.57 - 1.65 30

Band 7 - SWIR 2 2.11 - 2.29 30

Band 8 - Panchromatic 0.50 - 0.68 15

Band 9 - Cirrus 1.36 - 1.38 30

Band 10 - Thermal

Infrared (TIRS) 1 10.60 - 11.19 100 * (30)

Band 11 - Thermal

Infrared (TIRS) 2 11.50 - 12.51 100 * (30)

Ba

nd

e u

tiliz

za

te

Immagine satellitare da classificare (campione)

Combinazioni rilevanti delle bande a seconda degli obiettivi

Bande

Obiettivi 1 2 3 4 5 6 7 Combinazioni delle bande e Condizioni

Acqua

x x OLI3/OLI6 > 1

x x OLI3/OLI5 > 1

x x x x x x Indice = (OLI2+OLI3+OLI4) /

(OLI5+OLI6+OLI7)

x x x L’acqua appare scura

Area costiera x x x

Vegetazione

x x (OLI5-OLI4) / (OLI5-OLI4) > 0

x x x Colore falsato nell’infrarosso

x x x Condizioni della vegetazione

Neve e ghiaccio

x x Indice = OLI5/OLI6

x x Indice = OLI4/OLI6

x x x

Suolo x x x

x x x

Terreno con sali e sodio x x x

x x x (OLI4-OLI5) / (OLI3-OLI5)

Composti ferrosi x x x come l’ilmenite

Differenze di umidità del terreno x x x Combinazione migliore

x x x

Rilevamento dei cambiamenti, terreni

disturbati, stress della vegetazione

x x x

x x x

Acqua (Segmentazione)

Indice acqua:

rapporto banda3 / banda6

Segmentazione

Acqua

Terra

Combinazioni rilevanti delle bande a seconda degli obiettivi

Bande

Obiettivi 1 2 3 4 5 6 7 Combinazioni delle bande e Condizioni

Acqua

x x OLI3/OLI6 > 1

x x OLI3/OLI5 > 1

x x x x x x Indice = (OLI2+OLI3+OLI4) /

(OLI5+OLI6+OLI7)

x x x L’acqua appare scura

Area costiera x x x

Vegetazione

x x (OLI5-OLI4) / (OLI5-OLI4) > 0

x x x Colore falsato nell’infrarosso

x x x Condizioni della vegetazione

Neve e ghiaccio

x x Indice = OLI5/OLI6

x x Indice = OLI4/OLI6

x x x

Suolo x x x

x x x

Terreno con sali e sodio x x x

x x x (OLI4-OLI5) / (OLI3-OLI5)

Composti ferrosi x x x come l’ilmenite

Differenze di umidità del terreno x x x Combinazione migliore

x x x

Rilevamento dei cambiamenti, terreni

disturbati, stress della vegetazione

x x x

x x x

Combinazione bande 4,5,7

Segmentazione supervisionata

Obiettivo: separare le zone urbane dalla vegetazione

Aree di training

• Aree verdi

• Aree urbane

Feature extraction

• Sistema colore (HSV)

• Media

• Varianza

• …

Strategia di classificazione

• Random Forest

• …

Definizione delle aree di training

Area verde Area urbana

Maschera risultante dalla segmentazione

Aree verdi

Aree urbanizzate

Un approccio non supervisionato

Classificazione delle aree senza l’intervento dell’utente (3 classi)

Un approccio non supervisionato

Classificazione delle aree senza l’intervento dell’utente (4 classi)

Analisi delle serie storiche

L’analisi delle serie storiche riveste un ruolo di primaria importanza

nell’ambito dello studio dei rischi naturali e ambientali in quanto

attraverso le tecniche di analisi che mette a disposizione è possibile

ricavare informazioni utili sullo stato ambientale e sulla sua evoluzione

NDVI è direttamente legato alla capacità di fotosintesi e rappresenta un

indice dello stato di vegetazione

NDVI - Normalized Difference Vegetation Index

NIR = riflettanza spettrale nel vicino

infrarosso

VIS = riflettanza spettrale nel rosso

visibile

−1 ≤ NDVI ≤ 1

𝑁𝐷𝑉𝐼 = 𝑁𝐼𝑅 − 𝑉𝐼𝑆

𝑁𝐼𝑅 + 𝑉𝐼𝑆

Immagine da: https://earthobservatory.nasa.gov/Features/MeasuringVegetation/measuring_vegetation_2.php

NDVI di Bari

NDVI di Bari

Esempio di una serie NDVI

a = Tempo di inizio della

stagione

b =Tempo di fine della

stagione

c = Lunghezza della stagione

Classificazione della vegetazione

Next step

Keyword: definizione delle feature

L’algoritmo presentato finora ha performance ottime perché è il risultato

di uno studio preliminare approfondito sulle feature da estrarre

In ottica futura stiamo lavorando per rendere meno dispendiosa la fase

preliminare, sostituendo lo studio delle feature con il training di un

modello CNN (Convolutional Neural Network) su una mole

considerevole di dati

Immagine da: https://research.googleblog.com/2016/03/train-your-own-image-classifier-with.html

Conclusioni

La segmentazione delle immagini

con l’algoritmo utilizzato è

fortemente dipendente dalla scelta

delle feature

Il Deep Learning può essere

una alternativa quando le studio

delle feature non è una scelta

percorribile e invece si dispone di

una grossa quantità di dati

Queste tecniche sono ormai

consolidate e applicate a vari settori

industriali

Data

Mining

Ingegneria

SW

custom Deep

Learning

Per ulteriori informazioni

Manolo Venturin [email protected]

Filippo Furlan [email protected]

Tel. +39 049 7705311

Cercateci

nell’area

Networking !