WYKORZYSTANIE SIECI NEURONOWYCH W PROCESACH...

Archiwum Fotogrametrii, Kartografii i Teledetekcji, Vol. 18, 2008

ISBN 978-83-61576-08-2

409

WYKORZYSTANIE SIECI NEURONOWYCH W PROCESACH

FOTOGRAMETRYCZNYCH

APPLICATION OF NEURAL NETWORKS TO PHOTOGRAMMETRIC

PROCESSES

S awomir Mikrut1, Zbigniew Mikrut2

1 Katedra Geoinformacji, Fotogrametrii i Teledetekcji rodowiska, AGH w Krakowie 2 Katedra Automatyki, AGH w Krakowie

S OWA KLUCZOWE: sztuczne sieci neuronowe, spasowanie obrazów, fotogrametria cyfrowa

STRESZCZENIE: W niniejszym artykule poruszono problem wykorzystania sztucznych sieci

neuronowych (SSN) w geoinformatyce obrazowej, ze szczególnym uwzgl dnieniem procesów

fotogrametrycznych. Przedstawiono wyniki przegl du literatury wiatowej oraz zaprezentowano

rezultaty bada prowadzonych w ramach projektu dotycz cego u ycia sieci do spasowania

fotogrametrycznych zdj lotniczych. W oparciu o literatur , przeanalizowano wyniki prac

wykorzystuj cych sieci neuronowe do: klasyfikacji obrazów wielospektralnych, wydobywania

cech, kalibracji kamer oraz spasowania obrazów. Zaprezentowano równie wyniki w asnych

eksperymentów, bazuj cych na idei wykorzystania sieci opieraj cej si na wyborze specjalnej

reprezentacji, która nast pnie jest wykorzystywana do spasowania obrazów fotogrametrycznych

dla dwóch wybranych typów terenu. W badaniach wykorzystano sieci impulsuj ce ICM

(Intersecting Cortical Model), b d ce jedn z wersji sieci PCNN (Pulse Coupled Neural Network),

przy pomocy których wygenerowano tzw. podpisy obrazów (signatures), czyli

kilkudziesi cioelementowe wektory, opisuj ce struktur fragmentu obrazu. Wyniki bada

cz ciowo potwierdzaj s uszno przyj tych za o e , mimo wyst puj cych problemów

zwi zanych ze specyfik obrazów fotogrametrycznych.

1. WST P

Rozwój sztucznych sieci neuronowych (SSN) zosta zapocz tkowany w latach

czterdziestych badaniami nad matematycznym opisem komórki nerwowej oraz

powi zaniem go z przetwarzaniem informacji przez komórk . Za pocz tek przyjmuje si

rok 1943 zwi zany z opracowaniem matematycznego modelu sztucznego neuronu przez

MsCullocha i Pittsa (Korbicz et al, 1994). Jednak intensywne badania nad SSN

przypad y na lata osiemdziesi te z racji rozpowszechniania si komputerów i u atwienia

procesów obliczeniowych, towarzysz cych sieciom. Istotnym osi gni ciem by o

opracowanie przez Hopfielda w 1982 r. sieci ze sprz eniem zwrotnym, któr

wykorzystano do rozwi zywania zada optymalizacyjnych (np. problem komiwoja era)

oraz odtwarzania obrazów z ich fragmentów.

SSN nie omin y równie zastosowa w geoinformatyce obrazowej. Koniec lat

osiemdziesi tych i pocz tek dziewi dziesi tych to pierwsze zastosowania sieci

neuronowych w tej dziedzinie nauk. W niniejszym opracowaniu autorzy skupili si na

Wykorzystanie sieci neuronowych w procesach fotogrametrycznych

410

przyk adach wykorzystania sieci w geoinformatyce obrazowej (rozdzia 2),

ze szczególnym uwzgl dnieniem zastosowa fotogrametrycznych. W rozdzia ach 3 i 4

zaprezentowano dokonania autorów w temacie pasowania obrazów zdj lotniczych

przy pomocy sygnatur.

2. SIECI NEURONOWE W FOTOGRAMETRII – HISTORIA I DZIE

DZISIEJSZY

Zarys technik sieci neuronowych mo na znale w literaturze (Tadeusiewicz, 1993;

Tadeusiewicz et al., 2007). Autorzy niniejszego artyku u równie dokonali pewnych

analiz w poprzednich publikacjach (Mikrut et al., 2007; Mikrut, 2007).

Przyk ady wykorzystania sztucznych sieci neuronowych w zadaniach zwi zanych

z geoinformatyk obrazow maj ju prawie dwudziestoletni histori . Pierwszymi

zastosowaniami SSN by o wykorzystanie ich do klasyfikacji obrazów

wielospektralnych. Pierwsze wzmianki o próbach klasyfikowania obrazów pochodz

z pocz tku lat 90-tych, kiedy to zacz to klasyfikowa zobrazowania satelity LANDSAT

TM (Bishof el al., 1992), nast pnie SPOT (Dreyer, 1993). Sieci wykorzystano równie

do opracowania danych radarowych (Hara, 1994). Badania te potwierdzi y mo liwo ci

skutecznego dzia ania SSN jako jednej z metod klasyfikacji obrazów. Kolejne

zastosowania to wydobywanie cech (ang. feature extraction), kalibracja kamer,

spasowanie obrazów (ang. matching).

2.1. Pojawienie si sieci neuronowych w tematyce kongresów ISPRS

Analizuj c histori kongresów Mi dzynarodowego Towarzystwa Fotogrametrii

i Teledetekcji (ISPRS) mo na zauwa y wzrost liczy publikacji obejmuj cych

t tematyk . Ilo artyku ów, zawieraj cych s owa „neural network” w tytule, wzrasta a

z kongresu na kongres. Tematyka ta przedstawiona by a ju w o miu artyku ach w 1996

w Wiedniu, tyle samo by o prezentowanych w Amsterdamie (2000 r.), jedena cie

w Istambule (2004 r.) oraz osiemna cie w Pekinie (2008 r.). Wiele by o równie

artyku ów dotycz cych problematyki wykorzystania sieci neuronowych, nie zawartych

jednak w tytule. Jak wspomniano wcze niej, pocz tki to zastosowanie SSN

do klasyfikacji obrazów wielospektralnych. Mia o to odzwierciedlenie równie

w publikacjach kongresowych. Przyk adowe opracowania mo na znale w literaturze

(Barsi, 1996; Bock ,1996; Chen et al, 1996; Barsi, 2000; Kamiya, 2000; Aria et al.,

2004; Cetin et al., 2004; Zhou et al., 2008).

2.2. Sztuczne sieci neuronowe w zagadnieniach fotogrametrycznych

SSN zacz to równie stosowa do rozwi zywania typowych problemów

fotogrametrycznych. Poni ej dokonano próby tematycznego ich usystematyzowania.

Badania literaturowe podkre li y potrzeb dokonania takiej analizy, z racji coraz

powszechniejszego ich wykorzystania, a tak e skuteczno ci dzia ania.

S awomir Mikrut, Zbigniew Mikrut

411

2.2.1. Wykorzystanie SSN do identyfikacji wybranych obiektów

Wykorzystanie sieci typu FFN (feed-forward network) zastosowano do operacji na

ogó wykonywanej manualnie przez operatora stacji fotogrametrycznej tj. do identy-

fikacji punktów sygnalizowanych (Kepuska et al., 1991). W tym celu zastosowano sie

typu FFN-BP (back-propagation) do rozpoznawania obiektów na zeskanowanych

zdj ciach lotniczych. Dane przygotowane zosta y z postaci obrazów o ró nej orientacji,

tle, skali i z wprowadzonymi pewnymi zniekszta ceniami geometrycznymi. Aby

wyeliminowa nadmiarowo i zminimalizowa rozmiar danych testowych

przygotowano odpowiedni schemat treningowy. Po dwóch iteracjach treningu uzyskano

zadawalaj ce rezultaty: model FFN-BP uzyska rozpoznanie na poziomie 85%

punktów, znajduj cych si na 34 obrazach. Zwa ywszy na rok przeprowadzonych testów

(lata 90-te, pocz tki stosowania sieci), nale y podkre li osi gni cie stosunkowo

dobrych rezultatów.

2.2.2. SSN a wydobywanie cech z obrazu (feature extraction)

SSN zacz to równie wykorzystywa do wydobywania cech (feature extraction).

W badaniach dokonano porównania metod wydobywania cech pomi dzy transformacj

Karhunen-Löwe (K-L) a SOM (Self Organizing Maps) Kohonena (Törma, 96).

Uzyskane w trakcie bada ró nice pomi dzy metodami by y bardzo ma e. W niektórych

przypadkach b dy metody K-L by y mniejsze, jednak proces dzia aj cy przy u yciu

SOM by szybszy. Ró nice pomi dzy metodami powstawa y wówczas, gdy liczba

próbek na klas by a ma a, co jest typowe dla sieci, tzn. przy zbyt ma ej liczbie próbek

sieci wykazuj ma skuteczno .

Równie przy pomocy SSN opracowano ekstrakcj w z ów drogowych z obrazów

cyfrowych (Barsi et al., 2002). Neuronowy operator, oparty o sie typu feed-forward,

przeszukuje oknem czarno-bia e obrazy w redniej rozdzielczo ci decyduj c czy

skrzy owanie zawiera 3 czy 4 odnogi. Najlepsze rezultaty otrzymano dla sieci

trójwarstwowej. Do uczenia wykorzystano warstw wektorow dróg.

Kilka innych przyk adów u ycia SSN do wydobywania cech z obrazu zaprezentowano

na kongresie ISPRS w Pekinie (Ahadzadeh et al., 2008; Mokhtarzade et al., 2008).

2.2.3. Kalibracja kamer przy pomocy SSN

Procedur kalibracji kamer przy wykorzystaniu sieci back-propagation (BP)

opisano w publikacji (Mendonca et al., 2002). Dzi ki jej zastosowaniu nie musimy

posiada danych takich jak sta a kamery czy dystorsja. Sieci s skuteczne

w rozwi zywaniu nieliniowych zagadnie i mog „nauczy ” si odpowiednich relacji

pomi dzy wspó rz dnymi obrazowymi a wspó rz dnymi przedmiotowymi (obiektu), bez

potrzeby okre lania konkretnego modelu matematycznego. W opisanej przez autora

metodyce dokonano porównania wyznaczonych wspó rz dnych pola testowego (520

punktów) metod najmniejszych kwadratów oraz SSN. Dok adno ci uzyskane przy

pomocy obu metod by y porównywalne. Wed ug autora zaletami metody neuronowej

s : 1) niekonieczna znajomo modelu matematycznego, 2) nie wymagana jest równie

znajomo przybli onych (wej ciowych) parametrów kalibracji, 3) metodyka mo e by

wykorzystana dla ró nego typu kamer, 4) mo e by u yta dla kilku kamer o ró nych


412

elementach orientacji, 5) SSN mog rozpozna specyficzne u o enia kamer, co ma

znaczenie przy dynamicznych systemach pracuj cych w czasie rzeczywistym.

2.2.4. Spasowanie obrazów (matching)

SSN znalaz y zastosowanie w spasowaniu obrazów w systemach stereowizyjnych

(Wang et al., 1999). Wykorzystano je do okre lania pozycji dowolnego punktu

w przestrzeni 3D w oparciu o zdj cia naziemne wykonane z dwóch kamer. U yto dwóch

typów sieci: VC (vitality conservation) oraz BP (back-propagation). Pierwsza sie , jako

wektora ucz cego, u ywa wybranych parametrów (jasno , zmienno , orientacj , x, y)

dla ka dego piksela oraz dzieli obraz wej ciowy na kilka klastrów, a rezultaty s

wykorzystane przez drug sie (BP), celem osi gni cia dok adnego dopasowania.

Po treningu sie BP jest wykorzystana do generowania tzw. mapy dysparycji.

W procesie dopasowania, aby zredukowa ewentualne b dy oraz ograniczenia obszaru

przeszukiwania, korzysta si z dodatkowych informacji takich jak linie epipolarne,

uporz dkowanie, geometria i ci g o .

Przyk adem podobnego zastosowania SSN, ale z innym rozwi zaniem (model

sieci) jest stereowizyjny system zbudowany przez zespó laboratorium w giersko-

japo skiego (Resko et al., 2003). Stereowizja jest realizowana poprzez biologicznie

zainspirowan , pi ciowarstwow , sztuczn sie neuronow , o prostych komponentach.

Zadaniem sieci jest porównywanie symbolicznych cech (symbolic feature) w obr bie

obydwu obrazów, celem wyznaczenia kierunków obu kamer (okre lenia ich orientacji).

System funkcjonuj cy w oparciu o ten model dzia a w czasie rzeczywistym.

Wykorzystanie sieci neuronowych oraz zale no ci fotogrametrycznych

(komplanarno , wspó czynnik korelacji) do spasowania wieloobrazowego (multi-image

matching) zosta o zaprezentowane podczas kongresu ISPRS w Pekinie w roku 2008

(Elaksher, 2008). Autor zaprezentowa metodyk u ycia sieci w odniesieniu do zdj

naziemnych przedstawiaj cych ratusz w Zurichu, udost pnianych przez ISPRS jako

materia testowy. Wykorzystuj c dowoln liczb zdj , proces startuje od orientacji

wzajemnej na podstawie warunku komplanarno ci pomi dzy wszystkim parami zdj .

Dla ka dej pary otocze punktów liczony jest wspó czynnik korelacji dla lokalnych

jasno ci obrazu. Do okre lania prawid owego dopasowania u yto sie typu feed-

forward. Uzyskano bardzo zadowalaj ce rezultaty. Wspó czynnik detekcji (ang.

detection rate) na poziomie 95% - 98% oraz wspó czynnik niedopasowania (ang. false

alarm rate) od 4% do 7%.

Przedstawione pozycje literaturowe odnosz ce si do spasowania obrazów

obejmuj badania prowadzone na obrazach zdj naziemnych. Jest to zagadnienie o tyle

nieskomplikowane, e obrazy z kamer naziemnych charakteryzuj stosunkowo du ym

podobie stwem (z regu y robione s z krótkiej bazy). Problem staje si bardziej z o ony

w sytuacji, gdy mamy do czynienia ze zdj ciami lotniczymi. Rozdrobnienie informacji

oraz du a paralaksa na przyk ad w przypadku wysokich budynków znacznie komplikuje

zagadnienie. Autorzy niniejszego artyku u dokonali próby rozwini cia zagadnienia

w oparciu o w asne do wiadczenia prezentowane w publikacji (Mikrut et al., 2007).


413

Rys. 1. Dopasowywanie fragmentów obrazów przy u yciu sygnatur.

Kolorem niebieskim oznaczono ci g przekszta ce prowadz cy do najlepszego

wyniku

44 pary obrazów

skala 1:2 skala 1:4

ca y fragment podzia na 4 podzia na 6

0 50 100 150 200 250 300

ró ne d ugo cscalanie 6 wyników:

suma wszystkich (6)

bez 1 najgorszego

bez 2 najgorszych

scalanie dynamiczne


414

3. EKSPERYMENTY Z WYKORZYSTANIEM SSN W ODNIESIENIU DO

SPASOWANIA ZDJ LOTNICZYCH

Koncepcj bada nad wykorzystaniem SSN do spasowania zdj lotniczych mo na

znale w publikacji (Mikrut et al., 2007). Autorzy kontynuowali badania nad

wykorzystaniem sygnatur generowanych przez impulsuj ca sie neuronow (Mikrut,

2007). Korzystano z bazy danych opisanej we wspomnianej publikacji. Z bazy wybrano

podzbiór 44 obrazów w stopniach szaro ci (sk adowe R, G i B zosta y scalone).

Na kolejnym zdj ciu lotniczym manualnie zlokalizowano te obszary i po odpowiednim

obramowaniu zapisano je w celu przeprowadzenia testów spasowania. Nale y

podkre li , e w omawianych badaniach sprawdzano mo liwo ci dopasowywania

reprezentacji podobrazów, czyli obliczano sygnatury podobrazu ze zdj cia

chronologicznie pierwszego, nast pnie obliczano sygnatury wszystkich podobrazów

wchodz cych w sk ad fragmentu drugiego (kolejnego) zdj cia lotniczego i te wektory

porównywano. Samo porównywanie wektorów realizowano przy u yciu sumy modu ów

ró nic poszczególnych elementów (patrz Dodatek). Schemat eksperymentów

przedstawiono na rysunku 1.

Pary obrazów, na które sk ada y si : fragment obrazu o rozmiarach 240x160 pikseli

i odpowiadaj cy mu obszar z kolejnego zdj cia, obramowany dooko a pasem

o szeroko ci 150 pikseli, zmniejszano dwu i czterokrotnie. Nast pnie, przy pomocy sieci

impulsuj cej ICM, generowano 300. elementowe sygnatury dla ca ego fragmentu obrazu

oraz dla jego czterech lub sze ciu podobrazów, dla ka dego podobrazu osobno.

Po drugim zdj ciu przesuwano okno odpowiadaj ce rozmiarom fragmentu poprzedniego

obrazu. Po ka dym jednopikselowym przesuni ciu obliczano sygnatury w wariantach

podzia u na podobrazy, opisanych wy ej. Ca y ten proces schematycznie przedstawiono

na rysunku 1 w górnych trzech rz dach. Formalny opis algorytmu zamieszczono

w Dodatku. W celu zachowania przejrzysto ci rysunku nie umieszczono na nim strza ek

pokazuj cych zrealizowane kombinacje przetwarzania. Strza ki powinny obrazowa

po czenia „ka dy z ka dym”, id ce od bloków górnych do dolnych.

Wst pna analiza rezultatów dopasowa pozwoli a na wyznaczenie sekwencji

przekszta ce , prowadz cych do najlepszych wyników. Kolejno ta zosta a zaznaczona

na rysunku 1 strza kami blokowymi. Przekszta cenia prowadz ce do najlepszych

wyników, to operowanie na obrazach czterokrotnie zmniejszonych, dla których

dopasowywano fragmenty powsta e z podzia u obrazu na 6 cz ci. Na tej podstawie

zrealizowano kolejny etap bada , przedstawiony na rysunku 1 w dolnym (ostatnim)

rz dzie.

Fakt posiadania 300 elementowych sygnatur wykorzystano do porównywania

wektorów sygnatur o ró nych d ugo ciach i ró nych po o eniach. Jak pokazano

na rysunku 1, do porówna u ywano sygnatur 25, 50 i 100 elementowych pobieranych

od umownego momentu startu oraz fragmentów sygnatur od pozycji 100 do 200 oraz

od pozycji 100 do 300. Podzia dopasowywanego fragmentu obrazu na 4 lub 6

podobrazów by zainspirowany dwoma czynnikami. Pierwszym z nich by fakt

uzyskiwania lepszych wyników dopasowywania sygnatur dla mniejszych wycinków

obrazu. Drugim czynnikiem by a potrzeba ewentualnego uwzgl dnienia wyst powania

na obrazie obiektów, które na obrazie „pó niejszym” nieco zmieni yby po o enie

wzgl dem poziomu gruntu, a by mo e tak e kszta t. Przyk ad wyst powania takich

obiektów pokazano na rysunku 1. W przypadku gorszego dopasowania niektórych

podobrazów istnieje mo liwo ich pomini cia podczas procesu scalania cz stkowych


415

wyników dopasowywania. Podczas analizy wyników uwzgl dniono 4 mo liwo ci

scalania, pokazane na rysunku 1. By y to: sumowanie wszystkich sze ciu wyników

cz stkowych, sumowanie pi ciu i czterech najlepszych oraz dynamiczne odrzucanie

gorszych wyników. Ta ostatnia metoda polega a na badaniu ró nic pomi dzy

uporz dkowanymi rosn co wynikami i odrzucaniu tych, które przekroczy y zadany próg.

W ka dym z wymienionych przypadków suma wyników cz stkowych by a

normalizowana: dzielono j przez liczb wzi tych pod uwag sk adników (por. wzory

D.3 i D.4). Na rysunku 2 porównano rednie odchy ki pasowania (por. wzór D.6),

obliczone dla wy ej zdefiniowanych sygnatur i czterech metod scalania wyników

cz stkowych.

Dla metody sumowania wszystkich 6 wyników cz stkowych (na rysunku

2 oznaczenie suma_6) rednie odchy ki s najbardziej skupione i niskie. Minimum

wyst pi o dla metody z odrzuceniem jednej warto ci (suma_5) dla sygnatury 50

elementowej (por. czarna strza ka na rysunku 2). Dla sygnatury o tej d ugo ci rednie

odchy ki w nast pnych procesach scalania (suma_4 i suma_dyn) tak e osi gaj

minimalne warto ci. W zwi zku z wysokimi rednimi odchy ek obserwowanymi dla

sygnatur 100 i 200 elementowych porównywanych od setnego elementu w dalszej

analizie sygnatury te zostan pomini te. Oprócz warto ci rednich, które charakteryzuj

jako dopasowania w sposób ogólny, przyj to kilka progów odchy ek dopasowa ( -

por. wzór D.5) i obliczono procentowo, ile odchy ek lokuje si poni ej. Rezultaty

uzupe niono – dla porównania – warto ciami rednimi i zestawiono w tabeli 1. W ka dej

kolumnie, odpowiadaj cej ró nym progom odchy ek, zaznaczono warto maksymaln .

Wi kszo maksimów jest zlokalizowana w wierszach odpowiadaj cych sygnaturom

1-25 i 1-50, przy czym w obu przypadkach wyniki ko cowe dopasowania obliczano

sumuj c wszystkie 6 wyników cz stkowych (bez odrzuce – por. ostatni kolumn tabeli

1). Ta metoda prezentacji wyników ma za zadanie zorientowanie si w precyzji

pasowania, uzyskiwanej przy u yciu ró nych sygnatur. Warto ci uzyskane dla sygnatur

krótkich (od 1-25 i od 1-50) metod sumowania wszystkich 6 elementów s do siebie

zbli one.

Rys. 2. Porównanie rednich b dów pasowania dla kilku d ugo ci sygnatur i czterech

metod scalania wyników. Strza k zaznaczono warto minimaln

0

4

8

12

16

20

su

ma_6

su

ma_5

su

ma_4

su

ma_d

yn

red

nia

od

ch

yka [

pix

]

od 1-25

od 1-50

od 1-100

od 100-200

od 100-300

sygnatury:


416

Tabela 1. Procentowe dopasowania dla kilku dopuszczalnych odchy ek

Dla sygnatury o najni szej redniej odchy ce (od 1-50, sumowanie 5 elementów –

patrz przedostatni wiersz tabeli 1) precyzja dopasowania dla ma ych odchy ek jest

o wiele ni sza. Spasowanie przy pomocy tej metody wykonano równie dla dwóch

ró nych typów obrazów „Bytom” i „Krakow”. Wyniki zaprezentowano na rysunkach 3

i 4, na których porównano odchy ki pasowania uzyskane przy pomocy sygnatur

(sig50_6) z metod klasyczn (kor_6_6). Jak wida metoda sygnatur jest bardzo czu a na

rodzaj obrazu wej ciowego. W przypadku „Bytomia” mamy do czynienia ze zdj ciami

z centrum miasta, a wi c o du ej liczbie bloków mieszkalnych, z wyst puj cymi tu

znacznymi przesuni ciami radialnym pomi dzy obrazami. Obrazy z „Krakowa”

charakteryzuj si wi kszym podobie stwem z racji lokalizacji poza miastem,

o niezró nicowanej rze bie terenu. Zauwa alne na rysunku 3 znaczne ró nice pomi dzy

odchy kami wynikaj g ównie z faktu wyst powania wysokich bloków na obrazie.

Klasyczna korelacja stosunkowo dobrze sobie „radzi” z tym problemem. Sieci, z racji

swojej specyfiki dzia ania s wra liwe zarówno na przesuni cia radialne jak i na zmiany

o wietlenia, st d dok adno spasowania spada (obrazy Bytom_53 do Bytom_95).

Podobnie jest w przypadku obrazów kr_7371_9 i kr_7371_13.

Rys. 3. Wyniki spasowania dla obrazu „Bytom”

sygnatura rednia

odchy ka

[piksele]

< 3

< 5

< 10

< 30

liczba

odrzuce

od 1 – 25 10,59 47,73% 54,55% 70,45% 86,36% 0

od 1 – 50 10,77 45,45% 56,82% 70,45% 88,64% 0

od 1 – 100 11,28 34,09% 54,55% 65,91% 88,64% 0

od 1 – 25 11,38 34,09% 47,73% 65,91% 88,64% 1

od 1 – 50 10,31 34,09% 43,18% 68,18% 90,91% 1

od 1 – 100 12,99 31,82% 45,45% 59,09% 84,09% 1

0

10

20

30

40

50

60

byto

m_

1

byto

m_

10

byto

m_

13

byto

m_

20

byto

m_

26

byto

m_

27

byto

m_

45

byto

m_

53

byto

m_

57

byto

m_

58

byto

m_

62

byto

m_

67

byto

m_

71

byto

m_

86

byto

m_

89

byto

m_

95

byto

m_1

14

byto

m_1

25

byto

m_1

67

byto

m_2

17

byto

m_2

19

byto

m_2

29

byto

m_2

35

sig50_6 korel_6_6


417

Rys. 4. Wyniki spasowania dla obrazu „Kraków”

4. PODSUMOWANIE I WNIOSKI

W artykule dokonano przegl du literatury dotycz cej wykorzystania sztucznych

sieci neuronowych (SSN) w geoinformatyce obrazowej, ze szczególnym

uwzgl dnieniem procesów fotogrametrycznych. Autorzy dokonali podsumowania

zastosowa SSN w fotogrametrii, udowadniaj c tym samym coraz powszechniejsze

ich wykorzystanie, poczynaj c od wydobywania cech z obrazu, przez kalibracj kamer,

a na spasowaniu obrazów ko cz c. Te ostatnie obejmowa y g ównie prace zwi zane

ze stereowizj . Brak w literaturze eksperymentów zwi zanych z pasowaniem zdj

lotniczych, z racji z o ono ci zagadnienia, doprowadzi do podj cia przez autorów prób

badawczych w tym kierunku. W punkcie 3 artyku u przedstawiono kolejny etap bada -

serie eksperymentów zwi zanych z pasowaniem reprezentacji fragmentu obrazu

w postaci sygnatur, generowanych przez impulsuj ca sie neuronow ICM. Wyniki nie

s w pe ni zadowalaj ce, aczkolwiek w blisko 1/3 przypadków efekty uzyskane przy

pomocy sygnatur s takie same lub lepsze od rezultatów, otrzymanych po zastosowaniu

klasycznej korelacji (por. rys. 3 i 4). Autorzy widz sens kontynuowania bada w dwóch

kierunkach:

1. pog bionej analizy sytuacji (podobrazów) powoduj cych du e ró nice

odchy ek dopasowania obu porównywanych metod i wprowadzenia

ewentualnych korekt na etapie wst pnego przetwarzania obrazu,

2. zastosowania sieci impulsuj cych do wykrywania obiektów, które nast pnie

pos u do generowania sygnatur i pasowania.

Prac zrealizowano w ramach bada w asnych AGH nr 10.10.120.783 oraz bada

statutowych AGH nr 11.11.150.949/08.

0

10

20

30

40

50

60kr_

73

71

_9

kr_

737

1_

10

kr_

737

1_

11

kr_

737

1_

13

kr_

737

1_

14

kr_

737

1_

27

kr_

737

1_

29

kr_

737

1_

32

kr_

737

1_

34

kr_

77

75

_2

kr_

77

75

_5

kr_

77

75

_7

kr_

77

75

_9

kr_

777

5_

13

kr_

777

5_

18

kr_

777

5_

34

kr_

777

5_

43

kr_

777

5_

59

kr_

777

5_

63

kr_

777

5_

65

sig50_6 korel_6_6


418

5. LITERATURA

Ahadzadeh S., Valadanzouj M., Sadeghian S., Ahmadi S., 2008. Detection of Damaged

Buildings after an Earthquake Using Artificial Neural Network Algorithm. The

International Archives of the Photogrammetry, Remote Sensing and Spatial Information

Sciences, Beijing, China, Vol. XXI, Part B8, s. 369-372.

Aria E.H., Saradjian M.R., Amini J., Lucas C., 2004. Generalized cooccurrence matrix

to classify IRS-1D images using neural network. The International Archives of the

Photogrammetry, Remote Sensing and Spatial Information Sciences, Istambul, Turkey,

Vol. XX, Part B7., s. 114-116.

Barsi A., 1996. Thematic classification of Landsat image using neural network. The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences, Vienna, Austria, Vol. XVIII, Part B3, s.48-52.

Barsi A., 2000. The impact of data compression and neighborhood information on the classification accuracy of artificial neural networks. Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences, Amsterdam, Holland, Vol. XIX, Part B7, s. 140-147.

Barsi A., Heipke C., Willrich F., 2002. Junction extraction by artificial neural network

system – JEANS, IntArchPhRS XXXIV/3b, Graz , s.18-21

Bischof H., Schneider W., Pinz A., 1992. Multispectral classification of Landsat images

using neural network, IEEE Trans. on Geosience and Remote Sensing, Vol. 30, No 3, s.

482-490.

Bock S., 1996. A region-based approach to land-use classification of remotely –sensed image data using artificial neural network. The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences, Vienna, Austria, Vol. XVIII, Part B7, s.71-76.

Cetin M., Kavzoglu T., Musaoglu N., 2004. Classification of multi-spectral, multi-

temporal and multi-sensor images using principal components analysis and artificial

neural networks: beykoz case. The International Archives of the Photogrammetry,

Remote Sensing and Spatial Information Sciences, Istambul, Turkey, Vol. XX, Part B4,

s. 951-956.

Chen C., Chen S., Shyn S., 1996. Classification of remote sensing imagery using an

unsupervised neural network. The International Archives of the Photogrammetry,

Remote Sensing and Spatial Information Sciences, Vienna, Austria, Vol. XVIII, Part B7,

s. 112-117.

Dreyer P., 1993. Classification of land cover using optimized neural nets on SPOT data,

Photogrammetric Engineering and Remote Sensing, Vol. 59, No. 5, s. 617-621.

Elaksher A., 2008. Multi-image matching using neural networks and photogrammetric conditions. The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences, Beijing, China, Vol. XXI, Part B3, s. 39-44.

Hara Y., Atkins R., Yueh S., Shin R., Kong J., 1994. Application of neural networks to

radar image classification, IEEE Trans. on Geoscience and Remote Sensing, Vol. 32, No.

1, s. 100-109.


419

Kamiya I., 2000. Image classification by spatial shift invariant neural network. Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences, Amsterdam, Holland, Vol. XIX, Part B7, s. 636-639.

Kepuska V., Mason, S., 1991. Automatic signalized point recognition with feed-forward

neural network, IEE Conference Publication, 2-nd

International Conference on Artificial

Neural Networks, London, Nr 349, s. 359-363.

Korbicz J., Obuchowicz A., Uci ski D., 1994. Sztuczne sieci neuronowe. Podstawy

i zastosowania. Akademicka Oficyna Wydawnicza PLJ, Warszawa.

Lindblad T., Kinser J.M., 2005: Image Processing Using Pulse-Coupled Neural

Networks. Springer-Verlag, Berlin, Heidelberg

Mendonca M., da Silva I., Castanho J., 2002. Camera calibration using neural networks.

Journal of WSCG - poster abstract at 10-th Int. Conf. Central Europe on Computer

Graphics, Visualization and ComputerVision (WSCG 2002), Vol. 10, nr 1-3.

Mikrut S., Mikrut Z., 2007. Sieci neuronowe w procesach automatycznej korelacji zdj

lotniczych. Archiwum Fotogrametrii, Kartografii i Teledetekcji, Vol 17b, s. 505-515.

Mikrut Z., 2007. Tworzenie reprezentacji obszarów zdj lotniczych za pomoc sieci neuronowych klasy PCNN. Uczelniane Wydawnictwo Naukowo-Dydaktyczne Kraków – Pó rocznik Automatyka, Tom 11, s. 355 – 364.

Mokhtarzade M., Valadan Zoej M., Ebadi H., 2008. Automatic Road Extraction from

High Resolution Satellite Images Using Neural Networks, Texture Analysis, Fuzzy

Clustering and Genetic Algorithms. The International Archives of the Photogrammetry,

Remote Sensing and Spatial Information Sciences, Beijing, China, Vol. XXI, Part B3b, s.

549-556.

Resko B., Baranyi P., Hashimoto H., 2003. Camera Control with Disparity Matching in Stereo Vision by Artificial Neural Networks. In Workshop on Intelligent Solutions in Embedded Systems, Vienna, Austria.

Tadeusiewicz R., 1993. Sieci neuronowe. AOW Warszawa.

Tadeusiewicz R., G ciarz T., Borowik B., Leper B., 2007. Odkrywanie w a ciwo ci sieci neuronowych przy u yciu programów w j zyku C\#. Polska Akademia Umiej tno ci. Mi dzywydzia owa Komisja Nauk Technicznych, Kraków.

Törma M, 1996, Self-organizing Neural Network in Feature Extraction. The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences, Vienna, Austria, Vol. XVIII, Part B2, s.374-379.

Wang J., Hsiao C., 1999. On Disparity Matching in Stereo Vision via a Neural Network

Framework, Proc. Natl. Sci. Counc. ROC(A), Vol. 23, No. 5, s. 665-678.

Zhou L., Yang X., 2008. Use of Neural Networks for Land Cover Classification from

Remotely Sensed Imagery. The International Archives of the Photogrammetry, Remote

Sensing and Spatial Information Sciences, Beijing, China, Vol. XXI, Part B7, s. 575-

578.


420

DODATEK: FORMALNY OPIS ALGORYTMU DOPASOWYWANIA

SYGNATUR

Sieci impulsuj ce ICM (Intersecting Cortical Model) generuj – na podstawie

obrazu w stopniach szaro ci - sekwencje obrazów binarnych, na których w kolejnych

krokach obliczeniowych uwypuklane s ró ne fragmenty obrazu wej ciowego. W

oparciu o t w asno sieci w 1994 roku Johnson wprowadzi poj cie sygnatury

(Lindblad et al., 2005). Podstaw obliczania sygnatur jest funkcja czasowa G(i),

otrzymywana w wyniku sumowania wyj neuronów („bia ych pikseli”) w ka dym

kroku obliczeniowym:

przy czym Bgh [0,1] oznacza piksel binarnego obrazu o wspó rz dnych (g,h), i=1...N.

W celu sprawdzenia efektywno ci dopasowywania fragmentów obrazów na

podstawie ich sygnatur wybrano K=44 fragmenty obrazów ze zdj cia lotniczego a

nast pnie zlokalizowano ich odpowiedniki na zdj ciu nast pnym. Z tego ostatniego

zdj cia wyci to wi ksze fragmenty, które zawiera y zlokalizowane uprzednio podobrazy

otoczone do du ym marginesem. Wspó rz dne lewego górnego rogu zlokalizowanego

podobrazu oznaczono warto ciami (0, 0). Po fragmencie obrazu przesuwano ramk o

wielko ci równej szukanemu pobobrazowi. Ramk dzielono na J=4 lub J=6 równych

cz ci, i dla ka dej z nich wyznaczano sygnatury, które nast pnie porównywano z

sygnaturami, otrzymanymi w analogiczny sposób dla podobrazu poprzedniego zdj cia

(poszukiwanego wzorca). Dla ka dej pary odpowiadaj cych sobie sygnatur obliczano

wska nik:

Oi

Mi

xyjjxyj iGiGq (D.2)

gdzie M i O okre laj pocz tek i koniec sygnatury (O-M<N), (x, y) oznacza przesuni cie

analizowanej ramki wzgl dem lokalizacji prawid owej (0,0), a j=1...J jest numerem

cz ci,

na które zosta podzielony podobraz (por. rys. 1).

Sumaryczny wska nik dopasowania sygnatur dla ca ej ramki wynosi :

Jj

j

xyjxy qJ

Q1

0 1 (D.3)

przy uwzgl dnieniu wszystkich J cz ci (indeks 0 oznacza brak – czyli zero - cz ci

nieuwzgl dnionych). W przypadku odrzucenia jednego najgorszego wska nika:

xyjj

xyxy qQJ

Q max1

1 01 (D.4)

Po osi gni ciu granic zmienno ci przesuni ramki (x, y) oblicza si , w którym miejscu

dopasowanie ca ych ramek by o najlepsze, czyli wyznacza si wspó rz dne:

(X0 ,Y0) takie, e D(X0 ,Y0)=minx,yQ0xy w przypadku sumowania wszystkich J cz ci, lub

hg

gh iBiG,

(D.1)


421

(X1 ,Y1) takie, e D(X1 ,Y1)=minx,yQ1xy w przypadku sumowania z odrzuceniem

najgorszego wska nika.

Miar dopasowania dla k-tej pary fragmentów obrazów z bazy danych jest

odchy ka lokalizacji lewego górnego naro nika podobrazu od punktu (0,0), czyli:

22 zzz

k YX (D.5)

przy czym z [0,1] jest indeksem odpowiadaj cym liczbie odrzuconych wyników

cz stkowych.

Dla ca ej bazy danych rednia odchy ka lokalizacji jest redni z odchy ek

cz stkowych:

Kk

k

z

k

z

K 1

1 (D.6)

APPLICATION OF NEURAL NETWORKS TO PHOTOGRAMMETRIC

PROCESSES

KEY WORDS: artificial neural network, image matching, digital photogrammetry

Summary

The paper discusses the use of artificial neural networks in geoinformatics, particularly

in photogrammetric image analysis. It reviews the relevant international publications (including

the ISPRS congress proceedings) and discusses the outcome of research on the use of networks for

matching photogrammetric images. The paper shows also results of tests, described in the

literature, in which neural networks were applied to perform tasks such as feature extraction,

multispectral image classification, camera calibration and matching.

The idea of using neural networks is based on the selection of special representations. The

essence of the neural networks-based methodology consists of preparing suitable representations

of image fragments and of using them toclassify various types of neural networks. One of the

methods adopted was based on the distribution and direction of image gradient module value.

The research was conducted on forty four sub-images, taken from aerial photographs of two

Polish cities: Bytom and Cracow. The areas shown in those images differed in their terrain cover.

The images were divided into three categories: full sub-images, sub-images divided into 4 parts,

and sub-images divided into 6 small parts.

The research involved the Intersecting Cortical Model (ICM), a version of the Pulse Coupled

Neural Network (PCNN), with which the so-called image signatures, i.e., a few dozen-element

vectors that describe the image structure were generated. The preliminary results partially confirm

the correctness of the approach adopted, despite problems resulting from the complex nature of

photogrammetric images.

dr in . S awomir Mikrut

e-mail: [email protected]

tel. (12) 617 23 02

dr in . Zbigniew Mikrut

e-mail: [email protected]

tel. (12) 617 38 53

WYKORZYSTANIE SIECI NEURONOWYCH W PROCESACH...

Documents

Transcript of WYKORZYSTANIE SIECI NEURONOWYCH W PROCESACH...