Kartering van de verstruweling in de Amsterdamse ... · Cees de Vries . Samenvatting. ... Door...
Transcript of Kartering van de verstruweling in de Amsterdamse ... · Cees de Vries . Samenvatting. ... Door...
Kartering van de verstruweling in de Amsterdamse
Waterleidingduinen met behulp van Definiens Developer
Bachelorscriptie voor de opleiding Aardwetenschappen
Frank Diependaal Amsterdam, Juli 2008 Faculteit FNWI Universiteit van Amsterdam Begeleiders: Universiteit van Amsterdam Waternet Guido van Reenen Mark van Til Fred van der Vegte Cees de Vries
Samenvatting Om de successie van de vegetatie in de Amsterdamse Waterleidingduinen te
kunnen monitoren, is het belangrijk om luchtfoto’s om te kunnen zetten in een
vegetatiekaart. Een van de (nieuwste) computerprogramma’s waarmee dit kan
gebeuren is Definiens Developer. Dit onderzoek behelst enerzijds een kartering van
de vegetatie voor de beheerder van de Amsterdamse Waterleidingduinen, en
anderzijds een inschatting van de mogelijkheden voor het gebruik van Definiens
Developer binnen De Universiteit van Amsterdam.
De luchtfoto’s van 2001 en 2006 zijn in dit onderzoek met behulp van
Definiens Developer ingedeeld in gebiedjes met vergelijkbare spectrale
eigenschappen, de segmenten. Een aantal van deze segmenten zijn vervolgens
toegewezen aan zeven vegetatie-structuurtypen: water, zand, gras, laagstruweel,
hoogstruweel, loofbos en naaldbos. Op basis van een analyse van de spectrale
eigenschappen van de segmenten in deze klassen zijn ook alle andere segmenten in
een van de klassen ingedeeld. Dit is gebeurd volgens de nearest neighbor methode.
Door middel van een accuracy assessment is het percentage goedgeclassificeerde
segmenten bepaald. Van de classificaties met de grootste accuracy is voor elke klasse
het oppervlak bepaald als percentage van het totale gebied.
Figuur 1, in de grazige vegetatie is de toekomstige verstruweling al zichtbaar
De verschillen binnen twee classificaties van hetzelfde jaar blijken van
dezelfde ordegrootte als de verschillen tussen 2001 en 2006. Hierdoor zijn de
oppervlaktes die zijn bepaald van elke vegetatiestructuurklasse niet betrouwbaar
genoeg om conclusies te trekken over successie tussen 2001 en 2006. Op het oog
geeft een vergelijking van de luchtfoto’s van 2001 en 2006 wel aanleiding om een
2
successie in de vegetatie te veronderstellen. Er is wel een kaart gemaakt van de
vegetatie van een deel van de Amsterdamse Waterleidingduinen in 2006.
De eigenschappen die verschillende vegetatiestructuurklassen het beste van
elkaar kunnen onderscheiden, zijn vast te stellen door middel van een “Feature Space
Optimization”. In dit onderzoek is deze methode slechts beginnend verkend, waardoor
de waarde hiervan nog niet goed beoordeeld kan worden.
Een belangrijk deel van dit verslag vormen de aanbevelingen voor
vervolgonderzoek waardoor de vele mogelijkheden die Definiens Developer biedt in
de toekomst beter ingezet kunnen worden bij vegetatiekartering aan de hand van
luchtfoto’s. Vooral verbetering van de methode op het gebied van automatisering bij
het kiezen van samples en verbetering van de segmentatiefase zijn punten waardoor
snel de (accuracy) resultaten van de kartering kunnen worden verbeterd.
Figuur 2, De grazende reeën zijn niet voldoende om de successie te stoppen
3
Inhoudsopgave Samenvatting……………………………………………………… 2 Voorwoord………………………………………………………. 5 Inleiding
- achtergrond van het onderzoek…………………………. 6 - probleemstelling………………………………………… 7 - opzet van het onderzoek………………………………… 8
Methode
- bestanden………………………………………………… 9 - software………………………………………………….. 10 - Werkwijze……………………………………………….. 10 - Parameters………………………………………………... 14
Resultaten
- Inleiding…………………………………………………… 17 - TTAmasks…………………………………………………. 17 - Accuracy resultaten………………………………………… 17 - Veranderingen in het oppervlak per vegetatiestructuur……. 19 - Veranderingen in het aantal segmenten per vegetatie-structuurtype 23 - Beschrijving van de gemaakte kaarten…………………… 24 - Kartering van een terreindeel dat binnenkort in begrazing wordt genomen 27
Conclusie…………………………………………………………… 28 Discussie
- Discussie……………………………………………………. 31 - verdere aanbevelingen……………………………………… 32
Literatuur
- Boeken……………………………………………………… 34 - Internet……………………………………………………… 34
Inhoudsopgave bijlagen……………………………………………… v.a. 35
- Excel bestand o Classificaties o TTAmasks o Oppervlaktes o Afbeeldingen classificatie 201 t/m 210
- ArcGis bestand o Vegetatiekaart van 2006
4
Voorwoord
Dit thesisonderzoek vormt het laatste onderdeel van de bacheloropleiding
aardwetenschappen aan de Universiteit van Amsterdam. Dit onderzoek komt voort uit
de samenwerking tussen de Universiteit van Amsterdam en Waternet. Voor zowel de
Universiteit van Amsterdam als Waternet is het onderwerp vrij nieuw, en gedurende
het onderzoek is gebleken ook in de literatuur over dit onderwerp nog vrij weinig
bekend is. Mede vanwege de complexheid is het onderzoek behoorlijk ingeperkt om
het uitvoerbaar te kunnen maken als bacheloronderzoek in de daarvoor bestemde tijd.
Dit heeft tot gevolg gehad dat het onderzoek vooral verkennend van karakter is en dat
de resultaten slechts in beperkte mate praktisch toepasbaar zijn. Ondanks dat kijk ik
terug op een geslaagd bacheloronderzoek, en ik hoop dat de lezer dit onderzoek met
net zoveel interesse zal lezen als ik het onderzoek heb uit mogen voeren.
Voor alle hulp bij het onderzoek wil ik mijn begeleiders Guido van Reenen, Cees de
Vries en Fred van der Vegte bedanken en ook masterstudent Guusje Hoek , die mij als
Definiens-specialist met name in het begin veel heeft geholpen.
5
Inleiding
Achtergrond van het onderzoek
De Amsterdamse Waterleidingduinen (AWD) beslaan een gebied langs de kust direct
ten zuiden van Zandvoort ter grootte van 3800 hectare (figuur 3). Behalve in gebruik
voor de waterwinning voor de gemeente Amsterdam herbergt dit gebied een naar
Nederlandse maatstaven rijke flora en fauna. Waternet beheert dit gebied in opdracht
van de gemeente Amsterdam, en in die hoedanigheid ook verantwoordelijk voor het
milieubeleid waarbij het behoud en uitbreiding van de hoge biodiversiteit centraal
staat. Een van de bedreigingen voor de biodiversiteit is de uitbreiding van de
Amerikaanse vogelkers (Prunus serotina) die vooral ten koste gaat van de open, lage
vegetaties.
Figuur 3, ligging van de AWD ten opzichte van Amsterdam Om het gevoerde natuurbeheer te kunnen beoordelen en om het beleid voor de
toekomst te kunnen bepalen, zijn goede vegetatiekaarten van groot belang. Met
kaarten van verschillende jaren kan de ontwikkeling van het gebied worden
beoordeeld. Deze benodigde kaarten zijn niet zondermeer beschikbaar en
vergelijkbaar. Een goede (geautomatiseerde) methode om met behulp van luchtfoto’s
vegetatiekaarten te maken zou een grote bijdrage kunnen leveren aan de beoordeling –
6
en dus verbetering- van het natuurbeheer. Een van de computerprogramma’s die
gebruikt kunnen worden is Definiens Developer. Door veelbelovende resultaten in
eerdere studies is er voor dit onderzoek gekozen om van dit programma gebruik te
maken.
Figuur 4, Ligging van het onderzoeksgebied in de AWD Probleemstelling
Dit onderzoek is in overleg met Waternet vooral gericht op het ontwikkelen van een
methode voor de kartering. Daarnaast is een kartering van een klein deel van de AWD
gewenst in verband met voorgenomen beheersmaatregelen. De hoofdvraag van het
onderzoek is:
- Op welke wijze kan de verstruweling van het Middenveld in de Amsterdamse
Waterleidingduinen het beste worden gemonitord met behulp van
luchtopnamen en het programma Definiens Developer?
Om deze hoofdvraag gestructureerd te kunnen beantwoorden zijn de volgende
deelvragen opgesteld:
- Welke gegevens zijn er benodigd voor de kartering van de verstruweling in de
AWD?
7
- Op welke wijze zijn met behulp van Definiens Developer de verschillende
vegetatiepatronen in de AWD te onderscheiden?
- Wat zijn de verschillen in de emissiespectra van verschillende soorten
vegetatie in de AWD?
- Hoe is de verstruweling te kwantificeren in de AWD tussen 2001 en 2006?
- Hoe ziet het vegetatiepatroon er uit in het Middenveld en het Renbaanveld in
de AWD in de zomer van 2006?
Opzet van het onderzoek
Voor het uitvoeren van dit onderzoek is kennis van ArcGIS en Definiens Developer
nodig. Met name dit tweede programma is nog weinig gebruikt, waardoor het leren
werken hiermee een belangrijke fase is in dit onderzoek. Door de combinatie van de
beperkte tijd en de enorme mogelijkheden die Definiens Developer biedt is het niet
mogelijk om dit programma geheel te leren gebruiken. Dit onderzoek is er daarom
vooral op gericht om de mogelijkheden van het programma in de toekomst in te
schatten en optimaal te kunnen benutten.
In het hoofdstuk “methode” zal een duidelijke beschrijving worden gegeven van wat
er is uitgevoerd om tot resultaat te komen. De belangrijkste resultaten worden daarna
besproken. In de conclusie wordt geprobeerd een antwoord op de onderzoeksvragen te
geven. Ondanks dat het onderzoek een zeer methodische vraagstelling kent is de
discussie na de conclusie als apart hoofdstuk opgenomen. Hierin zijn ook de
aanbevelingen voor vervolgonderzoek opgenomen.
Als laatste volgen nog de literatuurlijst en de bijlagen waarin ook de uitvoer van de
computerberekeningen is opgenomen.
8
Methode
Bestanden
Omdat het doel van het onderzoek niet alleen het in kaart brengen is van het
onderzochte gebied, maar ook het zoeken naar een methode om in het algemeen de
vegetatie te kunnen karteren, ligt de nadruk op een zoveel mogelijk
gestandaardiseerde en reproduceerbare classificatiemethode. Voor de uitvoering van
dit onderzoek werd verwacht dat de programma’s Definiens Developer en ArcGIS
gebruikt zouden moeten worden. Daarom is in het begin van het onderzoek veel tijd
geïnvesteerd in het leren werken met deze programma’s. Tijdens het onderzoek is,
toen dit nodig bleek, ook nog gewerkt met ERDAS.
De gegevens die voor dit onderzoek beschikbaar zijn, bestaan onder meer uit
luchtopnamen van de Amsterdamse Waterleidingduinen uit 2001 en 2006. Om de
grootste zichtbaarheid van de struweelvegetatie te verkrijgen zijn er foto’s van de
zomer gebruikt. In dit jaargetijde zijn de struiken het duidelijkst te onderscheiden van
bomen en grazige vegetatie. De geografische positie per foto van de hoekpunten van
deze opnamen waren met de foto’s meegeleverd, alleen het coördinatenstelsel moest
hieraan nog worden toegevoegd. De foto’s zijn allemaal gerefereerd op coördinaten
van het Rijksdriehoekstelsel (Amersfoort).
Naast deze twee opnames is er een vegetatiekaart beschikbaar van de AWD uit 1995
en een bedrijfskaart uit 1998 waarop ook verschillende vegetatieklassen worden
onderscheiden. De foto’s waarop deze kaarten gebaseerd zijn, waren niet beschikbaar
voor dit onderzoek.
Alle bestanden en kaarten die gebruikt zijn voor dit onderzoek zijn beschikbaar
gesteld door Waternet.
Software
Voor het analyseren van de luchtfoto’s is gebruik gemaakt van diverse programma’s.
In de eerste plaats zijn aan de bestanden de juiste coördinatenstelsels toegevoegd met
een ArcGIS pakket, waarbij gebruik is gemaakt van ArcMap en ArcCatalog.
Er bestaan verschillende programma’s die kunnen helpen bij het analyseren van
luchtfoto’s. Deze programma’s zijn in te delen in programma’s die “pixel-based”
werken en programma’s die de analyse “object-based” uitvoeren. De eerste soort
beoordeelt voor elke pixel apart de eigenschappen en deelt iedere pixel op basis
9
daarvan in een aangegeven klasse in. “Object-based” programma’s zijn gericht op de
analyse van een pixel in relatie tot de omliggende pixels. Hierdoor kan bijvoorbeeld
een verschijnsel op de foto als schaduw worden meegenomen bij de classificatie.
Vanwege de betere verwachtingen en beschikbaarheid van het “object-based”
programma Definiens Developer (de opvolger van het programma eCognition) is dit
programma gebruikt in plaats van de programma’s ERDAS en DICRANUM.
Werkwijze
Voorbereiding
Voor het leren werken met ArcGIS en Definiens Developer zijn diverse modules
beschikbaar bij de GIS-studio van de Universiteit van Amsterdam. Het volgen van
deze modules was de eerste stap in het onderzoek, en de kennis die hiermee is
opgedaan vormt de basis van het verdere onderzoek.
Naast de modules is er algemene informatie ingewonnen over de Amsterdamse
Waterleidingduinen en in het bijzonder over het natuurbeleid van Waternet, de
beheersmaatregelen die genomen zijn in het verleden en hoe het beheer georganiseerd
is. De eerste kennismaking met het onderzoeksgebied bestaat uit een veldbezoek met
Mark van Til van Waternet en Cees de Vries van de Universiteit van Amsterdam.
Hierbij wordt duidelijk welke problematiek er in het algemeen in de Amsterdamse
Waterleidingduinen speelt rondom successie. Voordat vervolgens zelfstandig het
onderzoeksgebied in gegaan kan worden, zijn met behulp van ArcGis de luchtfoto’s
bewerkt voor gebruik in het veld en in kleur (schaal 1:4500) uitgeprint. Van een klein
deel van het gebied is ook nog een foto op extra grote schaal (1:1000) uitgeprint, om
in het veld de waarde hiervan in te kunnen schatten.
Het veld in…
Met een afdruk van de luchtfoto’s is het veld in gegaan om het te karteren gebied in
werkelijkheid te kunnen zien. Hierbij is een indeling gemaakt van de foto in de
volgende vegetatieklassen: gras, loofbos, naaldbos, hoogstruweel en laagstruweel.
Ook zijn de klassen zand en water onderscheiden. Het belangrijkste was om de vraag
te beantwoorden of het mogelijk is om zonder computer en alleen op basis van de foto
het gebied te kunnen classificeren. Over het algemeen is gebleken dat uit de
luchtfoto’s duidelijk is af te leiden welke vegetatiestructuur er in het veld
daadwerkelijk aanwezig is. Dit is een belangrijke conclusie omdat we daardoor in
staat zijn om ook foto’s die jaren geleden gevlogen zijn tenminste met de hand te
classificeren. Opgemerkt moet nog worden dat er in het veld rekening is gehouden
10
met het feit dat de meest recente foto uit de zomer van 2006 komt en dus niet meer
letterlijk te vergelijken is met de werkelijkheid zoals die half mei 2008 in het veld is
aangetroffen.
Het belangrijkste probleem van de successie wordt in dit gebied van de duinen
gevormd door de uitbreiding van Amerikaanse vogelkers. Dit is een zeer snel
groeiende struik die zowel de plaats inneemt van bestaand duingrasland als van
bestaand laagstruweel. Over het algemeen bestaat laagstruweel uit duindoorn, wat
meestal niet hoger wordt dan 1 à 2 meter. Omdat de Amerikaanse vogelkers al binnen
enkele jaren hier bovenuit groeit, zijn de gebieden waar deze groeit meestal
geclassificeerd als hoogstruweel. Gebieden die in het veld als loofbos geclassificeerd
zijn, bestaan bijvoorbeeld uit berk, eik of els. Amerikaanse vogelkers kan zo groot
worden dat er in hoogte geen verschil meer is met loofbomen.
De foto’s in de computer…
Voordat de foto’s die zijn aangeleverd door Waternet gebruikt kunnen worden in
Definiens Developer, zijn deze met behulp van het programma ERDAS aan elkaar
geplakt zodat het onderzoeksgebied is samengebracht in één bestand. Vervolgens is er
een uitsnede gemaakt met ERDAS, zodat alleen het onderzoeksgebied door Definiens
Developer geanalyseerd hoeft te worden, wat rekentijd scheelt. In Definiens
Developer is de afbeelding vervolgens gesegmenteerd (figuur 5). Dit betekent dat het
programma de eigenschappen van elke pixel gaat vergelijken met de omliggende
pixels of segmenten. Op basis van een aantal parameters bepaalt het programma of
deze pixels zodanig overeen komen dat ze samen in een segment worden geplaatst.
De gebruikte parameters voor deze segmentatie zijn aanvankelijk bepaald op basis
van literatuur over eerder onderzoek en op basis van het testen van kleine
veranderingen hierin. Vervolgens zijn hieruit de instellingen gekozen waaruit de beste
classificatie volgde. Een belangrijke beperking voor de segmentatie is de tijd die het
de computer kost. Een segmentatie duurt soms meer dan een uur, en hoe langer het
duurt, des de groter de bestanden zijn die dit oplevert. Het gevolg is dat ook de
classificatie daardoor weer meer tijd kost.
De classificatie…
De volgende stap is om de segmenten van de kaart te laten classificeren. Hierin
worden twee manieren onderscheiden: “supervised” en “unsupervised classification”.
Bij “supervised classification” worden eerst de klassen waarin de foto moet worden
ingedeeld vastgesteld. Vervolgens worden er van elke klasse een aantal
11
voorbeeldsegmenten (trainingssamples) aangewezen. Hierna deelt het programma alle
segmenten in aan de hand van de eigenschappen (features) per klasse die zijn afgeleid
uit de eigenschappen van de voorbeeldsegmenten.
Bij “unsupervised classification” deelt het programma de pixels bij elkaar in die
vergelijkbare eigenschappen hebben. In feite heeft dit grote overeenkomsten met de
“segmentation”. Door de toenemende mogelijkheden (snelheden) van
computerhardware worden de resultaten van “unsupervised classification” steeds
beter. Dit is ook goed bruikbaar als er weinig kennis is over het gebied. Bovendien is
er relatief weinig GIS kennis voor nodig.
Op basis van de beschreven verschillen in de methodes voor classificatie, is er
gekozen om te werken met “supervised classification”. Dit betekent dat er in
Definiens Developer per klasse een aantal segmenten wordt ingedeeld. Deze
voorbeeldgebieden (trainingssamples) kunnen samen worden opgeslagen als TTA
(Test and Training) mask. Vervolgens worden de eigenschappen geselecteerd waarop
het programma de voorbeeldgebieden moet vergelijken met de nog te classificeren
gebieden. Dit zijn bijvoorbeeld spectrale waardes zoals gemiddelde en
standaarddeviatie. Hier volgt later meer over. De classificatie gebeurt uiteindelijk
volgens de nearest neighbor methode.
Figuur 5, Een deel van de luchtfoto van 2001, ingedeeld in segmenten
Beoordeling van de classificatie
Nadat de indeling is gemaakt, kan deze worden beoordeeld. Hiervoor worden er
opnieuw handmatig bij elke klasse een aantal segmenten ingedeeld. Door deze
12
indeling te vergelijken met de resultaten van de “supervised classification” met
behulp van een accuracy assessment kan de nauwkeurigheid beoordeeld worden van
het resultaat van de “supervised classification”.
In eerste instantie bestond de indeling uit de klassen water, zand, gras, struweel,
naaldbos en loofbos. Omdat hiermee de ontwikkeling in struweel minder nauwkeurig
bij te houden is en omdat de accuracy zeer hoog was, is het aantal klassen uitgebreid
door struweel onder te verdelen in hoog- en laagstruweel. Bij het aanwijzen van
segmenten voor deze klassen wordt meteen duidelijk dat het uit de foto’s moeilijk is
om het verschil tussen hoog- en laagstruweel te zien. De veldwaarnemingen zijn
hierbij zeer belangrijk, met name voor de twijfelgevallen. Dit zijn bijvoorbeeld
gebieden waarin het niet duidelijk is welk soort vegetatietype er op te foto te zien is of
segmenten die eigenlijk meerdere vegetatietypen bevatten.
Accuracy Assessment
Een standaard functie in Definiens Developer is het laten uitvoeren van een accuracy
assessment. Er wordt hiervoor een mask gemaakt dat de testsamples bevat. Van deze
segmenten wordt net als bij een trainingsmask aangegeven in welke klasse ze horen te
vallen. Door vergelijking van de klasse volgens de testmask en de classificatie wordt
duidelijk welk percentage van de testmasks correct is geclassificeerd. Het laden van
de masks in Definiens Developer kost de computer erg veel tijd, waardoor het ook
veel tijd kost om een grote hoeveelheid classificaties uit te voeren zoals die in bijlage
1 te vinden is. Behalve de accuracy geeft een accuracy assessment ook nog de KIA
(Kappa index of agreement). Deze waarde is een schatting van de betrouwbaarheid
van de accuracy. Een hoge KIA (de KIA loopt van 0 tot 1) en een hoge accuracy geeft
dus de beste classificatie weer. Bij veel samples in de testmask zal de KIA toenemen.
Er is ook geprobeerd om de samples in de testmask goed te verdelen over de
verschillende klassen. Meestal zijn bij een foto meerdere masks gemaakt, om de
invloed van de samplekeuze in te kunnen schatten. Het aantal segmenten dat als zand
geclassificeerd kan worden, is slechts klein. Het gevolg is dat de zandsamples voor
ieder mask ongeveer hetzelfde zijn. Hierdoor zullen de masks nooit helemaal
verschillend zijn van elkaar.
De oppervlakte per klasse
Om van de geclassificeerde foto een kaart te maken waarvan de oppervlaktes te
berekenen –en dus te vergelijken- zouden zijn, is de classificatie met de hoogste
“accuracy” uiteindelijk geëxporteerd als raster file uit Definiens Developer. In
13
ArcCatalog is er opnieuw een georeferentie toegevoegd en in ArcMap is het
rastertype geconverteerd naar features. Door een gebied te kiezen dat begrensd wordt
door infiltratiegeulen is het gemakkelijk om ArcMap te gebruiken om daarna
oppervlakte per vegetatiestructuur te bepalen. Bij het vergelijken van de oppervlaktes
per vegetatiestructuur lijken de verschillen al erg groot, en uiteindelijk blijkt ook het
totaal van de oppervlakte in 2001 en in 2006 niet overeen te komen. Omdat er nogal
wat bewerkingen zijn uitgevoerd om tot een kaart in ArcMap te komen, is het
moeilijk om de plek aan te wijzen waar het fout is gegaan. Om hier niet al te veel tijd
mee te verliezen is besloten niet meer met ArcMap de oppervlaktes uit te rekenen
maar met Definiens Developer. De oppervlaktes van 2001 en 2006 per
vegetatiestructuur kunnen vervolgens vergeleken worden om inzicht te krijgen in de
verstruweling van het gebied. Een nadeel van het werken met Definiens Developer in
plaats van ArcMap is dat de gemaakte kaarten minder eenvoudig bewerkt kunnen
worden.
Parameters
Door afhankelijk van de uitslag van een accuracy assessment steeds de waarde van de
parameters te veranderen, kan de accuracy van de indeling steeds hoger worden. Er is
geprobeerd een zo systematisch mogelijk systeem te hanteren waarbij vrijwel alle
parameters meerdere keren zijn veranderd. In de segmentatie is alleen de “scale
parameter” veranderd. Van “shape” en “compactness” is ondervonden dat deze zoals
eerder onderzoek ook heeft aangetoond standaard zeer goed bruikbare waardes
hebben.
Tijdens het onderzoek is gebleken dat de grootte van de pixels van de opnamen van
2001 en 2006 niet overeenkwamen. Hierna is de celgrootte gelijkgesteld aan de
grootste van de twee (2006) met een waarde van 50x50cm per cel (pixel).
Een luchtopname bestaat uit een bestand van spectrale eigenschappen per pixel. Deze
spectrale eigenschappen bestaan uit de waarde van elke pixel voor een specifieke
golflengte. Behalve de zichtbare golflengtes die horen bij rood, groen, en blauw licht,
wordt ook de golflengte van nabij-infrarood (NIR) geregistreerd. Omdat de variatie in
energie in NIR in de vegetatie zo groot is, wordt deze vaak gebruikt om vegetatie te
onderscheiden. Omdat de waardes van een luchtopname altijd maar in drie kleuren
weergegeven kunnen worden op een foto (de kleuren op het scherm zijn ook
opgebouwd uit rood, groen en blauw) bevat het gebruikte bestand van de luchtopname
14
maar drie “banden”: een voor het groene licht, een voor het rode licht en een voor het
NIR.
Zoals gezegd dient er bij de classificatie aangegeven te worden aan de hand van welke
eigenschappen van de voorbeeldsegmenten er geclassificeerd moet worden. Hier is
een enorme hoeveelheid keuzes mogelijk, welke het belangrijkste verschil vormen
voor de accuracy van de verschillende indelingen. Voor dit onderzoek was het
onmogelijk om heel veel verschillende eigenschappen te gebruiken. Er is daarom
gebruik gemaakt van wat hierover al bekend was uit eerdere onderzoeken. Uit de
geraadpleegde literatuur is gebleken dat de gemiddelde waarde van elke laag een
goede parameter is. Daarnaast is de NDVI gebruikt. NDVI staat voor “Normalized
Difference Vegetation Index” en geeft een waarde voor de fotosynthetische
eigenschap van een gebied waarmee dus iets gezegd kan worden over de vegetatie. De
NDVI kijkt niet naar nieuwe eigenschappen maar naar de verhouding van de waarde
van het gemiddelde in laag 1 en 2 (NIR en rood) van de luchtopname met de formule
2layer mean 2layer mean
1layer mean -1layer mean NDVI+
= .
Voor verbetering van de automatische classificatie van luchtfoto’s is het zoeken naar
onderscheidende parameters zeer belangrijk. Dit kunnen, zoals eerder genoemd,
bijvoorbeeld spectrale waardes zijn zoals gemiddelde van een bepaalde band of de
standaard deviatie. Dit onderzoek is helaas te klein om daar een methode voor te
ontwikkelen. Definiens Developer biedt hier een aantal hulpmiddelen bij, die in dit
onderzoek slechts oppervlakkig verkend zijn. Een van de hulpmiddelen die Definiens
Developer biedt is de “Feature Space Optimization”. Deze methode is niet voldoende
onderzocht om hier conclusies uit te trekken, maar ziet er in dit stadium veelbelovend
uit. Zoals met meer mogelijkheden die de computer kan bieden, zou bij verder
onderzoek wel goed bekeken moeten worden wat de software precies doet om het
antwoord op de juiste manier te kunnen interpreteren.
Een belangrijke component die de waarde van de accuracy sterk beïnvloed is de
voorbeeld- en toetssegmenten die gekozen worden om de accuracy te bepalen. Met de
hand worden er aan elke klasse een aantal samples toegewezen. Dit is helaas geen
exacte wetenschap, en daarom is er met vele verschillende TTA masks gewerkt. Over
het algemeen wordt aangenomen dat de fouten hierdoor redelijk binnen aanvaardbare
15
grenzen blijven maar hier wordt in de discussie nog op terug gekomen.
Overeenkomsten tussen de masks zijn niet uit te sluiten
In het begin is soms onterecht gebruik gemaakt van dezelfde segmenten in trainings-
en test masks. Omdat hiermee de accuracy onterecht hoger wordt (segmenten die als
trainingsobject zijn gebruikt zullen immers sowieso goed worden geclassificeerd), is
dit later vermeden. Door de opzet van Definiens Developer is het echter mogelijk dat
er toch een enkele keer een segment zowel in de trainings- als in de testmask zit.
Automatiseren van de werkwijze
Vooraf was het de vraag of een kartering van het gebied volgens een
geautomatiseerde methode mogelijk zou zijn waardoor de classificatie objectiever zou
worden. Dit is echter in het stadium waarin het onderzoek nu nog zit niet van belang.
Het classificeren met Definiens Developer vraagt nu soms nog teveel handelingen om
dit te kunnen automatiseren. Bovendien zijn er in deze handelingen ook nog teveel
dingen die fout kunnen gaan waardoor de classificatie minder betrouwbaar wordt.
Nummering van de resultaten
De resultaten zijn allemaal in de bijlage te vinden. Van elke classificatie is de
accuracy en de KIA vastgelegd. Van de laatste tien classificaties zijn bovendien ook
de afbeeldingen met excel opgeslagen. Voor de nummering van de classificaties van
2001 is begonnen bij 1, de nummering van de classificaties van 2006 beginnen bij
101. In de tweede fase van het onderzoek zijn de classificaties begonnen bij nummer
201. De bijbehorende afbeeldingen zijn te vinden met hetzelfde nummer.
16
Resultaten
Inleiding
Gedurende het onderzoek zijn vele resultaten verkregen. De meeste van deze
resultaten zijn gebruikt om de verschillende parameters te kunnen beoordelen en te
veranderen om zo de methode te verbeteren. In de bijlage zijn alle resultaten terug te
vinden. Van de classificaties zijn niet in alle gevallen de kaarten gedocumenteerd
omdat de classificatie in het begin vooral gericht was op het verhogen van de
accuracy. De methodes met de hoogste waardes voor de accuracy zijn vervolgens
herhaald. Hier zijn wel kaarten van. Omdat de geclassificeerde foto’s niet allemaal
zijn uitgevoerd als gis-bestand zijn deze “kaarten” alleen een afbeelding, dus zonder
geografische informatie. Van het jaar 2006 is de beste classificatie wel naar een
ArcGIS bestand omgezet.
TTAmasks
In de bijlage is een overzicht te vinden van alle TTAmasks die gebruikt zijn. Hierbij is
aangegeven voor welke toepassing ze ontworpen zijn. De accuracy kan zowel op
basis van een mask als op basis van een aantal voorbeelden uitgerekend worden. Als
alle voorbeelden gewist worden en de mask vervolgens wordt omgezet in voorbeelden
(create samples from mask) dan geeft dit een andere accuracy, terwijl de samples en
de mask identiek zijn. Hier is geen verklaring voor gevonden. De accuracy is altijd
groter als de classificatie met behulp van de mask wordt beoordeeld. Bij het bepalen
welke mask de hoogste accuracy heeft is alleen naar de mask gekeken.
Accuracy resultaten
De accuracy resultaten voor alle classificaties die gedaan zijn, zijn te vinden in de
bijlage. Er is gevarieerd met verschillende parameters. De segmentation parameter is
gevarieerd van 10 tot 200. Als de grootte van de segmenten al niet voldeed aan de
eisen is er ook geen verdere classificatie uitgevoerd. Als de segmentatie teveel tijd
kostte is deze niet afgemaakt. Bij de resultaten zijn daarom alleen de accuracy
waardes te vinden van parameterwaarde 80, 100 en 120. Omdat de accuracy bij
waarde 100 het grootste was is, is bij de gemaakte kaarten een segmentatieparameter
van 100 gebruikt. Toch wordt bij het bekijken van de segmenten soms duidelijk dat
dit een bron van fouten kan zijn. Een groot aantal segmenten bestaat uit meerdere
soorten vegetatie, bijvoorbeeld een lage struik in een verder vergraste vegetatie
17
(figuur 6). Een uitgebreid onderzoek naar de optimalisatie van de segmentatiemethode
zou nodig zijn om dit soort fouten uit te kunnen sluiten.
Omdat voor het trainen en testen altijd een mask is gebruikt dat is gemaakt bij een
bepaalde segmentatie is het veranderen van de overlap (dit wordt gevraagd bij het
laden van een mask) zonder resultaten.
Figuur 6, een segment dat meerdere structuurstypes bevat Omdat in het begin niet duidelijk was dat de pixelgrootte tussen de twee jaartallen
verschilde, was deze bij de eerste resultaten niet gelijk. Tijdens het onderzoek is de
celgrootte alsnog gelijk gesteld met Definiens Developer (File > Modify Project), en
alleen deze celgrootte van 50x50cm is gebruikt om de afbeeldingen te maken.
Bovenstaande parameters hebben voornamelijk betrekking op de segmentatie. Als de
segmenten eenmaal gedefinieerd zijn dan hebben de features de grootste invloed op
de classificatie. Zoals te zien is, is een aantal features elke keer toegepast. Dit zijn
Brightness, Mean (van alle drie de banden) en Max Diff. In de bijlage is bij elk
resultaat aangegeven welke features er bij de classificatie gebruikt zijn.
Van de accuracy in 2001 is de waarde voor de nauwkeurigheid bij
classificatienummer 7 het grootste, met 0.861. Dit is een herhaling van classificatie 6
(accuracy 0.846) met precies dezelfde omstandigheden, waardoor dus eigenlijk
verwacht mag worden dat de accuracy ook hetzelfde zou zijn. Waarom dit niet zo is,
is niet duidelijk. Bij classificatie 7 is bij de indeling naast de standaardfeatures
gebruik gemaakt van de NDVI. Bij classificatie 4 is dit niet het geval, maar toch zijn
18
de resultaten hetzelfde, zelfs voor de KIA. Het gebruik van NDVI verhoogt hier de
nauwkeurigheid dus niet. Van de foto uit 2006 is de nauwkeurigheid bij
classificatienummer 104 het hoogste met 0.764 Hierbij zijn alleen de
standaardfeatures gebruikt. De verschillen in accuracy tussen een herhaling met
dezelfde randvoorwaardes lijken groter dan de verschillen tussen het wel of niet
gebruiken van de NDVI.
De beste eigenschappen (features) waarop een vegetatiestructuur te onderscheiden is,
is per gebied, per segmentatie en per mask weer anders. Het is daarom niet mogelijk
om eigenschappen aan te wijzen die ook altijd buiten het onderzoeksgebied te
gebruiken zijn.
Bovenstaande classificaties zijn in de eerste fase van het onderzoek uitgevoerd. In de
tweede fase is opnieuw een classificatie uitgevoerd, waarbij de nadruk niet meer lag
op het verbeteren van de werkwijze maar juist op de resultaten. In deze fase speelt
ook het uitrekenen van de oppervlakte per vegetatiestructuur een belangrijke rol,
omdat hiermee antwoord kan worden gegeven op de onderzoeksvragen
- Hoe is de verstruweling te kwantificeren in de AWD tussen 2001 en 2006
- Hoe ziet het vegetatiepatroon er uit in het Middenveld en het Renbaanveld in
de AWD in de zomer van 2006
Bij het beantwoorden van deze vragen is dus gebruik gemaakt van een methode
waarvan bekend was dat deze nog verbeterd kon worden.
Veranderingen in het oppervlak per vegetatie-structuurtype
In het gebied dat is onderzocht is volgens de beheerder de successie van de vegetatie
een groot probleem. Dit is ook de reden dat er gewerkt wordt aan nieuwe
beheersmaatregelen. Voorbeelden van successie zijn de overgang van zandbedekking
naar duingrasland (figuur 7) , van duingrasland naar struweel en van struweel naar
bos. Bij het analyseren van de ontwikkeling van bijvoorbeeld struweel moet echter
wel in de gaten worden gehouden dat de totale hoeveelheid struweel niet hoeft te
veranderen. Er kan eenzelfde hoeveelheid struweel verdwijnen door een overgang
19
Figuur 7, Een voorbeeld van successie; gras neemt de plaats in van zand
naar bos als er bijkomt door de ontwikkeling van duingrasland naar struweel. Een
echte toename zou daardoor vooral te zien zijn in het begin en het eind van de
successiereeks: bij kaal zand en bij (loof)bos. Door de kleine hoeveelheid zand vormt
ook de hoeveelheid duingrasland een redelijke indicatie. Er kan immers maar weinig
zand overgaan in duingrasland, dus als de hoeveelheid duingrasland is afgenomen zou
dit een toename van de hoeveelheid (laag)struweel tot gevolg kunnen hebben.
De eerste fase waarin struweel nog niet is onderverdeeld in hoog- en laagstruweel gaf
wel een hoge accuracy, maar weinig informatie over de successie. De oppervlakte per
klasse van deze indeling is daarom niet bepaald.
Omdat het in Definiens alleen mogelijk is om met vierkante beelden te werken, is de
uitsnede van het onderzoeksgebied in ERDAS gemaakt. Alles wat buiten de polygoon
valt, is afgebeeld als zwart. Bij de classificatie met Definiens Developer wordt dit
gebied meestal ingedeeld als “Unclassified”. Een enkele keer is echter het verschil
tussen water en helemaal zwart kennelijk niet duidelijk en is het gebied dat buiten de
polygoon valt als water geclassificeerd. Dit is geen probleem omdat de hoeveelheid
water niet belangrijk is voor dit onderzoek. Voor de percentages per
vegetatiestructuurtype (tabel 1 en 2) is het vierkant waarin het polygoon van het
onderzoeksgebied ligt als 100% genomen. Daardoor zijn de percentages per
vegetatieklasse van verschillende classificaties vergelijkbaar, ook als het gebied
buiten de polygoon als water wordt geclassificeerd.
Bij het gebruiken van ERDAS om een polygoon van het onderzoeksgebied uit te
knippen, treedt er een verandering van de kleuren op. Deze verandering zit niet in
beide foto’s, waardoor het moeilijker is de foto’s met elkaar te vergelijken. Omdat de
20
classificatie op basis van trainingssamples wordt uitgevoerd, wordt verwacht dat dit
geen invloed heeft op de classificatie.
Van 2001 en 2006 zijn meerdere classificaties uitgevoerd waarvan de accuracy
berekend is. Bij deze classificaties zijn de features en de TTAmasks veranderd (zie
bijlage 1). Van de classificaties met de hoogste accuray in combinatie met de hoogste
KIA benaderen de berekende oppervlaktes het beste de werkelijke situatie.
In 2001 is dit classificatie 203, met een accuracy van 0.771 (berekend met mask). Van
2006 is dit classificatie 204 met een accuracy van 0.857. De resultaten hiervan zijn
ook opgenomen in onderstaande tabel.
Vegetatietype Percentage in 2001 Percentage in 2006
(water) 36.81% 3.84%
(zand) 1.24% 0.78%
(gras) 15.01% 12.05%
laagstruweel 21.19% 18.70%
hoogstruweel 9.89% 16.58%
loofbos 10.09% 9.14%
naaldbos 5.76% 6.48%
unclassified 32.44%
Totaal 100.00% 100.00%
Tabel 1, percentage oppervlakte per vegetatieklasse van classificatie 203 en 204
Hierin is te zien dat het percentage zand en gras in verhouding het meeste is
afgenomen. De percentages laagstruweel en loofbos zijn ook afgenomen, maar in
mindere mate. Een zeer aanzienlijke toename, van 9,89% naar 16,58%, is te vinden in
het hoogstruweel. De hoeveelheid naaldbos is slechts licht toegenomen. De afname
van de hoeveelheid loofbos van 10,09% naar 9,14% kan niet verklaard worden door
natuurlijke processen in het gebied en er heeft ook geen menselijk ingrijpen
plaatsgevonden. De afname is kleiner dan één procent en zou ook een gevolg kunnen
zijn van de classificatiemethode.
Om de invloed in te kunnen schatten die het gevolg is van de gebruikte classificatie
methode, is er van elk jaar nog een classificatie uitgevoerd met andere test- en
trainingsmasks. Dit zijn classificatie 205 en 206, waarvan de accuracy respectievelijk
op 0.772 en 0.851 liggen. De resultaten hiervan zijn opgenomen in onderstaande
tabel.
21
Vegetatietype Percentage in 2001 Percentage in 2006
(water) 36.21% 3.89%
(zand) 1.52% 1.31%
(gras) 12.46% 11.12%
laagstruweel 17.49% 21.00%
hoogstruweel 12.62% 14.32%
loofbos 16.14% 12.16%
naaldbos 3.56% 3.75%
unclassified 0.00% 32.44%
Totaal 100.00% 100.00%
Tabel 2, percentage oppervlakte per vegetatieklasse bij classificatie 205 en 206
Hierin is ook te zien dat het percentage zand en gras afneemt, hoewel het minder is
dan bij de vergelijking in tabel 1. Het percentage laagstruweel neemt juist toe, en de
toename in het percentage hoogstruweel is veel minder. Het percentage loofbos neemt
hier nog meer af dan in tabel 1. Naaldbos laat een lichte stijging zien.
Behalve een vergelijking van twee verschillende jaren, kunnen we nu ook twee
dezelfde jaren vergelijken. De verschillen hiertussen zijn zeker het gevolg van
verschillen in de classificatiemethode omdat ze op basis van dezelfde foto gemaakt
zijn.
In 2001 is het percentage water ongeveer gelijk gebleven. De hoeveelheid zand is bij
205 relatief groter dan bij 203, maar met het kleine oppervlak zand gebeurt dat al bij
een kleine absolute toename. Het verschil in percentage gras is ruim 2,5 procent, wat
erg hoog is ten opzichte van de verandering van 2001 naar 2006. Laagstruweel laat
een verschil van 3,2% zien, wat zelfs meer is dan de afname van 2001 naar 2006. Bij
hoogstruweel is de verandering binnen 2001 minder extreem, maar zowel loof- als
naaldbos laat een verandering binnen 2001 zien die groter is dan de veranderingen
van 2001 naar 2006. Met name loofbos valt op doordat de eerste classificatie (tabel 1)
een percentage van 10.09 laat zien en de tweede classificatie van dezelfde foto (tabel
2) een percentage van 16,14.
De accuracy van beide classificaties (204 en 206) van 2006 zijn hoger, dus er mag
verwacht worden dat hier de verschillen binnen hetzelfde jaar kleiner zijn. Zand blijkt
echter met 0,78% en 1,31% juist verder uit elkaar te liggen dan in 2001. Het verschil
bij gras is minder dan 1%, wat niet zoveel is op de totale (ongeveer) 12%.
22
Hoogstruweel, loofbos en naaldbos laten weer grote verschillen zien. Van de laatste
drie springt naaldbos er duidelijk uit met een verschil van 2,73% tussen 204 en 206.
Vanwege het kleine aantal classificaties, zijn deze cijfers nog niet het bewijs voor
enorme structurele verschillen als gevolg van de gebruikte masks. Als er nog meer
classificaties van hetzelfde jaar bekend zijn, dan zou er echter wellicht geconcludeerd
kunnen worden dat de standaarddeviatie tussen verschillende classificaties van
hetzelfde jaar groter is dan de verschillen die hier tussen de jaren 2001 en 2006 te
vinden zijn. Dat het toch, als je de luchtfoto bekijkt, lijkt dat de vegetatie in het
onderzoeksgebied aan successie onderhevig is, geeft aan dat de classificatiemethode
zoals die hier gebruikt is nog niet van voldoende kwaliteit is. Hier wordt in de
discussie nog op terug gekomen.
Veranderingen in het aantal segmenten per vegetatie-structuurtype
Naast de hoeveelheid vierkante meters is ook het aantal segmenten per vegetatietype
hier opgenomen. De foto’s die hiervoor gebruikt zijn hadden dezelfde eigenschappen
(onder andere pixelgrootte) maar het is niet bekend of er bewerkingen aan gedaan zijn
die van invloed kunnen zijn op de segmentatie. Doordat de segmentatieparameters
hetzelfde zijn gebleven representeert het totale aantal segmenten de grilligheid van de
vegetatie voor zover die in de luchtfoto’s wordt gerepresenteerd. De foto van 2001 is
in 3245 segmenten opgedeeld, terwijl de foto van 2006 in 2075 segmenten is
opgedeeld. Deze afname met ruim 36% is een indicatie voor het feit dat de vegetatie
in 2006 homogener van karakter is geworden.
Vegetatietype 2001 2006
Water 3.45% 5.59%
Zand 4.28% 6.84%
Gras 13.50% 14.02%
Laag struweel 18.34% 26.12%
Hoog struweel 25.27% 17.16%
Loofbos 28.69% 20.24%
Naaldbos 6.47% 8.82%
Unclassified 0.00% 1.20%
Totaal 100.00% 100.00%
Tabel 3, percentage segmenten per vegetatieklasse bij classificatie 205 en 206
23
In tabel 3 staat het percentage segmenten per vegetatiestructuur-klasse weergegeven
voor classificatie 205 en 206. De belangrijkste verschillen zijn de toename in
segmenten bij laagstruweel en de afname bij hoogstruweel en loofbos. De verandering
bij laagstruweel en loofbos komt ook terug in tabel 1 en 2 als verandering in
oppervlak. De afname van het aantal segmenten hoogstruweel in combinatie met een
toename in het oppervlak kan aangeven dat de gebieden hoogstruweel aaneen
gegroeid zijn.
Van classificatie 203 en 204 zijn de aantallen segmenten per klasse niet bekend.
Beschrijving van de gemaakte kaarten
Van de complete lijst resultaten, welke in bijlage 1 te vinden is, bestaat van elk
resultaat ook een afbeelding (bijlage 4) waarin op de luchtfoto de klassen zijn
aangegeven. In het begin van het onderzoek zijn deze afbeeldingen niet opgeslagen
omdat in dat stadium alleen het verbeteren van de methode van belang was en dat is
op basis van de accuracy gebeurd. In de tweede fase van het onderzoek, waarbij
nogmaals een aantal classificaties is uitgevoerd, zijn de afbeeldingen wel gebruikt om
de classificatie te beoordelen. De twee resultaten van classificatie 203 en 204
(respectievelijk 2001 en 2006) zijn hieronder weergegeven. In de bijlage is de
afbeelding groter weergegeven, de cijfers van de oppervlaktes zijn in tabel 1
weergegeven. Tabel 4 is een legenda voor de figuren van de classificatie.
Figuur 8, afbeelding van classificatie 203 (links) en 204 (rechts)
24
Vegetatiestructuur-type Kleur
Zand Geel
Gras Lichtgroen
Laagstruweel Roze
Hoogstruweel Paars
Loofbos Donkergroen
Naaldbos Bruin
Water Blauw
Unclassified Zwart
Tabel 4, legenda van de classificatie-afbeeldinen (figuur 1 en 2) Op de afbeelding van 2001 is rechtsboven (noordoost) weinig verschil met 2006.
Rondom het meertje zijn de grootste verschillen tussen de twee jaren. In 2001 is het
grootste deel geclassificeerd als loofbos, terwijl dit in 2006 als hoogstruweel is
geclassificeerd. Het laagstruweel ten oosten van het meertje in 2006 bestond in 2001
volgens deze classificatie uit hoogstruweel en bos. Vanaf het midden van de foto naar
beneden toe is een sterk wisselende vegetatiestructuur, met in 2001 laagstruweel en
duingrasland. In 2006 is met name de hoeveelheid duingrasland afgenomen en de
hoeveelheid hoogstruweel toegenomen. Het “Eendenvlak” en “Pietjes
Zwarteveld”(rechtsonder), dat in 2001 bestaat uit loof- en naaldbomen, afgewisseld
met soms hoogstruweel en gras, is in 2006 veel homogener geclassificeerd met
voornamelijk grote vlakken loof- en naaldbomen. Het oppervlak dat buiten het
onderzoeksgebied valt is in 2001 als water geclassificeerd en in 2006 als
“unclassified”.
Met de classificatie in het veld vergeleken, lijkt het noorden in 2001 op basis van de
luchtfoto te boomrijk geclassificeerd te zijn. Het zuiden laat juist in 2006 wel erg veel
naaldbomen zien. Het gevolg is dat de totale oppervlakte loofbomen iets afneemt,
terwijl de hoeveelheid in het zuiden juist is toegenomen. Als in 2001 in het noorden
de vegetatie (onterecht) als loofbomen is geclassificeerd, en dit in 2006 als
hoogstruweel is geclassificeerd dan lijkt het volgens de cijfers onterecht alsof de
hoeveelheid struweel is toegenomen. Een kaart van alleen het hoogstruweel in 2001
en 2006 is te vinden in bijlage 5. Hierop lijkt het hoogstruweel heel erg te zijn
25
uitgebreid, maar een deel van het hoogstruweel in 2006 was in 2001 gewoon als
loofbos geclassificeerd.
Omdat een tweede vergelijking tussen 2001 en 2006 de ontwikkeling duidelijk zou
kunnen maken, is deze hieronder opgenomen (afbeelding 2). Het zijn de resultaten die
het gevolg zijn van classificatie 205 en 206. De cijfers van de oppervlaktes zijn dus in
tabel 2 te vinden. Helaas zijn de afbeeldingen van 205 en 206 niet helemaal
vergelijkbaar. Bij 205 (jaar 2001) staat een klein deel in het westen niet op de kaart,
en van 206 (jaar 2006) wijken de kleuren enigszins af van de andere classificaties.
Figuur 9, afbeelding van classificatie 205 (links) en 206 (rechts)
Als eerste valt weer op dat de vegetatie in 2006 veel homogener verspreid is dan in
2001. Het laagstruweel in het noorden in 2006 bestond in 2001 volgens de
classificatie nog uit hoog- en laagstruweel. De bomen rondom het meertje in 2001 zijn
in 2006 weer als hoogstruweel geclassificeerd. In de zuidelijke helft zit het verschil
vooral in de rand van het bosgebied “Pietjes Zwarteveld”. Een aanzienlijk deel van de
segmenten die in 2006 als hoogstruweel zijn geclassificeerd, zijn in 2001 als loofbos
geclassificeerd. In 2006 is daar ook een groot deel als naaldbos geclassificeerd dat in
2001 nog als hoogstruweel of loofbos werd aangemerkt. In 2001 zijn zelfs twee
vlakken water als bos geclassificeerd, dit is op de figuur in de bijlage beter te zien.
Bij het analyseren van deze classificaties valt op dat de veranderingen in 2006 ten
opzichte van 2001 niet allemaal het gevolg kunnen zijn van natuurlijke processen, en
26
in veel gevallen is er al helemaal geen sprake van successie. Omdat er in het gebied
door de beheerder nauwelijks is ingegrepen en ook op de ruwe luchtfoto’s geen
sprake lijkt te zijn van een teruggang in vegetatie, is de verandering toe te schrijven
aan de methode waarmee geclassificeerd wordt. Daarom zou naar aanleiding van deze
resultaten een aanpassing van de methode een volgende stap moeten zijn. Vanwege de
beperkte omvang van dit onderzoek is dit niet gebeurd. In de conclusie wordt daarom
ingegaan op de resultaten tot zover, welke de basis kunnen vormen voor verder
onderzoek.
Kartering van een terreindeel dat binnenkort in begrazing wordt genomen
In bijlage 6 is een kaart van het onderzoeksgebied te vinden, welke ook digitaal als
ArcGIS bestand is toegevoegd. Deze kaart komt voor het grootste deel overeen met de
afbeelding van classificatie 204. De belangrijkste afwijking van de classificatie in het
veld betreft de hoeveelheid naaldbos. In het veld is hier minder van aangetroffen dan
deze classificatie laat zien. Verder is het gebied dat als laagstruweel is geclassificeerd
in werkelijkheid meer een afwisseling van laagstruweel en vergrast duingrasland zoals
in figuur 3 te zien was.
Figuur 10, De vegetatiekaart van het onderzoeksgebied over de luchtfoto heen
27
Conclusie
Gedurende het onderzoek zijn er veel veranderingen in de methode uitgeprobeerd om
de mogelijkheden van de software te kunnen beoordelen. Dit was een van de
belangrijkste acties om de onderzoeksvragen te kunnen beantwoorden. Terugkijkend
naar de deelvragen van dit onderzoek, kunnen de volgende deelconclusies worden
getrokken.
Voor de kartering van de verstruweling in de AWD vormen de luchtfoto’s de
belangrijkste basis. Naast de fotobestanden zelf, is inzicht in de productie van de
bestanden zeer waardevol om de foto’s op de juiste manier te kunnen bewerken en te
analyseren. In het bijzonder kennis van de manier waarop de spectrale eigenschappen
van een gebied worden opgeslagen in een fotobestand en welke bewerkingen hieraan
vooraf gaan is belangrijk omdat deze spectrale eigenschappen gebruikt worden bij het
indelen van de vegetatie in klassen. Naast de luchtfoto’s zijn veldwaarnemingen van
belang om de informatie op de foto te kunnen interpreteren en is de kennis van het
beheer in een gebied belangrijk om natuurlijke- en antropogene processen te kunnen
onderscheiden. Beter inzicht in de andere gebruikte software had in dit onderzoek
veel tijd kunnen sparen, bijvoorbeeld bij het “uitknippen” van het onderzoeksgebied
uit de luchtfoto.
Met behulp van Definiens Developer kunnen gebieden die qua spectrale
eigenschappen op elkaar lijken bij elkaar worden ingedeeld in segmenten waarna deze
in klassen kunnen worden ingedeeld. De eigenschappen op basis waarvan de
segmenten worden ingedeeld kunnen per klasse worden uitgekozen. Indien dit bestaat,
zou literatuur over een vergelijkbaar onderwerp al richting kunnen geven aan de
indelingscriteria omdat de lijst met mogelijke kenmerken waarop een gebied te
onderscheiden is erg groot is. Bovendien kunnen sommige eigenschappen elkaar
versterken dus zouden ook combinaties van eigenschappen bekeken moeten worden.
Het is ook mogelijk om door Definiens Developer de beste features en combinaties uit
te laten zoeken. Het programma gaat met de “Feature Space Optimazation” zelf
opzoek naar de eigenschappen die de klassen het beste onderscheiden, maar hiermee
worden niet de features gevonden die op alle foto’s de beste accuracy geven. Met
deze functie is dit onderzoek geen ervaring op gedaan.
28
In tegenstelling tot wat in het begin van het onderzoek werd aangenomen, is kennis
van de spectrale eigenschappen van elke klasse niet direct van belang voor de
classificatie. Vanwege de rekensnelheid is ervoor gekozen om deze eigenschappen
buiten beeld te houden, wat er voor gezorgd heeft dat er geen kennis is opgedaan over
de eigenschappen van elke klasse. Om in de toekomst de classificaties van meerdere
jaren beter vergelijkbaar te kunnen maken, kan het classificeren op basis van (de
waarde van) eigenschappen in de toekomst wellicht een belangrijke methode zijn.
Hiervoor moeten verschillende luchtopnames de werkelijkheid wel allemaal hetzelfde
weergeven. Met behulp van de spectrale eigenschappen van een vegetatieklasse kan
het ook makkelijker zijn om representatieve samples uit te kiezen waarmee de
classificatie gedaan kan worden.
Figuur 11, Duindoorn gaat achteraan over in Amerikaanse vogelkers Met behulp van Definiens Developer zijn de luchtfoto’s van 2001 en 2006
geclassificeerd. Uit de verschillen hiertussen (met name tussen de
struweeloppervlaktes) kan de verstruweling in de AWD worden gekwantificeerd. Een
voorwaarde hiervoor is wel dat de classificatie klopt, en een nadeel is dat de getallen
in dit onderzoek alleen maar over het gehele gebied gingen en niet over delen van het
gebied voorhanden zijn. Een grafische weergave in de vorm van een kaart maakt een
snelle interpretatie van de vegetatieontwikkeling mogelijk.
Uit de deelconclusies volgt ook de hoofdconclusie, welke gezien kan worden als
antwoord op de in inleiding gestelde hoofdvraag: “Op welke wijze kan de
29
verstruweling van het Middenveld in de Amsterdamse Waterleidingduinen het beste
worden gemonitord met behulp van luchtopnamen en het programma Definiens
Developer.”
Het belangrijkste antwoord dat hierop te geven is, is dat dit onderzoek te weinig tijd
geeft om hier volledig antwoord op te geven. De snelste methode om de verstruweling
te monitoren is een handmatige kartering aan de hand van luchtfoto’s van het gebied.
Definiens Developer kan hierbij gebruikt worden voor de segmentatie, en daarna
kunnen de segmenten handmatig in klassen worden ingedeeld.
Een meer algemene conclusie is dat het programma Definiens Developer vele
mogelijkheden biedt voor kartering. Door deze grote hoeveelheid mogelijkheden is er
meer onderzoek nodig om een goede methode vast te stellen maar er lijken
tegelijkertijd goede mogelijkheden te zijn om dit programma in de toekomst wel te
kunnen gebruiken voor een (geautomatiseerde) kartering, ook van grotere gebieden.
De bevindingen in dit onderzoek kunnen daarbij helpen de mogelijkheden en
beperkingen van het programma Definiens Developer verder te onderzoeken en in te
schatten.
30
Discussie
Bij een onderzoek naar een onderwerp waar vooraf nog maar weinig in de literatuur
over te vinden is, is het moeilijk om het onderzoek direct doelmatig op te zetten. Dit
heeft tot gevolg dat de efficiëntie van het onderzoek, met name in het begin, niet altijd
het gewenste niveau heeft gehad. Er is veel tijd besteed aan het leren werken met het
programma Definiens Developer, maar meer nog aan het leren gebruiken van de juiste
functies en parameters hierin.
Inhoudelijk is het ook nog niet gelukt om het programma naar alle tevredenheid in te
zetten voor het classificeren van de vegetatie. Het zou na het handmatig indelen van
de segmenten in een klasse mogelijk moeten zijn om de analyse die het programma
maakt over de features uit te lezen. Deze waardes zou je dan vervolgens kunnen
gebruiken om de classificatie te beoordelen. Bovendien zou je dan de foto van 2001
en 2006 op basis van dezelfde waardes (van de eigenschappen) kunnen classificeren.
Het is hiervoor wel noodzakelijk dat eigenschappen die in werkelijkheid gelijk zijn
ook op verschillende foto’s een gelijke waarde hebben. Dit lijkt in praktijk niet het
geval te zijn. Zowel foto’s van verschillende jaren als naast elkaar liggende foto’s van
hetzelfde jaar laten met elkaar vergeleken verschillen zien waar de werkelijkheid
vrijwel zeker hetzelfde is. Als nu het geclassificeerde gebied niet op één foto staat zou
de indeling anders kunnen zijn dan wanneer dit wel op één foto staat.
In het veld is tijdens dit onderzoek vastgesteld dat het mogelijk is om op basis van de
luchtfoto’s met de hand de vegetatie in klassen in te delen. Dit gehele onderzoek gaat
er van uit dat deze indeling helemaal goed is. Hier kunnen echter ook
interpretatiefouten in zitten. Zeker nadat de onderverdeling van struweel in hoog- en
laagstruweel is gemaakt, is de kans op interpretatiefouten groter.
Er is al een enkel experiment uitgevoerd waarbij meerdere malen een classificatie is
gedaan met dezelfde voorbeeldsegmenten. Ook de accuracy is vervolgens meerdere
malen bepaald, elke keer met hetzelfde test-mask. Door het vergelijken van meerdere
accuracy waardes wordt duidelijk dat de accuracy zelf ook niet altijd betrouwbaar is.
De KIA is ook een maat om aan te geven hoe betrouwbaar de accuracy waarde is.
Per classificatie zijn steeds twee accuracy assessments uitgevoerd. De error matrix
van het accuracy assessment is steeds berekend op basis van de TTAmask én op basis
31
van samples (die gemaakt zijn van hetzelfde TTAmask met de functie “create samples
from TTAmask”). Hoe het komt dat de error matrix die het accuracy assessment geeft
verschillend is, is niet duidelijk.
De accuracy is nu afhankelijk van twee TTAmasks. Eerst is er een classificatie
opgezet met een mask, en vervolgens wordt deze beoordeeld met een ander mask. Er
is geprobeerd om segmenten niet in beide masks in te delen, maar dit kan soms toch
per ongeluk gebeurd zijn. Na het indelen wordt de accuracy bepaald. Dit heeft tot
gevolg dat de gekozen mask twee keer van invloed is op de totale betrouwbaarheid
van de accuracy. Deze methode is hierdoor erg afhankelijk van de keuze die wordt
gemaakt door de persoon die de mask maakt. Door willekeurig (dus geautomatiseerd)
een vast aantal punten per klasse aan te wijzen zou de methode minder afhankelijk
worden van menselijke keuzes.
Bovendien zit er altijd een aantal “twijfelgevallen” bij de segmenten. Dit zijn
segmenten die eigenlijk uit meerdere vegetatiestructuren bestaan waarvan er niet een
type aangewezen kan worden als dominant. Als dit segment meerdere malen met de
hand zou moeten worden ingedeeld zou het mogelijk zijn dat er steeds een andere
keuze wordt gemaakt. Ook wanneer de classificatie dus geheel met de hand zou
gebeuren zou de accuracy niet op 100% liggen.
Verdere aanbevelingen
In dit onderzoek is veel tijd besteed aan problemen die het gevolg waren van het feit
dat er nog maar weinig onderzoek is gedaan (of gepubliceerd) aan kartering met
behulp van Definiens Developer. Na dit onderzoek kunnen uit de problemen en
oplossingen die zijn ondervonden aanbevelingen worden gedaan voor
vervolg(deel)onderzoek, waardoor volgende onderzoeken sneller of beter resultaat
kunnen krijgen.
- De luchtfoto’s van hetzelfde jaar en van verschillende jaren waren nu niet
altijd vergelijkbaar. Als er luchtfoto’s gebruikt zouden worden die wel
vergelijkbaar zijn, kan uitgesloten worden dat dit een bron van fouten is. Het
is wel belangrijk dat de bewerkingen die gedaan zijn om de foto’s
vergelijkbaar te maken, geen invloed hebben op de eigenschappen van de
foto’s.
32
- Vanwege de grootte van de bestanden die gebruikt worden, is de rekentijd
voor de computer vaak erg lang. Een snellere computer, of een
computercluster, zal de rekentijd kunnen verkleinen. Bovendien zou het
daardoor mogelijk zijn om te werken met kleinere segmenten, waardoor de
classificatie nauwkeuriger zou kunnen worden. Het kiezen voor een hogere
segmentatieparameter om een acceptabele rekentijd te verkrijgen, is in dit
onderzoek gedeeltelijk ten koste gegaan van de precisie van de segmentatie.
- Het is gebleken dat de oppervlakte per klasse sterk afhangt van de
nauwkeurigheid van de classificatie. Het zou goed zijn om onderscheid te
kunnen maken in oppervlaktevariatie als gevolg van de nauwkeurigheid van
de classificatie en als gevolg van veranderingen in de luchtfoto’s (en dus
werkelijkheid). Wellicht is er een relatief eenvoudige statistische toets te
vinden die het mogelijk maakt classificaties met elkaar te vergelijken
waardoor kan worden vastgesteld of de werkelijkheid significant is veranderd.
- De segmentatie moet nog verbeterd worden, zodat er slechts één vegetatietype
in elk segment zit.
- De werking van “Feature space optimazation” zou verder onderzocht kunnen
worden, zodat deze gebruikt kan worden voor het vinden van de juiste
features. Het is wel belangrijk om ook de werking te begrijpen als deze functie
gebruikt gaat worden zodat de resultaten correct geïnterpreteerd worden.
- Bij onderzoek naar onderscheidende features van een vegetatiestructuur is het
vooral waardevol als deze features algemeen gelden en niet alleen voor het
onderzochte gebied. Dan kunnen de uitkomsten van zo een onderzoek ook
gebruikt worden om luchtopnames van verschillende tijdstippen en plaatsen te
vergelijken.
- Het uitzoeken en aanwijzen van trainings en testsamples gebeurt nu met de
hand. Als het mogelijk is om een manier te ontwikkelen/gebruiken om de
segmenten die in een mask worden gebruikt willekeurig te kiezen, kan de
betrouwbaarheid van de accuracy toenemen.
33
Literatuur
Boeken
Gemeentewaterleidingen Amsterdam, 2001, Struinen in de toekomst (beheersvisie
voor de Amsterdamse Waterleidingduinen 2001-2010), Geelen, L. (red.),
Stadsdrukkerij Amsterdam
Haaf, M.ten, Classificeren van duinvegetatie m.b.v. Ecognition, Universiteit Utrecht
Koeman, S., 2005 Classificatie van digitale infrarood luchtfoto’s van door PWN
beheerde duingebieden met de extensie DICRANUM, Universiteit Utrecht
Nol, L., 2003 Classificatie van open zand tussen Bergen en Egmond d.m.v. luchtfoto’s
uit verschillende jaren, Universiteit van Amsterdam,
Internet
Widayati, A., Verbist, B., Meijerink, A., Application of combined pixel-bases and spatial-based approaches for improved mixed vegetation classification using ikonos, http://www.itc.nl/library/Papers/MEIJERINK.application.ACRS.2002.pdf University of South Carolina, Remote sensing core curriculum http://www.cas.sc.edu/geog/rslab/rscc/mod8/exercises/CROSSCLASS.HTM
34
35
Inhoudsopgave bijlagen Bijlage 1
Uitgevoerde classificaties b-1
Bijlage 2
Gebruikte masks b-2
Bijlage 3
Vegetatieoppervlaktes b-3
Bijlage 4
Afbeelding classificaties 201 t/m 210 b-4
Bijlage 5
Afbeelding hoogstruweel 2001-2006 b-11
Bijlage 6
Vegetatiekaart 2006 b-12