GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

44
GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja Alfred Stach Instytut Paleogeografii i Geoekologii Wydział Nauk Geograficznych i Geologicznych UAM

description

GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja. Alfred Stach Instytut Paleogeografii i Geoekologii Wydział Nauk Geograficznych i Geologicznych UAM. Historia geostatystyki. Pierwsze koncepcje: lata 1938 – 1956 - PowerPoint PPT Presentation

Transcript of GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Page 1: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

GEOSTATYSTYKAĆwiczenia dla III roku Geografii

specjalność - geoinformacja

Alfred StachInstytut Paleogeografii i Geoekologii

Wydział Nauk Geograficznych i Geologicznych UAM

Page 2: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Historia geostatystyki• Pierwsze koncepcje: lata 1938 – 1956• Sformułowanie podstaw teoretycznych nowej

dziedziny nauki i zaproponowanie nazwy: 1962/1963

• Rozwój teorii – nauka dla wąskiej grupy „wtajemniczonych”: 1963 – 1989

• Pierwszy publicznie dostępny program geostatystyczny pracujący na komputerach osobistych (PC w systemie MS DOS) Geo-EAS: 1989

• Pierwsza edycja biblioteki algorytmów geostatystycznych GsLIB z publicznie dostępnym kodem źródłowym: 1992

• Żywiołowy rozwój teorii i zastosowań geostatystyki: po 1992 roku

Page 3: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Impulsy rozwoju geostatystyki• Geostatystyka to stosunkowo proste,

ale masowe numeryczne przetwarzanie danych (głównie rachunek macierzowy).

• Powszechne zastosowanie wymaga:– dostępności algorytmów,– względnie tanich komputerów do użytku

osobistego wyposażonych w odpowiednią pamięć i moc obliczeniową

• Oba te warunki zostały spełnione na przełomie lat 80 i 90 ubiegłego wieku

Page 4: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Publikacje z zakresu geostatystyki

Roczna ilość artykułów (NO. P), suma cytowań (TC), średnia impact factors (MIF), roczna ilość cytowań na pojedynczą publikację (ACPP) w okresie lat 1972 do 2005

Uwaga: “1” i “34” określają odpowiednio rok 1972 i 2005.

Rok 1992

Page 5: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Kategorie oprogramowania geostatystycznego:I. specjalistyczne programy komercyjnie

Page 6: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Kategorie oprogramowania geostatystycznego:

II. Procedury w specjalistycznym oprogramowaniu dla geologów(ocena zasobów złóż kopalin – głownie węglowodorów)

Page 7: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Kategorie oprogramowania geostatystycznego:III. Wbudowane procedury lub dodatkowe moduły w komercyjnych pakietach GIS

Page 8: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Kategorie oprogramowania geostatystycznego:III. Wbudowane procedury lub dodatkowe moduły w komercyjnych pakietach GIS

Page 9: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Kategorie oprogramowania geostatystycznego:IV. Wbudowane procedury lub dodatkowe moduły w pakietach GIS typu open source

Page 10: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Kategorie oprogramowania geostatystycznego:V. Wbudowane procedury lub dodatkowe moduły w komercyjnych pakietach statystycznych (matematycznych)

Page 11: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Kategorie oprogramowania geostatystycznego:

V. Wbudowane procedury lub dodatkowe moduły w komercyjnych pakietach statystycznych

Page 12: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Kategorie oprogramowania geostatystycznego:VI. Geostatystyka w CRAN R – oprogramowanie statystyczne typu open source

geoR Analysis of geostatistical data

gstat Geostatistical modelling, prediction and simulation

ramps Bayesian Geostatistical Modeling with RAMPS

sgeostat An Object-oriented Framework for Geostatistical Modeling in S+

Page 13: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Kategorie oprogramowania geostatystycznego:VI. Publicznie dostępne oprogramowanie z chronionym kodem źródłowym

Page 14: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Kategorie oprogramowania geostatystycznego:VII. Publicznie dostępne oprogramowanie typu open source

Page 15: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Kategorie oprogramowania geostatystycznego:VIII. Publikowane w Computers & Geosciences kody źródłowe algorytmów

Page 16: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Kategorie oprogramowania geostatystycznego:IX. Oprogramowanie dydaktyczne

Page 17: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Kategorie oprogramowania geostatystycznego:Podsumowanie • Specjalistyczne programy komercyjnie: Isatis, GS+• Procedury w specjalistycznym oprogramowaniu dla geologów:

RML-HereSIM, LevySIM, GMS, RockWorks• Wbudowane procedury lub dodatkowe moduły w komercyjnych

pakietach GIS: Idrisi, ArcGIS, MapInfo• Wbudowane procedury lub dodatkowe moduły w pakietach GIS

typu open source: SAGA, ILWIS• Wbudowane procedury lub dodatkowe moduły w komercyjnych

pakietach statystycznych (matematycznych): GenStat, S-Plus, MatLab

• Geostatystyka w CRAN R – oprogramowanie statystyczne typu open source: gstat, geoR

• Publicznie dostępne oprogramowanie z chronionym kodem źródłowym: Vesper, VarioWin

• Publicznie dostępne oprogramowanie typu open source: GsLib, S-GeMS, gstat, UNCERT

• Publikowane w Computers & Geosciences kody źródłowe algorytmów• Oprogramowanie dydaktyczne: E(Z)-Kriging

Page 18: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Typowy przebieg analizy geostatystycznej

Pozyskanie i wstępnaweryfikacja danych

Eksploracja danych:nieprzestrzenna i przestrzenna

Budowa probalistycznego modelustruktury przestrzennej analizowanego

cechy

Weryfikacja modelu. Estymacja i ocena jej jakości.Symulacje. Optymalizacja

Page 19: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Oprogramowanie geostatystyczne które będziemy używać na ćwiczeniach• Oprogramowanie do modelowania

geostatystycznego (S-GeMS – Stanford Geostatistical Modeling Software) wersja 2.0

• Biblioteka oprogramowania geostatystycznego GsLib v. 2

• Oprogramowanie do analiz i modelowania struktury przestrzennej danych dwuwymiarowych VARIOWIN v. 2.21

• Program LCMFIT2 służący automatycznego obliczania (dopasowania) Liniowych Modeli Koregionalizacji (Linear Coregionalization Model).

• Program NEWCOKB3D będący nową, rozszerzoną wersją procedury estymacji za pomocą kokrigingu z biblioteki GsLib

Page 20: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Oprogramowanie uzupełniające

• AFPL Ghostscript – interpretator języka PostScript i Ghostview – interfejs graficzny dla Ghostscript oraz Pstoedit – konwerter plików PS

• Program do analizy graficznej danych przestrzennych 3Plot wersja 4.60

• Program do nauki podstaw algorytmu krigingu E{Z}-Kriging v. 0.2

• Skoroszyt Excela zawierający prosty przykład formuł obliczeniowych krigingu wraz z wizualizacją modelu semiwariancji, obserwowanych wartości i estymacji oraz wag.

Page 21: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

S-GeMS (http://sgems.sourceforge.net/)

• Oprogramowanie do modelowania geostatystycznego (S-GeMS – Stanford Geostatistical Modeling Software) wersja 2.0 opracowany na Uniwersytecie Stanforda w USA i opisany w publikacjach:

Remy, N., 2004: Geostatistical Earth Modeling Software: User’s Manual. Stanford University, May 2004, 1-87.

Remy, N., 2004: S-GEMS: The Stanford Geostatistical Modeling Software: a tool for new algorithms development. [w:] O. Leuangthong

and C. V. Deutsch (eds.), Geostatistics Banff 2004, 865–871.

Page 22: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

S-GeMS (http://sgems.sourceforge.net/)

• S-GeMS jest oparty na bibliotece algorytmów geostatystycznych napisanych w ANSI C++ i dostępnej publicznie pod nazwą GsTL.

• Umożliwia on modelowanie i wizualizację danych trójwymiarowych w oparciu zarówno o graficzny interfejs użytkownika, jak i w trybie znakowym (wsadowym).

• Kod źródłowy jest powszechnie dostępny, a struktura programu umożliwia łatwe dodawanie nowych procedur w postaci „wtyczek” (plug-ins).

• Ponieważ w S-GeMS wykorzystywane są jedynie biblioteki dostępne dla większości systemów operacyjnych istnieją jego wersje dla Unixa, Linuxa, Windows i Mac OSX

• Oprócz klasycznych algorytmów estymacji i symulacji jedno/wielozmiennej S-GeMS zawiera również nowe metody symulacji w oparciu o statystyki wielopunktowe.

Page 23: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

S-GeMS (http://sgems.sourceforge.net/)

Page 24: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

GsLIB v. 2• Biblioteka oprogramowania

geostatystycznego GsLib v. 2 opracowana na Uniwersytecie Stanforda (Kalifornia, USA) i opisana w publikacji:Deutsch, C.V., Journel, A.G., 1998: GSLIB: Geostatistical software library and user’s guide. Second Edition. Oxford University Press, New York, 1-369 + CD.

http://pangea.stanford.edu/ERE/research/scrf/software

(najnowszy kod źródłowy)http://www.gslib.com/ (programy skompilowane

dla DOS/Windows)

Page 25: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

GsLib – informacje ogólneProgramy należące do biblioteki GsLib v. 2.x są napisane w języku Fortran 90 i nie zawierają żadnych procedur graficznych i innych związanych z konkretnym systemem operacyjnym, czy też określoną platformą sprzętową. Dzięki temu mogą być kompilowane i uruchamiane zarówno na komputerach z DOS/Windows, MacOs czy też różnych odmianach UNIX. Jest to oprogramowanie typowo profesjonalne, przy tworzeniu którego główny nacisk nie był położony na łatwość użytkowania czyli tzw. „interfejs”, ale na przenośność, funkcjonalność i czytelność kodu źródłowego.

Page 26: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Biblioteka oprogramo-wania geostatys-tycznego GsLib v. 2 – przykład kodu źródłowego – Fortran 90

Page 27: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Biblioteka oprogramo-wania geostatys-tycznego GsLib v. 2 – przykład kodu źródłowego – Fortran 90

Page 28: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Biblioteka oprogramo-wania geostatys-tycznego GsLib v. 2 – przykład kodu źródłowego – Fortran 90

Page 29: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

GsLib – zasady pracy

Programy z biblioteki GsLib uruchamiane są z wiersza poleceń według ogólnego wzoru:

„Ścieżka dostępu\Nazwa pliku programu wykonywalnego z biblioteki – Spacja – Ścieżka dostępu\Nazwa pliku wsadowego z parametrami”

czyli na przykład:

C:\Program Files\Statios\Gslib90\Histplt.exe C:\Praca\Pomiary04\Histplt.par

Page 30: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

GsLib – zasady pracyPlik wsadowy zawierający zestaw danych

potrzebnych do prawidłowego przeprowadzenia obliczeń – zwany jest plikiem parametrów. Jest to zwykły plik tekstowy mający domyślnie rozszerzenie *.PAR. Można go przygotować przy pomocy każdego edytora tworzącego pliki w „czystym” kodzie ASCII. W Windows najlepiej do tego celu używać Notatnika. Jeśli program należący do biblioteki GsLib uruchomi się bez podania nazwy i lokalizacji pliku parametrów, na ekranie pojawi się komunikat, zbliżony do zamieszczonego poniżej:

Page 31: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

GsLib – zasady pracyNaciśnięcie klawisza Enter wygeneruje wtedy

następujący komunikat:

Program sygnalizuje błąd braku pliku z parametrami i jednocześnie informuje o wygenerowaniu wzorcowego (blank) takiego pliku, który może użytkownikowi posłużyć jako szablon do przygotowania własnej jego wersji.

Page 32: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

GsLib – zasady pracyUwaga!Utworzony wzorcowy plik parametrów ma nazwę

identyczną jak program z biblioteki GsLib, który go wygenerował. Na przykład uruchomienie programu Histplt.exe bez podania nazwy pliku parametrów spowoduje powstanie pliku Histplt.par

Ponowne uruchomienie programu Histplt.exe bez podania nazwy pliku parametrów, spowoduje że zostanie domyślnie załadowany i wykonany plik Histplt.par. Efektem tego będzie komunikat o błędzie, zawierający informację o braku pliku danych:

Page 33: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

GsLib – program HistpltProgram Histplt.exe oblicza podstawowe statystyki

opisowe dla zmiennej i kreśli jej histogram.Poniżej zmieszczono wzorcowy plik parametrów

programu Histplt.

Page 34: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Biblioteka oprogramo-wania geostatys-tycznego GsLib v. 2 – przykład pliku definiującegoobliczenia w trybie wsadowym(parametr file)

Page 35: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Oprogramowanie uzupełniającehttp://www-sst.unil.ch/research/variowin/index.html

• Oprogramowanie do analiz dwuwymiarowych danych przestrzennych VARIOWIN v. 2.21 opracowany na Uniwersytecie w Lozannie, Szwajcaria, i opisane w publikacji:

Pannatier, Y., 1996: VARIOWIN: Software for Spatial Data Analysis in 2D. Springer-Verlag, New York, 1-91.

Page 36: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Oprogramowanie uzupełniające http://www.ibrae.ac.ru/~mkanev/eng/3plot.html

Program do analizy graficznej danych przestrzennych 3Plot wersja 4.60 autorstwa M. Kaniewskiego, E.

Sawieljewej, S. Czernowa, W. Demianowa i W. Timonina z

Instytutu Bezpeczeństwa Jądrowego z Moskwy i opisany w publikacji:

Kaniewski, M., Czernow, S., Demianow, W., 1998: 3Plot Software: Advanced

Spatial Data Plot. IBRAE, Moscow, 1-29.

Page 37: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Oprogramowanie uzupełniające

• Program do nauki podstaw algorytmu krigingu E{Z}-Kriging v. 0.2 opracowany Dennisa J. J. Walvoorta z Uniwersytetu w Wagenigen, Holandia

http://www.ai-geostats.org/index.php?id=114

Page 38: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Oprogramowanie uzupełniające

• Wybrane programy (LCMFIT2,

NEWCOKB3D), których kody źródłowe opublikowano w czasopiśmie Computers & Geosciences

• http://www.iamg.org/index.php?option=com_content&task=category&sectionid=19&id=44&Itemid=165

• http://207.176.140.93/documents/oldftp/VOL28/v28-08-01.zip

• http://207.176.140.93/documents/oldftp/VOL25/v25-6-2.zip

Page 39: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Oprogramowanie narzędziowe

• AFPL Ghostscript – interpretator języka PostScript

• Ghostview – interfejs graficzny dla Ghostscript

http://www.cs.wisc.edu/~ghost/• Pstoedit – program do

konwersji plików postscriptowych do innych formatów wektorowych

http://www.pstoedit.net

Page 40: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

http://www.geoinfo.amu.edu.pl/staff/astach/geostat01.htm

Źródełko wiedzy i danych:

Page 41: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Format plików danychw oprogramowaniu geostatystycznym

• W roku 1989 pojawia się pierwszy publicznie dostępny (bezpłatny) program komputerowy do analiz geostatystycznych sponsorowany przez USA EPA – Geo-EAS:

Englund, E., Sparks, A., 1991: Geo-EAS 1.2.1 User’s Guide. EPA report #60018-91/008, EPA-EMSL, Las Vegas, NV.

Page 42: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Format plików danychw oprogramowaniu geostatystycznym

• Wprowadzony przez twórców programu format plików danych został powszechnie zaakceptowany i jest stosowany w postaci uproszczonej (simplified Geo-EAS format) między innymi w S-GeMS, GsLib i Variowin

• Pliki w tym formacie zapisywane są w postaci tekstowej (ASCII), czyli możliwej do edycji w każdym edytorze tekstowym niezależnie od platformy sprzętowej

Page 43: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Format plików danychw oprogramowaniu geostatystycznym

• Pierwsza linia zawiera nazwę pliku.• W drugiej linii zapisuje się liczbę zmiennych (Nvar).• Od linii 3 to linii 3+Nvar znajdują się nazwy

poszczególnych zmiennych, które nie mogą być dłuższe niż 10 znaków.

• Kolejnych linie zawierają wartości próbek ze zmiennymi uszeregowanymi w tej samej kolejności w jakiej są one wymienione w nagłówku. Kolumny z wartościami mogą być rozdzielone spacjami lub znakami tabulacji. Nazwy próbek muszą być „otoczone” pojedynczym apostrofem np. ‘próbka 1’, i muszą być na końcu wiersza.

• Wszystkie wartości równe lub większe od 1.0E+31 są traktowane jako brakujące (Variowin).

Page 44: GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Format plików danychGeo-EAS

przykład