GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

Post on 14-Jan-2016

51 views 0 download

description

GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja. Alfred Stach Instytut Paleogeografii i Geoekologii Wydział Nauk Geograficznych i Geologicznych UAM. Historia geostatystyki. Pierwsze koncepcje: lata 1938 – 1956 - PowerPoint PPT Presentation

Transcript of GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja

GEOSTATYSTYKAĆwiczenia dla III roku Geografii

specjalność - geoinformacja

Alfred StachInstytut Paleogeografii i Geoekologii

Wydział Nauk Geograficznych i Geologicznych UAM

Historia geostatystyki• Pierwsze koncepcje: lata 1938 – 1956• Sformułowanie podstaw teoretycznych nowej

dziedziny nauki i zaproponowanie nazwy: 1962/1963

• Rozwój teorii – nauka dla wąskiej grupy „wtajemniczonych”: 1963 – 1989

• Pierwszy publicznie dostępny program geostatystyczny pracujący na komputerach osobistych (PC w systemie MS DOS) Geo-EAS: 1989

• Pierwsza edycja biblioteki algorytmów geostatystycznych GsLIB z publicznie dostępnym kodem źródłowym: 1992

• Żywiołowy rozwój teorii i zastosowań geostatystyki: po 1992 roku

Impulsy rozwoju geostatystyki• Geostatystyka to stosunkowo proste,

ale masowe numeryczne przetwarzanie danych (głównie rachunek macierzowy).

• Powszechne zastosowanie wymaga:– dostępności algorytmów,– względnie tanich komputerów do użytku

osobistego wyposażonych w odpowiednią pamięć i moc obliczeniową

• Oba te warunki zostały spełnione na przełomie lat 80 i 90 ubiegłego wieku

Publikacje z zakresu geostatystyki

Roczna ilość artykułów (NO. P), suma cytowań (TC), średnia impact factors (MIF), roczna ilość cytowań na pojedynczą publikację (ACPP) w okresie lat 1972 do 2005

Uwaga: “1” i “34” określają odpowiednio rok 1972 i 2005.

Rok 1992

Kategorie oprogramowania geostatystycznego:I. specjalistyczne programy komercyjnie

Kategorie oprogramowania geostatystycznego:

II. Procedury w specjalistycznym oprogramowaniu dla geologów(ocena zasobów złóż kopalin – głownie węglowodorów)

Kategorie oprogramowania geostatystycznego:III. Wbudowane procedury lub dodatkowe moduły w komercyjnych pakietach GIS

Kategorie oprogramowania geostatystycznego:III. Wbudowane procedury lub dodatkowe moduły w komercyjnych pakietach GIS

Kategorie oprogramowania geostatystycznego:IV. Wbudowane procedury lub dodatkowe moduły w pakietach GIS typu open source

Kategorie oprogramowania geostatystycznego:V. Wbudowane procedury lub dodatkowe moduły w komercyjnych pakietach statystycznych (matematycznych)

Kategorie oprogramowania geostatystycznego:

V. Wbudowane procedury lub dodatkowe moduły w komercyjnych pakietach statystycznych

Kategorie oprogramowania geostatystycznego:VI. Geostatystyka w CRAN R – oprogramowanie statystyczne typu open source

geoR Analysis of geostatistical data

gstat Geostatistical modelling, prediction and simulation

ramps Bayesian Geostatistical Modeling with RAMPS

sgeostat An Object-oriented Framework for Geostatistical Modeling in S+

Kategorie oprogramowania geostatystycznego:VI. Publicznie dostępne oprogramowanie z chronionym kodem źródłowym

Kategorie oprogramowania geostatystycznego:VII. Publicznie dostępne oprogramowanie typu open source

Kategorie oprogramowania geostatystycznego:VIII. Publikowane w Computers & Geosciences kody źródłowe algorytmów

Kategorie oprogramowania geostatystycznego:IX. Oprogramowanie dydaktyczne

Kategorie oprogramowania geostatystycznego:Podsumowanie • Specjalistyczne programy komercyjnie: Isatis, GS+• Procedury w specjalistycznym oprogramowaniu dla geologów:

RML-HereSIM, LevySIM, GMS, RockWorks• Wbudowane procedury lub dodatkowe moduły w komercyjnych

pakietach GIS: Idrisi, ArcGIS, MapInfo• Wbudowane procedury lub dodatkowe moduły w pakietach GIS

typu open source: SAGA, ILWIS• Wbudowane procedury lub dodatkowe moduły w komercyjnych

pakietach statystycznych (matematycznych): GenStat, S-Plus, MatLab

• Geostatystyka w CRAN R – oprogramowanie statystyczne typu open source: gstat, geoR

• Publicznie dostępne oprogramowanie z chronionym kodem źródłowym: Vesper, VarioWin

• Publicznie dostępne oprogramowanie typu open source: GsLib, S-GeMS, gstat, UNCERT

• Publikowane w Computers & Geosciences kody źródłowe algorytmów• Oprogramowanie dydaktyczne: E(Z)-Kriging

Typowy przebieg analizy geostatystycznej

Pozyskanie i wstępnaweryfikacja danych

Eksploracja danych:nieprzestrzenna i przestrzenna

Budowa probalistycznego modelustruktury przestrzennej analizowanego

cechy

Weryfikacja modelu. Estymacja i ocena jej jakości.Symulacje. Optymalizacja

Oprogramowanie geostatystyczne które będziemy używać na ćwiczeniach• Oprogramowanie do modelowania

geostatystycznego (S-GeMS – Stanford Geostatistical Modeling Software) wersja 2.0

• Biblioteka oprogramowania geostatystycznego GsLib v. 2

• Oprogramowanie do analiz i modelowania struktury przestrzennej danych dwuwymiarowych VARIOWIN v. 2.21

• Program LCMFIT2 służący automatycznego obliczania (dopasowania) Liniowych Modeli Koregionalizacji (Linear Coregionalization Model).

• Program NEWCOKB3D będący nową, rozszerzoną wersją procedury estymacji za pomocą kokrigingu z biblioteki GsLib

Oprogramowanie uzupełniające

• AFPL Ghostscript – interpretator języka PostScript i Ghostview – interfejs graficzny dla Ghostscript oraz Pstoedit – konwerter plików PS

• Program do analizy graficznej danych przestrzennych 3Plot wersja 4.60

• Program do nauki podstaw algorytmu krigingu E{Z}-Kriging v. 0.2

• Skoroszyt Excela zawierający prosty przykład formuł obliczeniowych krigingu wraz z wizualizacją modelu semiwariancji, obserwowanych wartości i estymacji oraz wag.

S-GeMS (http://sgems.sourceforge.net/)

• Oprogramowanie do modelowania geostatystycznego (S-GeMS – Stanford Geostatistical Modeling Software) wersja 2.0 opracowany na Uniwersytecie Stanforda w USA i opisany w publikacjach:

Remy, N., 2004: Geostatistical Earth Modeling Software: User’s Manual. Stanford University, May 2004, 1-87.

Remy, N., 2004: S-GEMS: The Stanford Geostatistical Modeling Software: a tool for new algorithms development. [w:] O. Leuangthong

and C. V. Deutsch (eds.), Geostatistics Banff 2004, 865–871.

S-GeMS (http://sgems.sourceforge.net/)

• S-GeMS jest oparty na bibliotece algorytmów geostatystycznych napisanych w ANSI C++ i dostępnej publicznie pod nazwą GsTL.

• Umożliwia on modelowanie i wizualizację danych trójwymiarowych w oparciu zarówno o graficzny interfejs użytkownika, jak i w trybie znakowym (wsadowym).

• Kod źródłowy jest powszechnie dostępny, a struktura programu umożliwia łatwe dodawanie nowych procedur w postaci „wtyczek” (plug-ins).

• Ponieważ w S-GeMS wykorzystywane są jedynie biblioteki dostępne dla większości systemów operacyjnych istnieją jego wersje dla Unixa, Linuxa, Windows i Mac OSX

• Oprócz klasycznych algorytmów estymacji i symulacji jedno/wielozmiennej S-GeMS zawiera również nowe metody symulacji w oparciu o statystyki wielopunktowe.

S-GeMS (http://sgems.sourceforge.net/)

GsLIB v. 2• Biblioteka oprogramowania

geostatystycznego GsLib v. 2 opracowana na Uniwersytecie Stanforda (Kalifornia, USA) i opisana w publikacji:Deutsch, C.V., Journel, A.G., 1998: GSLIB: Geostatistical software library and user’s guide. Second Edition. Oxford University Press, New York, 1-369 + CD.

http://pangea.stanford.edu/ERE/research/scrf/software

(najnowszy kod źródłowy)http://www.gslib.com/ (programy skompilowane

dla DOS/Windows)

GsLib – informacje ogólneProgramy należące do biblioteki GsLib v. 2.x są napisane w języku Fortran 90 i nie zawierają żadnych procedur graficznych i innych związanych z konkretnym systemem operacyjnym, czy też określoną platformą sprzętową. Dzięki temu mogą być kompilowane i uruchamiane zarówno na komputerach z DOS/Windows, MacOs czy też różnych odmianach UNIX. Jest to oprogramowanie typowo profesjonalne, przy tworzeniu którego główny nacisk nie był położony na łatwość użytkowania czyli tzw. „interfejs”, ale na przenośność, funkcjonalność i czytelność kodu źródłowego.

Biblioteka oprogramo-wania geostatys-tycznego GsLib v. 2 – przykład kodu źródłowego – Fortran 90

Biblioteka oprogramo-wania geostatys-tycznego GsLib v. 2 – przykład kodu źródłowego – Fortran 90

Biblioteka oprogramo-wania geostatys-tycznego GsLib v. 2 – przykład kodu źródłowego – Fortran 90

GsLib – zasady pracy

Programy z biblioteki GsLib uruchamiane są z wiersza poleceń według ogólnego wzoru:

„Ścieżka dostępu\Nazwa pliku programu wykonywalnego z biblioteki – Spacja – Ścieżka dostępu\Nazwa pliku wsadowego z parametrami”

czyli na przykład:

C:\Program Files\Statios\Gslib90\Histplt.exe C:\Praca\Pomiary04\Histplt.par

GsLib – zasady pracyPlik wsadowy zawierający zestaw danych

potrzebnych do prawidłowego przeprowadzenia obliczeń – zwany jest plikiem parametrów. Jest to zwykły plik tekstowy mający domyślnie rozszerzenie *.PAR. Można go przygotować przy pomocy każdego edytora tworzącego pliki w „czystym” kodzie ASCII. W Windows najlepiej do tego celu używać Notatnika. Jeśli program należący do biblioteki GsLib uruchomi się bez podania nazwy i lokalizacji pliku parametrów, na ekranie pojawi się komunikat, zbliżony do zamieszczonego poniżej:

GsLib – zasady pracyNaciśnięcie klawisza Enter wygeneruje wtedy

następujący komunikat:

Program sygnalizuje błąd braku pliku z parametrami i jednocześnie informuje o wygenerowaniu wzorcowego (blank) takiego pliku, który może użytkownikowi posłużyć jako szablon do przygotowania własnej jego wersji.

GsLib – zasady pracyUwaga!Utworzony wzorcowy plik parametrów ma nazwę

identyczną jak program z biblioteki GsLib, który go wygenerował. Na przykład uruchomienie programu Histplt.exe bez podania nazwy pliku parametrów spowoduje powstanie pliku Histplt.par

Ponowne uruchomienie programu Histplt.exe bez podania nazwy pliku parametrów, spowoduje że zostanie domyślnie załadowany i wykonany plik Histplt.par. Efektem tego będzie komunikat o błędzie, zawierający informację o braku pliku danych:

GsLib – program HistpltProgram Histplt.exe oblicza podstawowe statystyki

opisowe dla zmiennej i kreśli jej histogram.Poniżej zmieszczono wzorcowy plik parametrów

programu Histplt.

Biblioteka oprogramo-wania geostatys-tycznego GsLib v. 2 – przykład pliku definiującegoobliczenia w trybie wsadowym(parametr file)

Oprogramowanie uzupełniającehttp://www-sst.unil.ch/research/variowin/index.html

• Oprogramowanie do analiz dwuwymiarowych danych przestrzennych VARIOWIN v. 2.21 opracowany na Uniwersytecie w Lozannie, Szwajcaria, i opisane w publikacji:

Pannatier, Y., 1996: VARIOWIN: Software for Spatial Data Analysis in 2D. Springer-Verlag, New York, 1-91.

Oprogramowanie uzupełniające http://www.ibrae.ac.ru/~mkanev/eng/3plot.html

Program do analizy graficznej danych przestrzennych 3Plot wersja 4.60 autorstwa M. Kaniewskiego, E.

Sawieljewej, S. Czernowa, W. Demianowa i W. Timonina z

Instytutu Bezpeczeństwa Jądrowego z Moskwy i opisany w publikacji:

Kaniewski, M., Czernow, S., Demianow, W., 1998: 3Plot Software: Advanced

Spatial Data Plot. IBRAE, Moscow, 1-29.

Oprogramowanie uzupełniające

• Program do nauki podstaw algorytmu krigingu E{Z}-Kriging v. 0.2 opracowany Dennisa J. J. Walvoorta z Uniwersytetu w Wagenigen, Holandia

http://www.ai-geostats.org/index.php?id=114

Oprogramowanie uzupełniające

• Wybrane programy (LCMFIT2,

NEWCOKB3D), których kody źródłowe opublikowano w czasopiśmie Computers & Geosciences

• http://www.iamg.org/index.php?option=com_content&task=category&sectionid=19&id=44&Itemid=165

• http://207.176.140.93/documents/oldftp/VOL28/v28-08-01.zip

• http://207.176.140.93/documents/oldftp/VOL25/v25-6-2.zip

Oprogramowanie narzędziowe

• AFPL Ghostscript – interpretator języka PostScript

• Ghostview – interfejs graficzny dla Ghostscript

http://www.cs.wisc.edu/~ghost/• Pstoedit – program do

konwersji plików postscriptowych do innych formatów wektorowych

http://www.pstoedit.net

http://www.geoinfo.amu.edu.pl/staff/astach/geostat01.htm

Źródełko wiedzy i danych:

Format plików danychw oprogramowaniu geostatystycznym

• W roku 1989 pojawia się pierwszy publicznie dostępny (bezpłatny) program komputerowy do analiz geostatystycznych sponsorowany przez USA EPA – Geo-EAS:

Englund, E., Sparks, A., 1991: Geo-EAS 1.2.1 User’s Guide. EPA report #60018-91/008, EPA-EMSL, Las Vegas, NV.

Format plików danychw oprogramowaniu geostatystycznym

• Wprowadzony przez twórców programu format plików danych został powszechnie zaakceptowany i jest stosowany w postaci uproszczonej (simplified Geo-EAS format) między innymi w S-GeMS, GsLib i Variowin

• Pliki w tym formacie zapisywane są w postaci tekstowej (ASCII), czyli możliwej do edycji w każdym edytorze tekstowym niezależnie od platformy sprzętowej

Format plików danychw oprogramowaniu geostatystycznym

• Pierwsza linia zawiera nazwę pliku.• W drugiej linii zapisuje się liczbę zmiennych (Nvar).• Od linii 3 to linii 3+Nvar znajdują się nazwy

poszczególnych zmiennych, które nie mogą być dłuższe niż 10 znaków.

• Kolejnych linie zawierają wartości próbek ze zmiennymi uszeregowanymi w tej samej kolejności w jakiej są one wymienione w nagłówku. Kolumny z wartościami mogą być rozdzielone spacjami lub znakami tabulacji. Nazwy próbek muszą być „otoczone” pojedynczym apostrofem np. ‘próbka 1’, i muszą być na końcu wiersza.

• Wszystkie wartości równe lub większe od 1.0E+31 są traktowane jako brakujące (Variowin).

Format plików danychGeo-EAS

przykład