Dziennik zawodowych praktyk studenckich, specjalność trenerska
GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja
description
Transcript of GEOSTATYSTYKA Ćwiczenia dla III roku Geografii specjalność - geoinformacja
GEOSTATYSTYKAĆwiczenia dla III roku Geografii
specjalność - geoinformacja
Alfred StachInstytut Paleogeografii i Geoekologii
Wydział Nauk Geograficznych i Geologicznych UAM
Historia geostatystyki• Pierwsze koncepcje: lata 1938 – 1956• Sformułowanie podstaw teoretycznych nowej
dziedziny nauki i zaproponowanie nazwy: 1962/1963
• Rozwój teorii – nauka dla wąskiej grupy „wtajemniczonych”: 1963 – 1989
• Pierwszy publicznie dostępny program geostatystyczny pracujący na komputerach osobistych (PC w systemie MS DOS) Geo-EAS: 1989
• Pierwsza edycja biblioteki algorytmów geostatystycznych GsLIB z publicznie dostępnym kodem źródłowym: 1992
• Żywiołowy rozwój teorii i zastosowań geostatystyki: po 1992 roku
Impulsy rozwoju geostatystyki• Geostatystyka to stosunkowo proste,
ale masowe numeryczne przetwarzanie danych (głównie rachunek macierzowy).
• Powszechne zastosowanie wymaga:– dostępności algorytmów,– względnie tanich komputerów do użytku
osobistego wyposażonych w odpowiednią pamięć i moc obliczeniową
• Oba te warunki zostały spełnione na przełomie lat 80 i 90 ubiegłego wieku
Publikacje z zakresu geostatystyki
Roczna ilość artykułów (NO. P), suma cytowań (TC), średnia impact factors (MIF), roczna ilość cytowań na pojedynczą publikację (ACPP) w okresie lat 1972 do 2005
Uwaga: “1” i “34” określają odpowiednio rok 1972 i 2005.
Rok 1992
Kategorie oprogramowania geostatystycznego:I. specjalistyczne programy komercyjnie
Kategorie oprogramowania geostatystycznego:
II. Procedury w specjalistycznym oprogramowaniu dla geologów(ocena zasobów złóż kopalin – głownie węglowodorów)
Kategorie oprogramowania geostatystycznego:III. Wbudowane procedury lub dodatkowe moduły w komercyjnych pakietach GIS
Kategorie oprogramowania geostatystycznego:III. Wbudowane procedury lub dodatkowe moduły w komercyjnych pakietach GIS
Kategorie oprogramowania geostatystycznego:IV. Wbudowane procedury lub dodatkowe moduły w pakietach GIS typu open source
Kategorie oprogramowania geostatystycznego:V. Wbudowane procedury lub dodatkowe moduły w komercyjnych pakietach statystycznych (matematycznych)
Kategorie oprogramowania geostatystycznego:
V. Wbudowane procedury lub dodatkowe moduły w komercyjnych pakietach statystycznych
Kategorie oprogramowania geostatystycznego:VI. Geostatystyka w CRAN R – oprogramowanie statystyczne typu open source
geoR Analysis of geostatistical data
gstat Geostatistical modelling, prediction and simulation
ramps Bayesian Geostatistical Modeling with RAMPS
sgeostat An Object-oriented Framework for Geostatistical Modeling in S+
Kategorie oprogramowania geostatystycznego:VI. Publicznie dostępne oprogramowanie z chronionym kodem źródłowym
Kategorie oprogramowania geostatystycznego:VII. Publicznie dostępne oprogramowanie typu open source
Kategorie oprogramowania geostatystycznego:VIII. Publikowane w Computers & Geosciences kody źródłowe algorytmów
Kategorie oprogramowania geostatystycznego:IX. Oprogramowanie dydaktyczne
Kategorie oprogramowania geostatystycznego:Podsumowanie • Specjalistyczne programy komercyjnie: Isatis, GS+• Procedury w specjalistycznym oprogramowaniu dla geologów:
RML-HereSIM, LevySIM, GMS, RockWorks• Wbudowane procedury lub dodatkowe moduły w komercyjnych
pakietach GIS: Idrisi, ArcGIS, MapInfo• Wbudowane procedury lub dodatkowe moduły w pakietach GIS
typu open source: SAGA, ILWIS• Wbudowane procedury lub dodatkowe moduły w komercyjnych
pakietach statystycznych (matematycznych): GenStat, S-Plus, MatLab
• Geostatystyka w CRAN R – oprogramowanie statystyczne typu open source: gstat, geoR
• Publicznie dostępne oprogramowanie z chronionym kodem źródłowym: Vesper, VarioWin
• Publicznie dostępne oprogramowanie typu open source: GsLib, S-GeMS, gstat, UNCERT
• Publikowane w Computers & Geosciences kody źródłowe algorytmów• Oprogramowanie dydaktyczne: E(Z)-Kriging
Typowy przebieg analizy geostatystycznej
Pozyskanie i wstępnaweryfikacja danych
Eksploracja danych:nieprzestrzenna i przestrzenna
Budowa probalistycznego modelustruktury przestrzennej analizowanego
cechy
Weryfikacja modelu. Estymacja i ocena jej jakości.Symulacje. Optymalizacja
Oprogramowanie geostatystyczne które będziemy używać na ćwiczeniach• Oprogramowanie do modelowania
geostatystycznego (S-GeMS – Stanford Geostatistical Modeling Software) wersja 2.0
• Biblioteka oprogramowania geostatystycznego GsLib v. 2
• Oprogramowanie do analiz i modelowania struktury przestrzennej danych dwuwymiarowych VARIOWIN v. 2.21
• Program LCMFIT2 służący automatycznego obliczania (dopasowania) Liniowych Modeli Koregionalizacji (Linear Coregionalization Model).
• Program NEWCOKB3D będący nową, rozszerzoną wersją procedury estymacji za pomocą kokrigingu z biblioteki GsLib
Oprogramowanie uzupełniające
• AFPL Ghostscript – interpretator języka PostScript i Ghostview – interfejs graficzny dla Ghostscript oraz Pstoedit – konwerter plików PS
• Program do analizy graficznej danych przestrzennych 3Plot wersja 4.60
• Program do nauki podstaw algorytmu krigingu E{Z}-Kriging v. 0.2
• Skoroszyt Excela zawierający prosty przykład formuł obliczeniowych krigingu wraz z wizualizacją modelu semiwariancji, obserwowanych wartości i estymacji oraz wag.
S-GeMS (http://sgems.sourceforge.net/)
• Oprogramowanie do modelowania geostatystycznego (S-GeMS – Stanford Geostatistical Modeling Software) wersja 2.0 opracowany na Uniwersytecie Stanforda w USA i opisany w publikacjach:
Remy, N., 2004: Geostatistical Earth Modeling Software: User’s Manual. Stanford University, May 2004, 1-87.
Remy, N., 2004: S-GEMS: The Stanford Geostatistical Modeling Software: a tool for new algorithms development. [w:] O. Leuangthong
and C. V. Deutsch (eds.), Geostatistics Banff 2004, 865–871.
S-GeMS (http://sgems.sourceforge.net/)
• S-GeMS jest oparty na bibliotece algorytmów geostatystycznych napisanych w ANSI C++ i dostępnej publicznie pod nazwą GsTL.
• Umożliwia on modelowanie i wizualizację danych trójwymiarowych w oparciu zarówno o graficzny interfejs użytkownika, jak i w trybie znakowym (wsadowym).
• Kod źródłowy jest powszechnie dostępny, a struktura programu umożliwia łatwe dodawanie nowych procedur w postaci „wtyczek” (plug-ins).
• Ponieważ w S-GeMS wykorzystywane są jedynie biblioteki dostępne dla większości systemów operacyjnych istnieją jego wersje dla Unixa, Linuxa, Windows i Mac OSX
• Oprócz klasycznych algorytmów estymacji i symulacji jedno/wielozmiennej S-GeMS zawiera również nowe metody symulacji w oparciu o statystyki wielopunktowe.
S-GeMS (http://sgems.sourceforge.net/)
GsLIB v. 2• Biblioteka oprogramowania
geostatystycznego GsLib v. 2 opracowana na Uniwersytecie Stanforda (Kalifornia, USA) i opisana w publikacji:Deutsch, C.V., Journel, A.G., 1998: GSLIB: Geostatistical software library and user’s guide. Second Edition. Oxford University Press, New York, 1-369 + CD.
http://pangea.stanford.edu/ERE/research/scrf/software
(najnowszy kod źródłowy)http://www.gslib.com/ (programy skompilowane
dla DOS/Windows)
GsLib – informacje ogólneProgramy należące do biblioteki GsLib v. 2.x są napisane w języku Fortran 90 i nie zawierają żadnych procedur graficznych i innych związanych z konkretnym systemem operacyjnym, czy też określoną platformą sprzętową. Dzięki temu mogą być kompilowane i uruchamiane zarówno na komputerach z DOS/Windows, MacOs czy też różnych odmianach UNIX. Jest to oprogramowanie typowo profesjonalne, przy tworzeniu którego główny nacisk nie był położony na łatwość użytkowania czyli tzw. „interfejs”, ale na przenośność, funkcjonalność i czytelność kodu źródłowego.
Biblioteka oprogramo-wania geostatys-tycznego GsLib v. 2 – przykład kodu źródłowego – Fortran 90
Biblioteka oprogramo-wania geostatys-tycznego GsLib v. 2 – przykład kodu źródłowego – Fortran 90
Biblioteka oprogramo-wania geostatys-tycznego GsLib v. 2 – przykład kodu źródłowego – Fortran 90
GsLib – zasady pracy
Programy z biblioteki GsLib uruchamiane są z wiersza poleceń według ogólnego wzoru:
„Ścieżka dostępu\Nazwa pliku programu wykonywalnego z biblioteki – Spacja – Ścieżka dostępu\Nazwa pliku wsadowego z parametrami”
czyli na przykład:
C:\Program Files\Statios\Gslib90\Histplt.exe C:\Praca\Pomiary04\Histplt.par
GsLib – zasady pracyPlik wsadowy zawierający zestaw danych
potrzebnych do prawidłowego przeprowadzenia obliczeń – zwany jest plikiem parametrów. Jest to zwykły plik tekstowy mający domyślnie rozszerzenie *.PAR. Można go przygotować przy pomocy każdego edytora tworzącego pliki w „czystym” kodzie ASCII. W Windows najlepiej do tego celu używać Notatnika. Jeśli program należący do biblioteki GsLib uruchomi się bez podania nazwy i lokalizacji pliku parametrów, na ekranie pojawi się komunikat, zbliżony do zamieszczonego poniżej:
GsLib – zasady pracyNaciśnięcie klawisza Enter wygeneruje wtedy
następujący komunikat:
Program sygnalizuje błąd braku pliku z parametrami i jednocześnie informuje o wygenerowaniu wzorcowego (blank) takiego pliku, który może użytkownikowi posłużyć jako szablon do przygotowania własnej jego wersji.
GsLib – zasady pracyUwaga!Utworzony wzorcowy plik parametrów ma nazwę
identyczną jak program z biblioteki GsLib, który go wygenerował. Na przykład uruchomienie programu Histplt.exe bez podania nazwy pliku parametrów spowoduje powstanie pliku Histplt.par
Ponowne uruchomienie programu Histplt.exe bez podania nazwy pliku parametrów, spowoduje że zostanie domyślnie załadowany i wykonany plik Histplt.par. Efektem tego będzie komunikat o błędzie, zawierający informację o braku pliku danych:
GsLib – program HistpltProgram Histplt.exe oblicza podstawowe statystyki
opisowe dla zmiennej i kreśli jej histogram.Poniżej zmieszczono wzorcowy plik parametrów
programu Histplt.
Biblioteka oprogramo-wania geostatys-tycznego GsLib v. 2 – przykład pliku definiującegoobliczenia w trybie wsadowym(parametr file)
Oprogramowanie uzupełniającehttp://www-sst.unil.ch/research/variowin/index.html
• Oprogramowanie do analiz dwuwymiarowych danych przestrzennych VARIOWIN v. 2.21 opracowany na Uniwersytecie w Lozannie, Szwajcaria, i opisane w publikacji:
Pannatier, Y., 1996: VARIOWIN: Software for Spatial Data Analysis in 2D. Springer-Verlag, New York, 1-91.
Oprogramowanie uzupełniające http://www.ibrae.ac.ru/~mkanev/eng/3plot.html
Program do analizy graficznej danych przestrzennych 3Plot wersja 4.60 autorstwa M. Kaniewskiego, E.
Sawieljewej, S. Czernowa, W. Demianowa i W. Timonina z
Instytutu Bezpeczeństwa Jądrowego z Moskwy i opisany w publikacji:
Kaniewski, M., Czernow, S., Demianow, W., 1998: 3Plot Software: Advanced
Spatial Data Plot. IBRAE, Moscow, 1-29.
Oprogramowanie uzupełniające
• Program do nauki podstaw algorytmu krigingu E{Z}-Kriging v. 0.2 opracowany Dennisa J. J. Walvoorta z Uniwersytetu w Wagenigen, Holandia
http://www.ai-geostats.org/index.php?id=114
Oprogramowanie uzupełniające
• Wybrane programy (LCMFIT2,
NEWCOKB3D), których kody źródłowe opublikowano w czasopiśmie Computers & Geosciences
• http://www.iamg.org/index.php?option=com_content&task=category§ionid=19&id=44&Itemid=165
• http://207.176.140.93/documents/oldftp/VOL28/v28-08-01.zip
• http://207.176.140.93/documents/oldftp/VOL25/v25-6-2.zip
Oprogramowanie narzędziowe
• AFPL Ghostscript – interpretator języka PostScript
• Ghostview – interfejs graficzny dla Ghostscript
http://www.cs.wisc.edu/~ghost/• Pstoedit – program do
konwersji plików postscriptowych do innych formatów wektorowych
http://www.pstoedit.net
http://www.geoinfo.amu.edu.pl/staff/astach/geostat01.htm
Źródełko wiedzy i danych:
Format plików danychw oprogramowaniu geostatystycznym
• W roku 1989 pojawia się pierwszy publicznie dostępny (bezpłatny) program komputerowy do analiz geostatystycznych sponsorowany przez USA EPA – Geo-EAS:
Englund, E., Sparks, A., 1991: Geo-EAS 1.2.1 User’s Guide. EPA report #60018-91/008, EPA-EMSL, Las Vegas, NV.
Format plików danychw oprogramowaniu geostatystycznym
• Wprowadzony przez twórców programu format plików danych został powszechnie zaakceptowany i jest stosowany w postaci uproszczonej (simplified Geo-EAS format) między innymi w S-GeMS, GsLib i Variowin
• Pliki w tym formacie zapisywane są w postaci tekstowej (ASCII), czyli możliwej do edycji w każdym edytorze tekstowym niezależnie od platformy sprzętowej
Format plików danychw oprogramowaniu geostatystycznym
• Pierwsza linia zawiera nazwę pliku.• W drugiej linii zapisuje się liczbę zmiennych (Nvar).• Od linii 3 to linii 3+Nvar znajdują się nazwy
poszczególnych zmiennych, które nie mogą być dłuższe niż 10 znaków.
• Kolejnych linie zawierają wartości próbek ze zmiennymi uszeregowanymi w tej samej kolejności w jakiej są one wymienione w nagłówku. Kolumny z wartościami mogą być rozdzielone spacjami lub znakami tabulacji. Nazwy próbek muszą być „otoczone” pojedynczym apostrofem np. ‘próbka 1’, i muszą być na końcu wiersza.
• Wszystkie wartości równe lub większe od 1.0E+31 są traktowane jako brakujące (Variowin).
Format plików danychGeo-EAS
przykład