Prezentace aplikace PowerPoint - Vítejte na stránkách ÚPSG — … · 2017-06-30 ·...

23
III. Statistické zpracování a interpretace analytických dat Vojtěch Janoušek:

Transcript of Prezentace aplikace PowerPoint - Vítejte na stránkách ÚPSG — … · 2017-06-30 ·...

III. Statistické zpracování a interpretace analytických dat

Vojtěch Janoušek:

Statistické zpracování dat

Úvod

III. Zpracování a interpretace analytických dat • Statistické vyhodnocení analytických dat • Zdroje chyb, přesnost a správnost analýzy • Systematické chyby, náhodné chyby • Odhady střední hodnoty a směrodatné odchylky • Grafická prezentace dat • Zákon o šíření chyb • ‚Detekční limity‘

Statistické zpracování dat

Statistické zpracování analytických dat

Chyby měření • systematické chyby

(míra správnosti měření = accuracy)

• náhodné chyby (míra přesnosti = precision)

• hrubé chyby (odlehlé hodnoty = ouliers)

Statistické zpracování dat

Statistické zpracování analytických dat

a) obě analýzy nesprávné, XRF nepřesná

b) obě analýzy správné, XRF nepřesná

Skutečná hodnota je 40 ppm.

(Potts, 1987)

Statistické zpracování dat

Statistické zpracování analytických dat

Systematické chyby – lze testovat pomocí statistických testů, např. Dixonův, χ2

• chyby metody (neadekvátnost použitého modelu pro daný experiment,…)

• chyby měřidel (nepřesná kalibrace, nepřesný přístroj,…)

• chyby pozorování (nepřesnost v odečítání,…)

• chyby při vyhodnocování (zaokrouhlování, chyby použitých konstant)

Statistické zpracování dat

Statistické zpracování analytických dat

Náhodné chyby • kolísají náhodně co do velikosti i znaménka

• nedají se předvídat a jsou popsány určitým pravděpodobnostním rozdělením

• náhodná veličina spojitá/nespojitá

• frekvenční křivka: graf hodnot pozorování xi versus jejich četnost (spojitá/nespojitá)

• odhad parametrů rozdělení pomocí střední hodnoty (µ) a směrodatné odchylky (S)

Statistické zpracování dat

Normální rozdělení

Statistické zpracování analytických dat

Intervaly spolehlivosti pro µ

± 1σ 68.27 % ± 2σ 95.44 % ± 3σ 99.74 %

Statistické zpracování dat

Odhady střední hodnoty

• Aritmetický průměr

• Geometrický průměr

Statistické zpracování analytických dat

∑=

=n

iix

nx

1

1

nn

iixg ∏

=

=1

Statistické zpracování dat

Odhady střední hodnoty

• Medián hodnota přesně uprostřed rozdělení četností (dělí frekvenční křivku na dvě poloviny o stejném počtu hodnot, tj. n/2)

• Modus nejčastější hodnota (maximum frekvenční křivky)

Statistické zpracování analytických dat

Statistické zpracování dat

Odhad směrodatné odchylky

• Směrodatná odchylka pro malý počet měření se n nahrazuje n-1

• Relativní směrodatná odchylka

Statistické zpracování analytických dat

∑=

−=n

ii xx

nS

1

2)(1

%100.xSSr =

Statistické zpracování dat

Odhad směrodatné odchylky II.

• Směrodatná odchylka aritmetického průměru (standard error of the mean)

Statistické zpracování analytických dat

∑=

−−

==n

iix xx

nnnSS

1

2)()1.(

1

Statistické zpracování dat

Hmotová spektrometrie

Statistické zpracování analytických dat

• odhad správnosti měření opakovaná měření standardu, jeho směrodatná odchylka

• odhad přesnosti měření směrodatná odchylka aritmetického průměru (2 s.e.)

(Thirlwall 1991)

Statistické zpracování dat

Grafická prezentace

• Histogramy

Statistické zpracování analytických dat

absolutní (relativní) četnost

Statistické zpracování dat

Grafická prezentace

• Krabicový graf (boxplot, box and whiskers plot)

Statistické zpracování analytických dat

• Box and percentile plot

Statistické zpracování dat

Statistické zpracování analytických dat

• ... atd Statistický jazyk R (Ihaka a Gentleman, 1996)

Grafická prezentace

• Stripplot

Statistické zpracování dat

Zákon o šíření chyb

∂∂

=i

xi

f ixf 2

2

.σσ

Zákon o šíření chyb

222321 321

** ttttttt σσσσ ++±−+=±

Sčítání, odčítání hodnot zatížených chybou:

Statistické zpracování dat

Zákon o šíření chyb

2

23

2

22

2

213

21 321.**ttt

ttttt ttt σσσ

σ ++±=±

Násobení, dělení hodnot zatížených chybou:

Šíření chyb při násobení konstantou:

tctct σσ ..** ±=±

Statistické zpracování dat

Zákon o šíření chyb

∑∑∑

±=±

ii

ii

iii

t ww

wtt 1σ

itiw 2

=

Vážený průměr:

kde váha wi:

Statistické zpracování dat

Zákon o šíření chyb

Porovnávání stáří t1, t2 zatížených chybou:

Porovnává se rozdíl obou stáří ∆ a chyba tohoto rozdílu na zvolené hladině významnosti k. Pokud:

tktt ∆≤−=∆ σ21

lze považovat obě stáří za statisticky stejná

Statistické zpracování dat

Zákon o šíření chyb

Z daného horninového komplexu byla získána stáří 1000 ± 100 a 1200 ± 50 mil. let.

• Určete chybu jejich rozdílu a zda jsou statisticky stejná na hladině významnosti 95 %

• Spočtěte jejich vážený průměr a jeho chybu

Statistické zpracování dat

1: 112 Ma, ne 2: 1160 ± 45 Ma (2σ)

Zákon o šíření chyb

∑∑∑

±=±

ii

ii

iii

t ww

wtt 1σ it

iw 2

=

∂∂

=i

xi

f ixf 2

2

.σσ222

321 321** ttttttt σσσσ ++±−+=±

tktt ∆≤− σ21

Statistické zpracování dat

optimistický odhad spodního limitu stanovitelnosti je uváděný např. výrobci některých analytických přístrojů. spodní limit detekce je vhodný pro kvalitativní nebo semikvantitativní analýzu. spodní limit stanovitelnosti odpovídá nejmenšímu signálu, který je možno kvantitativně měřit. limit kvantifikace je používán místo spodního limitu stanovitelnosti např. při právních sporech nebo v komerčních posudcích.

Signál pozadí je charakterizován střední hodnotou a směrodatnou odchylkou Potom:

‚Detekční limity‘

BBx σ2+

BBx σ3+

BBx σ6+

BBx σ10+

BσBx

Statistické zpracování dat

Použitá a doporučená literatura

• IHAKA, R. & GENTLEMAN, R., 1996. R: A language for data analysis and graphics. Journal of Computational and Graphical Statistics, 5, 299-344.

• JANOUŠEK, V. et al. 2016. Geochemical Modelling of Igneous Processes – Principles and Recipes in R Language. Springer-Verlag, Berlin.

• MELOUN, M. & MILITKÝ, J., 2002. Statistické kompendium zpracování analytických dat. Academia Praha.

• POTTS, P. J., 1987. A Handbook of Silicate Rock Analysis:Blackie & Son Ltd., Glasgow and London, 1-622.

• REIMANN, C. et al. 2008. Statistical Data Analysis Explained: Applied Environmental Statistics with R. John Wiley & Sons, Chichester.

• ROLLINSON H.R. 1993. Using Geochemical Data: Evaluation, Presentation, Interpretation. Longman, London.

• ROCK, N. M. S. et al. 1987. Nonparametric estimation of averages and errors for small data-sets in isotope geoscience: a proposal. Chemical Geology (Isotope Geoscience Section), 66, 163-177.

• ROCK, N. M. S., 1988. Numerical Geology. A Source Guide, Gloassary and Selective Bibliography to Geological Uses of Computers and Statistics. Lecture Notes in Earth Sciences 18:Springer, Berlin, 1-427.

• THIRLWALL, M. F., 1991. Long-term reproducibility of multicollector Sr and Nd isotope ratio analysis. Chemical Geology (Isotope Geoscience Section), 94, 85-104.