Prezentace aplikace PowerPoint - Vítejte na stránkách ÚPSG — … · 2017-06-30 ·...
Transcript of Prezentace aplikace PowerPoint - Vítejte na stránkách ÚPSG — … · 2017-06-30 ·...
Statistické zpracování dat
Úvod
III. Zpracování a interpretace analytických dat • Statistické vyhodnocení analytických dat • Zdroje chyb, přesnost a správnost analýzy • Systematické chyby, náhodné chyby • Odhady střední hodnoty a směrodatné odchylky • Grafická prezentace dat • Zákon o šíření chyb • ‚Detekční limity‘
Statistické zpracování dat
Statistické zpracování analytických dat
Chyby měření • systematické chyby
(míra správnosti měření = accuracy)
• náhodné chyby (míra přesnosti = precision)
• hrubé chyby (odlehlé hodnoty = ouliers)
Statistické zpracování dat
Statistické zpracování analytických dat
a) obě analýzy nesprávné, XRF nepřesná
b) obě analýzy správné, XRF nepřesná
Skutečná hodnota je 40 ppm.
(Potts, 1987)
Statistické zpracování dat
Statistické zpracování analytických dat
Systematické chyby – lze testovat pomocí statistických testů, např. Dixonův, χ2
• chyby metody (neadekvátnost použitého modelu pro daný experiment,…)
• chyby měřidel (nepřesná kalibrace, nepřesný přístroj,…)
• chyby pozorování (nepřesnost v odečítání,…)
• chyby při vyhodnocování (zaokrouhlování, chyby použitých konstant)
Statistické zpracování dat
Statistické zpracování analytických dat
Náhodné chyby • kolísají náhodně co do velikosti i znaménka
• nedají se předvídat a jsou popsány určitým pravděpodobnostním rozdělením
• náhodná veličina spojitá/nespojitá
• frekvenční křivka: graf hodnot pozorování xi versus jejich četnost (spojitá/nespojitá)
• odhad parametrů rozdělení pomocí střední hodnoty (µ) a směrodatné odchylky (S)
Statistické zpracování dat
Normální rozdělení
Statistické zpracování analytických dat
Intervaly spolehlivosti pro µ
± 1σ 68.27 % ± 2σ 95.44 % ± 3σ 99.74 %
Statistické zpracování dat
Odhady střední hodnoty
• Aritmetický průměr
• Geometrický průměr
Statistické zpracování analytických dat
∑=
=n
iix
nx
1
1
nn
iixg ∏
=
=1
Statistické zpracování dat
Odhady střední hodnoty
• Medián hodnota přesně uprostřed rozdělení četností (dělí frekvenční křivku na dvě poloviny o stejném počtu hodnot, tj. n/2)
• Modus nejčastější hodnota (maximum frekvenční křivky)
Statistické zpracování analytických dat
Statistické zpracování dat
Odhad směrodatné odchylky
• Směrodatná odchylka pro malý počet měření se n nahrazuje n-1
• Relativní směrodatná odchylka
Statistické zpracování analytických dat
∑=
−=n
ii xx
nS
1
2)(1
%100.xSSr =
Statistické zpracování dat
Odhad směrodatné odchylky II.
• Směrodatná odchylka aritmetického průměru (standard error of the mean)
Statistické zpracování analytických dat
∑=
−−
==n
iix xx
nnnSS
1
2)()1.(
1
Statistické zpracování dat
Hmotová spektrometrie
Statistické zpracování analytických dat
• odhad správnosti měření opakovaná měření standardu, jeho směrodatná odchylka
• odhad přesnosti měření směrodatná odchylka aritmetického průměru (2 s.e.)
(Thirlwall 1991)
Statistické zpracování dat
Grafická prezentace
• Histogramy
Statistické zpracování analytických dat
absolutní (relativní) četnost
Statistické zpracování dat
Grafická prezentace
• Krabicový graf (boxplot, box and whiskers plot)
Statistické zpracování analytických dat
• Box and percentile plot
Statistické zpracování dat
Statistické zpracování analytických dat
• ... atd Statistický jazyk R (Ihaka a Gentleman, 1996)
Grafická prezentace
• Stripplot
Statistické zpracování dat
Zákon o šíření chyb
∑
∂∂
=i
xi
f ixf 2
2
.σσ
Zákon o šíření chyb
222321 321
** ttttttt σσσσ ++±−+=±
Sčítání, odčítání hodnot zatížených chybou:
Statistické zpracování dat
Zákon o šíření chyb
2
23
2
22
2
213
21 321.**ttt
ttttt ttt σσσ
σ ++±=±
Násobení, dělení hodnot zatížených chybou:
Šíření chyb při násobení konstantou:
tctct σσ ..** ±=±
Statistické zpracování dat
Zákon o šíření chyb
∑∑∑
±=±
ii
ii
iii
t ww
wtt 1σ
itiw 2
1σ
=
Vážený průměr:
kde váha wi:
Statistické zpracování dat
Zákon o šíření chyb
Porovnávání stáří t1, t2 zatížených chybou:
Porovnává se rozdíl obou stáří ∆ a chyba tohoto rozdílu na zvolené hladině významnosti k. Pokud:
tktt ∆≤−=∆ σ21
lze považovat obě stáří za statisticky stejná
Statistické zpracování dat
Zákon o šíření chyb
Z daného horninového komplexu byla získána stáří 1000 ± 100 a 1200 ± 50 mil. let.
• Určete chybu jejich rozdílu a zda jsou statisticky stejná na hladině významnosti 95 %
• Spočtěte jejich vážený průměr a jeho chybu
Statistické zpracování dat
1: 112 Ma, ne 2: 1160 ± 45 Ma (2σ)
Zákon o šíření chyb
∑∑∑
±=±
ii
ii
iii
t ww
wtt 1σ it
iw 2
1σ
=
∑
∂∂
=i
xi
f ixf 2
2
.σσ222
321 321** ttttttt σσσσ ++±−+=±
tktt ∆≤− σ21
Statistické zpracování dat
optimistický odhad spodního limitu stanovitelnosti je uváděný např. výrobci některých analytických přístrojů. spodní limit detekce je vhodný pro kvalitativní nebo semikvantitativní analýzu. spodní limit stanovitelnosti odpovídá nejmenšímu signálu, který je možno kvantitativně měřit. limit kvantifikace je používán místo spodního limitu stanovitelnosti např. při právních sporech nebo v komerčních posudcích.
Signál pozadí je charakterizován střední hodnotou a směrodatnou odchylkou Potom:
‚Detekční limity‘
BBx σ2+
BBx σ3+
BBx σ6+
BBx σ10+
BσBx
Statistické zpracování dat
Použitá a doporučená literatura
• IHAKA, R. & GENTLEMAN, R., 1996. R: A language for data analysis and graphics. Journal of Computational and Graphical Statistics, 5, 299-344.
• JANOUŠEK, V. et al. 2016. Geochemical Modelling of Igneous Processes – Principles and Recipes in R Language. Springer-Verlag, Berlin.
• MELOUN, M. & MILITKÝ, J., 2002. Statistické kompendium zpracování analytických dat. Academia Praha.
• POTTS, P. J., 1987. A Handbook of Silicate Rock Analysis:Blackie & Son Ltd., Glasgow and London, 1-622.
• REIMANN, C. et al. 2008. Statistical Data Analysis Explained: Applied Environmental Statistics with R. John Wiley & Sons, Chichester.
• ROLLINSON H.R. 1993. Using Geochemical Data: Evaluation, Presentation, Interpretation. Longman, London.
• ROCK, N. M. S. et al. 1987. Nonparametric estimation of averages and errors for small data-sets in isotope geoscience: a proposal. Chemical Geology (Isotope Geoscience Section), 66, 163-177.
• ROCK, N. M. S., 1988. Numerical Geology. A Source Guide, Gloassary and Selective Bibliography to Geological Uses of Computers and Statistics. Lecture Notes in Earth Sciences 18:Springer, Berlin, 1-427.
• THIRLWALL, M. F., 1991. Long-term reproducibility of multicollector Sr and Nd isotope ratio analysis. Chemical Geology (Isotope Geoscience Section), 94, 85-104.