IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert
Statistische Methoden in den Umweltwissenschaften
Irrtumswahrscheinlichkeiten
Freiheitsgrade
Stichprobe
Skalentypen
IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert
Grundgesamtheit und Stichprobe
• Wie groß ist die mittlere Blattlänge der Seegräser in einer Seegraswiese ?
• Bestes Verfahren: Alle Seegräser der Seegraswiese vermessen
(= Grundgesamtheit) Man kann den wahren Mittelwert (µ) berechnen Das ist allerdings oft nicht möglich…
• Ausreichendes Verfahren: Eine möglichst hohe Anzahl (= Stichprobe, Teilmenge)
der Seegräser vermessen Der wahre Mittelwert kann nur geschätzt werden (m) Daraus ergibt sich immer ein Fehlerrisiko >0 (= Irrtumswahrscheinlichkeit)
IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert
Wiederholungen und Replikate
• Stichprobenumfang (= n) ist die Anzahl der Wiederholungen oder Replikate
• WARUM ?? Erfassen der natürlichen und systematischen Variabilität
• REPLIKAT = experimentelle Einheit
– Replikate sind unabhängige Wiederholungen !
– ABER, wie groß ist die experimentelle Einheit ???
– Fehleinschätzung der Skalierung einer experimentellen Einheit: die angenommenen Replikate sind nicht unabhängig
– Pseudo-Replikate sind ein sehr häufiges und ernstes Problem
IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert
Das Problem der Pseudo-Replikate
• Zeitliche Pseudo-Replikate
– Vermessen der selben Probe über einen Zeitraum (Wachstumsexperimente!)
Zeit
Zeit
• Räumliche Pseudo-Replikate
– Beprobung der Wassersäule mit Wasserschöpfern an CTD
IOW-Fotogalerie, Terminfahrt März 2009
IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert
Gepoolte Proben
• Gemischte Proben:
– Mittelwertbestimmung
– Keine Variabilität bestimmbar 1 2 3 4 5 6
C
IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert
Replikate in der Mikrobiellen Ökologie ?
See 1 See 2
10 ml Wasserprobe
Auszählen der Abundanz der Bakterien: 1,4 x 106 Zellen ml-1 < 3,2 x 106 Zellen ml-1
Keine Replikate, daher keine Schlussfolgerung bzgl. Unterschiede in der Bakterienabundanz beider Seen
10 ml Wasserprobe
IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert
Replikate in der Mikrobiellen Ökologie ?
See 1 See 2
10 ml Wasserprobe
Erstellen je einer 16S rRNA Klonbibliothek, Sequenzieren von je 200 Klonen Bestimmen der relativen Abundanz verschiedener phylogenetischer Gruppen, Rechnen von phylogenetischen Bäumen, etc.: Bakterielle Gemeinschaft beider Seen Vergleich der Ergebnisse der beiden Wasserproben und Schlussfolgerung bzgl. Unterschiede in der bakteriellen Gemeinschaft beider Wasserproben
10 ml Wasserprobe
IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert
Versuchsplanung (in der Mikrobiellen Ökologie)
• Neues Zeitalter: Next Generation Sequencing, PhyloChips
– Generierung einer ernormen Anzahl von Sequenzen
– 90.000 Sequenzen von jedem See? Aber besser 3 x 30.000 Sequenzen !
• Wenn der Probenumfang vergrößert werden kann, sollte die Anzahl der Replikate erhöht werden ! (und nicht die Messwiederholungen und Pseudo-Replikate)
IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert
Nullhypothese H0
• Formulieren einer Arbeitshypothese H - aber testen der Nullhypothese H0
• Häufig beinhaltet die Nullhypothese H0 die Gleichheit von Sachverhalten, bzw. dass das Ergebnis ein Zufallsprodukt ist, zum Beispiel:
dass zwischen Gruppen kein Unterschied besteht,
dass ein bestimmtes Medikament keine Wirkung zeigt,
dass zwischen Merkmalen kein Zusammenhang besteht.
• Ziel: Widerlegen der Nullhypothese
IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert
Seeigel und Seegräser
Mittelmeer: Der Seeigel Paracentrotus lividus beweidet Posidonia oceanica
IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert
Seeigel und Seegräser
Mittelmeer: Der Seeigel Paracentrotus lividus beweidet Posidonia oceanica
Arbeitshypothese: 1. Die Seegrasdichten in einem
Gebiet mit und einem ohne Seeigel unterscheiden sich.
2. In einer Seegraswiese mit Seeigeln ist die Seegrasdichte geringer als in einem Gebiet ohne Seeigel.
IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert
• Nullhypothese:
Seeigel und Seegräser
Die Seegrasdichten im Gebiet mit Seeigeln und ohne Seeigel unterscheiden sich nicht.
(m1 = m2)
m1 m2
IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert
Seeigel und Seegräser
• Gegenhypothese 1:
Die Seegrasdichte im Gebiet ohne Seeigel ist größer als im Gebiet mit Seeigeln.
(m1 > m2)
m1 m2
IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert
Seeigel und Seegräser
• Gegenhypothese 2:
Die Seegrasdichte im Gebiet ohne Seeigel ist kleiner als im Gebiet ohne Seeigel.
(m1 < m2)
m1
m2
IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert
alpha- und beta-Fehler
Realität
Die Seegrasdichten beider Gebiete unterscheiden
sich nicht
Die Seegrasdichten beider Gebiete unterscheiden
sich
Statistischer Test
Nullhypothese wird nicht abgelehnt
Richtige Entscheidung, es wird kein Fehler
begangen
Typ II Fehler (beta)
Nullhypothese wird abgelehnt
Typ I Fehler (alpha)
Richtige Entscheidung, es wird kein Fehler
begangen
Nullhypothese: Die Seegrasdichten im Gebiet mit Seeigeln und ohne Seeigel unterscheiden sich nicht (m1 = m2).
IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert
Testentscheidung: alpha-Fehler
• Maximale Irrtumswahrscheinlichkeit (Signifikanzniveau): muss vor dem Test vorgegeben werden
• z.B. 0,1% 1% 5%
• p-Wert (probability, Irrtumswahrscheinlichkeit) wird mit dem vorgegebenen Signifikanzniveau verglichen
Testentscheidung: Wenn p < alpha, dann wird die Nullhypothese abgelehnt. Die Gegenhypothese (= Arbeitshypothese) wird angenommen.
IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert
Das Testen von Hypothesen
• Da die Irrtumswahrscheinlichkeit < 5%, kann die Nullhypothese (m1 = m2) abgelehnt werden, d.h. m1 < m2
Nullhypothese: Gegenhypothesen:
m1 = m2
m1 < m2
m1 > m2
Seeigel
mit ohne
Spr
ossd
icht
e See
gras
0
2
4
6
8
10
12
14
16
18
m1
m2
p < 0.001
IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert
Seeigel und Seegräser: 1-seitig oder 2-seitige ?
Mittelmeer: Der Seeigel Paracentrotus lividus beweidet Posidonia oceanica
Arbeitshypothese: 1. Die Seegrasdichten in einem
Gebiet mit und einem ohne Seeigel unterscheiden sich.
2. In einer Seegraswiese mit Seeigeln ist die Seegrasdichte geringer als in einem Gebiet ohne Seeigel.
IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert
1-seitige oder 2-seitige Signifikanz ?
• Die Arbeitshypothese entscheidet, ob die 1-seitige oder 2-seitige Signifikanz die richtige ist.
2-seitige Fragestellung
Besteht zwischen zwei Messwerten ein Unterschied, ohne dass die
Richtung des Unterschiedes wichtig ist ?
(m1 < m2 oder m1 > m2)
1-seitige Fragestellung
Besteht zwischen zwei Messwerten ein Unterschied und
geht dieser Unterschied in die erwartete Richtung ?
(m1 < m2)
• Der 2-seitige Wert ist immer exakt doppelt so hoch wie der entsprechende 1-seitige Wert. Der 1-seitige Wert hat es damit “leichter”, signifikant zu werden, erfordert aber die genauere Arbeitshypothese.
IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert
Freiheitsgrade
• Der Stichprobenumfang n, der zur Schätzung eines Parameters herangezogen wird, ist der Ausgangspunkt für die Festlegung der zur Verfügung stehenden Freiheitsgraden.
• Wird z.B. die Varianz (s2 ) einer Verteilung mit n Werten geschätzt, dann ist die Anzahl der Freiheitsgrade n-1, da die Formel zur Berechnung von Varianz den Mittelwert als weiteren Parameter enthält.
Anzahl der Freiheitsgrade
Anzahl der unabhängigen
Einzelinformationen
Anzahl der eingehenden
Parameter = -
1)²(
²−−
= ∑n
xxs i
IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert
Bayes-Statistik etc.
• Reconstruction of the Annelida phylogenetic tree.
• TH Struck et al. Nature 471, 95-98 (2011) doi:10.1038/nature09864
Majority rule consensus trees of the Bayesian inference analysis using the site-heterogeneous CAT model of the data set with 39 taxa and 47,953 amino acid positions. Only PP (top of branch or alone) and BS (bottom) values ≥ 0.70 or 70, respectively, are shown. The branch leading to Myzostomida is reduced by 75%. Annelida are highlighted in red, with Sedentaria in blue and Errantia in green. Grey bars indicate additional annelid groups. *, BS value for the monophyly of Annelida without Myzostomida in the maximum likelihood analysis is 99.
IOW-Statistikseminar: 1. Veranstaltung Carola Wagner & Anja Eggert
Skalentypen
• Nominal-Skala
„Klassenskala“
Endliche diskrete Skala, d.h. es liegen endlich viele Merkmalsausprägungen (Klassen) vor, OHNE Rangordnung
Bsp. Einteilung Geschlecht, morphologische Gruppen
• Ordinal-Skala
„Rangskala“
Diskrete Skala MIT Rangordnung
Bsp. Deckungsgrad bei Vegetationskartierung
• Metrische-Skala
„Kardinalskala“
Diskrete metrische Skala, Differenzbildung ist interpretierbar
Messgrößen wie Temperatur, Abundanz, Biomasse
Top Related