Einf uhrung in die Statistik - Meteorologisches Institut .multivariate Statistik zu nden. Ich danke

download Einf uhrung in die Statistik - Meteorologisches Institut .multivariate Statistik zu nden. Ich danke

of 96

  • date post

    14-Aug-2019
  • Category

    Documents

  • view

    212
  • download

    0

Embed Size (px)

Transcript of Einf uhrung in die Statistik - Meteorologisches Institut .multivariate Statistik zu nden. Ich danke

  • Meteorologisches Institut der Universität Bonn

    Skript zur Vorlesung

    Einführung in die Statistik

    Wintersemester 2004/2005

    Andreas Hense

    Thomas Burkhardt

    Petra Friederichs

    Version: 31. Oktober 2005

    1

  • Inhaltsverzeichnis

    1 Einführung 1

    2 Elemente der Wahrscheinlichkeitsrechnung 4

    2.1 Ereignisse und Stichprobenraum . . . . . . . . . . . . . . . . . . . . . . . . . 4

    2.2 Begriff der Wahrscheinlichkeit . . . . . . . . . . . . . . . . . . . . . . . . . . 5

    2.3 Bedingte Wahrscheinlichkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . 7

    2.4 Unabhängige Ereignisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

    3 Zufallsvariable, Verteilung von Zufallsvariablen 8

    3.1 Diskrete Zufallsvariable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

    3.2 Verteilung einer diskreten ZVA . . . . . . . . . . . . . . . . . . . . . . . . . 9

    3.3 Univariate reelle kontinuierliche ZVA’s . . . . . . . . . . . . . . . . . . . . . 9

    3.4 Multivariate reelle ZVA’s . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

    3.5 Verallgemeinerte ZVA’s, Funktionen von ZVA’s . . . . . . . . . . . . . . . . 11

    3.6 Realisierungen von ZVA’s . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

    3.7 Momente einer Verteilungsfunktion . . . . . . . . . . . . . . . . . . . . . . . 15

    3.7.1 Reduzierte Zufallsvariable . . . . . . . . . . . . . . . . . . . . . . . . 17

    3.8 Modus, Median und Quantile . . . . . . . . . . . . . . . . . . . . . . . . . . 18

    4 Erwartungswert einer Funktion einer ZVA 19

    4.1 Momente multivariater ZVA’s . . . . . . . . . . . . . . . . . . . . . . . . . . 19

    5 Theoretische Wahrscheinlichkeitsdichteverteilungen 22

    5.1 Diskrete Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

    5.1.1 Binominalverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

    5.1.2 Poissonverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

    5.2 Kontinuierliche Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

    5.2.1 Gaussverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

    5.2.2 Zentraler Grenzwertsatz der Statistik . . . . . . . . . . . . . . . . . . 30

    5.2.3 Die χ2-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

    5.2.4 Die Student-t-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . 33

    5.2.5 Die Fisher-F -Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . 34

  • 5.3 Weitere Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

    5.3.1 Log-Normalverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

    5.3.2 Gamma-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

    5.3.3 Weibullverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

    5.3.4 Beta-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

    5.3.5 Multivariate Normalverteilung . . . . . . . . . . . . . . . . . . . . . . 41

    6 Stichproben von ZVA 43

    6.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

    6.2 Schätzer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

    6.3 Schätzung der pdf, Häufigkeitsverteilung . . . . . . . . . . . . . . . . . . . . 45

    6.4 Schätzer der Verteilungsfunktion,

    Empirische Verteilungsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . 46

    6.5 Schätzung des Erwartungswertes . . . . . . . . . . . . . . . . . . . . . . . . 47

    6.6 Schätzung der Varianz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

    6.7 Maximum Likelihood Methode . . . . . . . . . . . . . . . . . . . . . . . . . . 50

    6.8 Übung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

    6.9 Verteilungen von Schätzern . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

    6.9.1 Verteilung eines Erwartungswertschätzers . . . . . . . . . . . . . . . . 52

    6.9.2 Verteilung eines Varianzschätzers - χ2 Verteilung . . . . . . . . . . . 52

    6.9.3 Beziehung zwischen Erwartungswert- und Varianzschätzer -

    Student - t Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . 54

    6.9.4 Beziehung zwischen 2 Varianzschätzern - Fisher-F Verteilung . . . . . 55

    6.10 Konfidenzintervalle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

    6.10.1 Konfidenzintervall für den Mittelwert bei bekannter Varianz einer

    normalverteilten GG . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

    6.10.2 Konfidenzintervall für den Mittelwert einer normalverteilten GG bei

    geschätzter Varianz . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

    6.10.3 Konfidenzintervall für den Schätzer der Varianz einer NV GG . . . . 58

    7 Prüfung statistischer Hypothesen, Tests 59

    7.1 Allgemeine Bemerkungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

  • 7.2 Mittelwerttest bei einer NV GG mit bekannter Varianz . . . . . . . . . . . . 63

    7.3 Vergleich der Mittelwerte zweier NV mit identischer Varianz . . . . . . . . . 65

    7.4 Vergleich der Varianz zweier NV . . . . . . . . . . . . . . . . . . . . . . . . . 67

    7.5 Anpassungstests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

    7.5.1 Der χ2-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

    7.5.2 Kolmogoroff - Smirnov Test . . . . . . . . . . . . . . . . . . . . . . . 70

    8 Statistische Untersuchung extremer Ereignisse 72

    8.1 Die Generalisierte Extremwertverteilung . . . . . . . . . . . . . . . . . . . . 73

    8.2 Die Überschreitung eines Schwellenwerts und die Generalisierte Pareto-Verteilung 76

    8.2.1 Die Generalisierte Pareto-Verteilung . . . . . . . . . . . . . . . . . . 77

    8.2.2 Das Poisson-GPD-Modell . . . . . . . . . . . . . . . . . . . . . . . . 78

    9 Kleine Einführung in die Bayesische Statistik 80

    9.1 Nicht-frequentistische Wahrscheinlichkeitsrechnung . . . . . . . . . . . . . . 82

    9.2 Bayes-Theorem für Wahrscheinlichkeiten - der diskrete Fall . . . . . . . . . . 83

    9.3 Bayesische Statistik für Wahrscheinlichkeitsdichten . . . . . . . . . . . . . . 85

    9.4 Die Priori-Dichte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

    9.4.1 Nichtinformative Priori-Dichten . . . . . . . . . . . . . . . . . . . . . 86

    9.4.2 Priori-Dichte mit Maximum Entropie Methode . . . . . . . . . . . . . 87

    9.4.3 Einschränkung der Priori-Dichten . . . . . . . . . . . . . . . . . . . . 87

    9.4.4 Die Randverteilung zur Bestimmung der Priori-Dichte . . . . . . . . . 88

    9.5 Die Maximum-Likelihood Typ II - Methode . . . . . . . . . . . . . . . . . . 89

    9.6 Die Momente-Methode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

    9.7 Konjugierten Priori-Dichten und die Posteriori . . . . . . . . . . . . . . . . . 90

    9.8 Anwendungen Bayesische Statistik . . . . . . . . . . . . . . . . . . . . . . . . 91

    9.8.1 Punktschätzung eines Parameters . . . . . . . . . . . . . . . . . . . . 91

    9.8.2 Multivariate Parameterschätzung . . . . . . . . . . . . . . . . . . . . 91

    9.8.3 Test statistischer Hypothesen . . . . . . . . . . . . . . . . . . . . . . 91

    9.8.4 Bayesiche Entscheidungstheorie . . . . . . . . . . . . . . . . . . . . . 91

  • 1 Einführung

    1 Einführung

    Warum wird in der Meteorologie Statistik betrieben? Meteorologie war und ist immer eine

    datenorientierte Wissenschaft gewesen: dies ist in der Klimatologie offensichtlich, wird in der

    Synoptik jeden Tag betrieben, jedes Grenzschichtexperiment lebt von den gemessenen Daten

    und auch jedes numerische Modell stellt nichts anderes dar, als einen großen Komplex, mit

    dem erstmal viele Daten erzeugt werden, die dann im nachhinein ausgewertet werden müssen.

    Viele Daten – ob räumlich oder zeitlich verteilt – stehen an und müssen verarbeitet und

    komprimiert werden, um zu einer Aussage zu kommen. Dies ist die Aufgabe der statistischen

    Analyse (Beschreibende Statistik).

    In der Vorlesung werden die Grundlagen der mathematischen, beschreibenden Statistik

    – zunächst für eine skalare Größe (univariate Statistik) – vorgestellt und ihre Anwendung

    auf Daten diskutiert. Ein Teil der Vorlesung soll der praktischen Anwendung der statisti-

    schen Analyse mit Hilfe von PC’s und Programmen gewidmet sein. Zu Beginn der Vorlesung

    werden die grundlegenden Begriffe wie Wahrscheinlichkeit, Zufallsvariable, Wahrscheinlich-

    keitsdichtefunktionen u.ä. eingeführt. Dann folgen die Grundlagen der Stichprobenentnahme,

    das Schätzproblem, die Beurteilung der Qualität der statistischen Analyse (Konfidenz) und

    die Absicherung von Annahmen oder Hypothesen durch die (beliebten) statistischen Tests.

    Man sollte sich aber im klaren sein, daß diese Begriffe weit über die beschreibende Sta-

    tistik hinaus Bedeutung haben. Die eigentliche Statistik setzt ein – für meine Begriffe – bei

    stochastischen dynamischen Systemen, der statistischen Behandlung nichtaufgelöster Bewe-

    gungsformen in numerischen Modellen, der Bestimmung dynamisch konsistenter Analysen

    meteorol