Einf uhrung in elementare Statistik und ... Kapitel 1 Vorwort Die mit den Begri en Statistik,...

download Einf uhrung in elementare Statistik und ... Kapitel 1 Vorwort Die mit den Begri en Statistik, Zufall,

of 42

  • date post

    27-Oct-2019
  • Category

    Documents

  • view

    1
  • download

    0

Embed Size (px)

Transcript of Einf uhrung in elementare Statistik und ... Kapitel 1 Vorwort Die mit den Begri en Statistik,...

  • Einführung in elementare Statistik und Wahrscheinlichkeitsrechnung

    Bodo Werner mailto:werner@math.uni-hamburg.de

    19. März 2009

    mailto: werner@math.uni-hamburg.de

  • 2

  • Inhaltsverzeichnis

    1 Vorwort 5 1.1 Internet-Seiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.2 Lehrbücher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

    2 Beschreibende Statistik 9 2.1 Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

    2.1.1 Die wichtigsten Begriffe . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.2 Merkmalraum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

    2.2.1 Stichprobe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.2.2 Diskrete und kontinuierliche Merkmale . . . . . . . . . . . . . . . . . . . 15

    2.3 Grafische Darstellungen von Erhebungen . . . . . . . . . . . . . . . . . . . . . . 16 2.3.1 Beispiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2.3.2 Diagramme in Excel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 2.3.3 Histogramme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 2.3.4 Eigenschaften von Häufigkeitsverteilungen . . . . . . . . . . . . . . . . . 23 2.3.5 Manipulationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

    2.4 Maßzahlen (Kenngrößen) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 2.4.1 Mittelwert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 2.4.2 Charakterisierung des Mittelwertes . . . . . . . . . . . . . . . . . . . . . 26 2.4.3 Mittelwert als Schwerpunkt . . . . . . . . . . . . . . . . . . . . . . . . . 26 2.4.4 Skaleneinfluss auf den Mittelwert . . . . . . . . . . . . . . . . . . . . . . 27 2.4.5 Varianz, Streuung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 2.4.6 Skaleneinfluss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 2.4.7 Berechnungen mit Excel . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 2.4.8 Median, Quantile, Quartile . . . . . . . . . . . . . . . . . . . . . . . . . . 31 2.4.9 Empirische Verteilungsfunktion . . . . . . . . . . . . . . . . . . . . . . . 33

    2.5 Statistik und Wahrscheinlichkeitstheorie . . . . . . . . . . . . . . . . . . . . . . 36 2.6 Korrelation zweier Merkmale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

    2.6.1 Kontingenztafel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 2.6.2 Korrelationskoeffizient . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 2.6.3 Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

    3

  • 4 INHALTSVERZEICHNIS

    2.6.4 Eine Warnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

  • Kapitel 1

    Vorwort

    Die mit den Begriffen Statistik, Zufall, und Wahrscheinlichkeit verbundene Stochastik1 spielt auch außerhalb der Mathematik eine herausragende Rolle. Sei es die Wahrscheinlichkeit, im Glücksspiel zu gewinnen, die morgige

    ” Regenwahrscheinlich-

    keit“ in einem Wetterbericht, die Wahrscheinlichkeit, an einer bestimmten Krankheit zu er- kranken, die neuesten Arbeitslosenstatistiken oder eine Umfrage vor der Bundestagswahl. Die Wahrscheinlichkeit, dass eine Bank, ein Unternehmen, ein Häuslebauer oder gar ein Staat einen Kredit nicht zurückzahlen kann, prägt die Unsicherheit der derzeitigen Finanzkrise. Dass der Begriff Risiko vor dem Hintergund dieser Krise sowohl für den individuellen Geld- anleger als auch für Banken, Versicherungen, ja für unsere demokratische Gesellschaft ein mit Wahrscheinlichkeit verbundener mathematischer Begriff ist, wird meist nur am Ran- de erwähnt. Die gesamte Versicherungsbranche ruht auf statistischen Grundlagen wie die (steigende) Le- benserwartungen bei Lebensversicherungen oder die Häufigkeit von Sturmschäden bei Gebäude- versicherungen. Diese Statistik dient der Riskoeinschätzung und der damit verbundenen Höhe der Versicherungsprämien. Auch die Medizin kommt ohne statistische Fallstudien bei der Erprobung neuer Medikamente oder bei der Frage, ob gewisse Umwelteinflüsse verantwortlich für das Auftreten bestimmter Krankheiten sind, nicht aus. Stochastik hat auch mit Warteschlangen an Fahrkartenschaltern der Bahn oder in Wartezim- mern von Ärzten zu tun. Allgemein befasst sie sich mit Untersuchungen von Ereignissen, die vom Zufall beeinflusst werden. Zufällige Ereignisse werden oft durch erhobene Daten (

    ” Zufällige Stichproben“) dokumentiert,

    für deren Analyse die Statistik geeignete Methoden bereitstellt. Für viele Studierende der Wirt- schaftswissenschaften, Psychologie, Biologie, u.a. sind Mathematik und Statistik identisch.

    Wegen ihrer großen Bedeutung zählt die Stochastik heute zur Schulmathematik. Sie ist auch

    1Der Begriff Stochastik stammt ursprünglich aus dem Griechischen und bedeutet dort: die Kunst des geschick- ten Vermutens. Er umfasst sowohl die Wahrscheinlichkeitstheorie, auch Wahrscheinlichkeitsrechnung genannt, als auch die Statistik.

    5

  • 6 KAPITEL 1. VORWORT

    in Lehramtsstudiengängen i.A. ein Pflichtfach. Dieses Manuskript versucht einen Einstieg in die Stochastik, genauer in die beschreibende Sta- tistik und in die Wahrscheinlichkeitsrechnung zu geben. Es beruht auf einem im SoSe 05 im Rahmen der Mathematik IV für Studierende des Lehramts an der Grund- und Mittelstufe be- nutzten Skript, siehe Mathematik IV SoSe 05. Ich habe auch das sehr nützliche handschriftliche Skript von Susanne Koch (Mathematik IV - Elementare Wahrscheinlichkeitsrechnung vom SoSe 08) teilweise eingearbeitet.

    Die Kernpunkte dieses Skripts, die Gegenstand der Vorlesung und der Übungen im SoSe 09 sind, werden durch einen größeren Schrifttyp hervorgehoben.

    Ziel ist es in erster Linie nicht, Rezepte und Schemata zu vermitteln, wie man Wahrscheinlich- keiten berechnet oder wie man Daten einer Stichprobe auswertet oder gar statistische Tests durchführt. Vielmehr ist das Ziel, dass die grundlegenden Konzepte so weit verstanden werden, dass wenigstens exemplarisch Berechnungen und Auswertungen durchgeführt werden können und dass das nötige Vermögen 2 vorliegt, um im gesellschaftlichen Umfeld mitdenken und mitar- gumentieren zu können. Diese Konzepte der Stochastik verbinden sich in der Regel mit speziel- len sprachlichen Begriffen (

    ” Vokabeln“) wie diskreter und kontinuierlicher, qualitiver und

    quantitativer Merkmalraum, Häufigkeiten, (Häufigkeits- und Wahrscheinlichkeits-) Verteilungen von Stichproben bzw. Zufallsvariablen und (empirische) Verteilungsfunk- tionen und deren Kenngrößen wie Mittelwert, Erwartungswert, Standardabweichung, Streung, Varianz, Median, Quantile, Quartile, spezielle Wahrscheinlichkeits-Verteilungen wie Bernoulli-, Binomial-, Laplace-, Normalverteilung, stochastische Unabhängig- keit von Ereignissen, bedingte Wahrscheinlichkeit sowie die Schätzung der Kenngrößen zugehöriger Zufallsvariable und Tests zur Absicherung von Hypothesen. Das Verständnis die- ser Basisbegriffe kann man nicht mit der

    ” Unterstreichenkompetenz“ erzielen, es bedarf viel-

    mehr einer wirklich anstrengenden Auseinandersetzung mit diesen Begriffen, die letztendlich zum Verständnis führt.

    Ich werde mit der sog. Beschreibenden (deskriptiven) Statistik beginnen, weil diese zum einen wesentlich einfacher ist als die Wahrscheinlichkeits-Rechnung, zum anderen aber auch im Alltag gegenwärtiger ist. Ich vermute auch3, dass die Statistik vordergründig eine größere gesellschaft- liche Bedeutung als die reine Wahrscheinlichkeitsrechnung hat. Ich denke nur an die Medizin und die Wirtschaftsstatistik. Allerdings sind beide Gebiete sehr eng verwoben, was hoffentlich deutlich werden wird.

    1.1 Internet-Seiten

    Die möglichen Internetlinks sind in der pdf-Datei rot hervorgehoben. In der Regel müssten Sie durch einen Doppelklick auf das rot Hervorgehobene einen Internet-Browser aufrufen können

    2Heute würde man von Kompetenz reden. 3Ich bin kein Experte!

    http://www.math.uni-hamburg.de/home/werner/GruMiSoSe05TeilIV.pdf

  • 1.2. LEHRBÜCHER 7

    Abbildung 1.1: JUMBO

    und so sofort zur entsprechenden Internetseite gelangen — sofern Sie online sind. Übungsaufgaben werden ebenfalls solche Links enthalten, meist zu Java-Applets, die von Ih- nen Aktionen erfordern. Dabei wird es keine

    ” Gebrauchsanweisungen“ zur Benutzung dieser

    Applets geben. Meist genügt ein zuweilen auch zeitaufwändiges Herumprobieren. Wichtig ist, dass Ihr Internetbrowser so eingestellt ist, dass er das Öffnen dieser Java-Applets zulässt. Unter Einstellungen müssen Sie Java und Java-Skripte aktivieren.

    1. In den folgenden Seiten werden sehr häufig Bezüge zu einem hervorragenden Multi-Media- Manuskripts über Biometrie4 der Uni Münster (Autoren: Achim Heinecke und Wolfgang Köpcke) hergestellt: Java unterstützte Münsteraner Biometrie-Oberfläche5

    Viele Beispiele und Grafiken verdanke ich diesem Skript. Die können eine CD-ROM mit allen Unterlagen bei Prof. Köpcke für nur 8 Euro bestellen (Stand 2005). Ich werde mich auf dieses Skript mit dem sympathischen Namen JUMBO beziehen, da dies die Kurzform des Arbeitstitels des Skripts (Java-Unterstützte Münsteraner Biometrie-Oberfläche) ist, siehe Abb. 1.1.

    Zu diesem Skript zitiere ich (H. Grahlki: Die akademische Lehre im Netz. Forschung und Lehre 2 (1998) 69-71):

    ” Es e