Einf¼hrung in SPSS/PASW. Inhalts¼bersicht 1. Intro (02.11.2010) 2. Deskriptive...

download Einf¼hrung in SPSS/PASW. Inhalts¼bersicht 1. Intro (02.11.2010) 2. Deskriptive Statistik (09.11.2010) 3. Ausgaben (16.11.2010) 4. Grafik und œbungen (23.11.2010)

of 29

  • date post

    05-Apr-2015
  • Category

    Documents

  • view

    103
  • download

    0

Embed Size (px)

Transcript of Einf¼hrung in SPSS/PASW. Inhalts¼bersicht 1. Intro (02.11.2010) 2. Deskriptive...

  • Folie 1
  • Einfhrung in SPSS/PASW
  • Folie 2
  • Inhaltsbersicht 1. Intro (02.11.2010) 2. Deskriptive Statistik (09.11.2010) 3. Ausgaben (16.11.2010) 4. Grafik und bungen (23.11.2010) 5. Wiederholung (30.11.2010) 6. Datentyp Datum (07.12.2010) 7. Theorie 1 (14.12.2010) Restaufgaben aus 6. Theorie Wiederholung aus der Vorlesung
  • Folie 3
  • Aufgaben 1. Berechnen Sie in der SPSS Arbeitsdatei fahrtenbuch-01.sav den Verbrauch zwischen 2 Betankungen ber die folgende Formel: verbrauch=liter*100/diff_km 2. Berechnen Sie die durchschnittliche tgliche Fahrstrecke ber die folgende Formel: km_pro_tag=diff_km/diff_tage 3. Berechnen Sie in der SPSS Arbeitsdatei ferien-01.sav in der Variablen wartezeit jeweils den Abstand zwischen Beginn der Schulzeit und Anfang der Ferien bei aufeinanderfolgenden Ferienterminen, also z.B. die Anzahl der Tage zwischen Ende der Sommerferien und Beginn der Herbstferien; also die Wartezeit auf die nchsten Ferien: wartezeit = CTIME.DAYS(beginn) CTIME.DAYS(LAG(ende))-1 4. Erklren Sie die oben verwendete Formel zur Berechung der Wartezeit. Betrachten Sie insbesondere (fiktiv) direkt aufeinanderfolgende Ferientermine. 5. ffnen Sie wieder persoenlichkeiten-01.sav und berechnen Sie, wieviele Jahre berlappung es zwischen den Lebensdaten von Leibniz und Newton gab. 6. Berechnen Sie den Zeitraum zwischen dem Tod von Newton und der Geburt von Einstein. 7. Ordnen Sie die Lebensdaten der Persnlichkeiten auf einer Zeitleiste an.
  • Folie 4
  • Vergleichen von empirischen Verteilungen Ein Box- und Whisker-Plot enthlt folgende Informationen
  • Folie 5
  • Boxplot in SPSS Grafik > Interaktiv > Boxplot
  • Folie 6
  • Boxplot in SPSS
  • Folie 7
  • Bearbeiten von Diagrammen 1. Erstellen Sie einen Box- und Whisker-Plot fr die Variable Gewicht (gewicht) aus broca- 01.sav, einmal gesamt und einmal getrennt nach Mnnern und Frauen. 2. Das Statistische Bundesamt bietet in der Genesis Online-Datenbank, erreichbar berhttps://www-genesis.destatis.de/genesis/online/logon, die Mglichkeit zum Download von diversen statistischen Daten, u.a. im Format Excel. Laden Sie die folgende Tabelle im Format Excel herunter: Tabelle 21311-0003; Studierende: Deutschland, Semester, Nationalitt, Geschlecht, Studienfach; eingeschrnkt auf das WS 2006/2007. 3. Bereinigen Sie die Excel-Datei studiengang-ws0607.xls fr den Import nach SPSS. 4. Berechnen Sie fr die SPSS Datendatei studiengang-ws0607.sav eine neue Variable D_Gesamt mit der Gesamtzahl der mnnlichen und weiblichen deutschen Studenten. Stellen Sie die 10 Studiengnge mit den meisten Studenten in einem Diagramm dar. Vergleichen Sie mit den 10 Studiengngen, die fr Mnner und Frauen getrennt am beliebtesten sind. 5. Experimentieren Sie mit Hoch-/Tief-Diagrammen (Beispiel: Aktien, Fieberkurven) oder Fehlerbalken-Diagrammen (Beispiel: Mefehler in physikalischen Experimenten). Verwenden Sie hierzu zum Beispiel die Kurse der Hypo Real Estate (WKN: 802770 ISIN: DE0008027707). 6. Verschaffen Sie sich einen berblick ber die weiteren verfgbaren Diagrammtypen. 7. Speichern Sie abschlieend das Sitzungsprotokoll.
  • Folie 8
  • Folie 9
  • Inhalte des Theorieblocks 1. Zufallsexperimente, Zufallsvariablen und Wahrscheinlichkeit 2. berblick ber die Mathematische Statistik 3. Berechnen eines Konfidenz-Intervalls
  • Folie 10
  • Inhalte des Theorieblocks 1. Zufallsexperimente, Zufallsvariablen und Wahrscheinlichkeit 2. berblick ber die Mathematische Statistik 3. Berechnen eines Konfidenz-Intervalls
  • Folie 11
  • Glossar 1/2 Zufallsexperiment Ein Versuch, dessen Durchfhrung zufllig zu genau einem von mehreren mglichen Ergebnissen fhrt (z.B. Lotterie) Kombinatorik Kunst des Zhlens Ist die Sprache bzw. theoretische Einbettung von Zufallsexperimenten z.B.: Auswahl einer Stichprobe aus der Grundgesamtheit, bei der m Objekte zufllig ohne Zurcklegen aus der Grundgesamtheit mit n Objekten ausgewhlt werden Ergebnismenge (eines Zufallsexperimentes) Menge aller mglichen Ergebnisse, die das Zufallsexperiment haben kann Elementarereignis Die einzelnen Ergebnisse, die in vereinigt sind Wahrscheinlichkeit P (die Abbildung/Funktion) Abbildung von in das in das Intervall [0,1], die jedem Elementarereignis eine positive Zahl p zuordnet Wahrscheinlichkeit p (der Wert fr jedes Elementarereignis) Beschreibt, wie wahrscheinlich das Eintreten eines spezifischen Ereignisses ist
  • Folie 12
  • Wahrscheinlichkeit P (Abbildung) Eigenschaften von P( ) = p P({ })>0 P({ 1, 2 }) = P({ 1 }) + P({ 2 }) P( )=1 Mglichkeiten, woher man die genaue Beschaffenheit von P ableitet Schtzung Plausible Annahmen Anhand von Erfahrungwerten Mathematische Theorie
  • Folie 13
  • Glossar 2/2 Zufallsvariable X (Variablen in SPSS) Zufallsvariablen sind die beobachtbaren Merkmale oder Eigenschaften von Objekten oder Personen (Flle in SPSS), die in einem Zufallsexperiment ausgewhlt werden Wahrscheinlichkeitsverteilung P X Diese ist die Summe aller Wahrscheinlichkeiten fr elementare Ergebnisse, die einen bestimmten Wert von X liefern.
  • Folie 14
  • Beispiel aus unseren Datenstzen Broca-01.sav - Menschen auf diesem Planeten - ein bestimmter Mensch P - die Wahrscheinlichkeit mit der wir einen bestimmten Menschen auswhlen (im Idealfall gleichverteilt) n - Menschen, deren Daten wir erhoben haben (Unsere konkreten Flle in SPSS) X 1 ( ) - Krpergewicht eines bestimmten Menschen X 2 ( ) - Krpergre eines bestimmten Menschen P X - Sowohl Krpergewicht als auch Krpergre gelten als normalverteilt (basierend auf Erfahrungwerten bzw. vorangegangen Messungen) mit einem Mittelwert (~1.75m?) und einer Standardabweichung (0.15m?).
  • Folie 15
  • Vor dem Experiment ist nicht nach dem Experiment Streng genommen kann man nur VOR dem Experiment Aussagen ber mgliche Werte und deren Wahrscheinlichkeiten treffen (Grobuchstaben). NACH dem Experiment steht genau ein beobachteter Wert zur Verfgung (Kleinbuchstaben)
  • Folie 16
  • Dichtefunktion der Normalverteilung
  • Folie 17
  • Aufgaben zum Weiterdenken 1. Kennen Sie Spiele, die auf Zufallsexperimenten beruhen? 2. Viele Spiele haben Elemente von Glck und Zufall und Strategie. Spielen Sie lieber Schach oder BlackJack? 3. Wie lautet die Verteilung der Augenzahl beim Zufallsexperiment "Werfen von 2 echten Wrfeln"? (siehe unten) 4. Zeichnen Sie die Verteilungsfunktion und berechnen Sie einige Kenngren der Verteilung (Grundgesamtheit). 5. Fhren Sie das Zufallsexperiment nun 10-mal mit 2 echten Wrfeln durch und vergleichen Sie die empirische und die tatschliche Verteilungsfunktion. Berechnen Sie einige Kenngren Ihrer Stichprobe und vergleichen Sie mit den korrespondierenden Kenngren der Grundgesamtheit. 6. Kennen Sie den Begriff Gau'sche Glockenkurve? Unter welchem Namen ist die zugehrige Verteilung bekannt? Worin besteht die besondere Bedeutung dieser Verteilung? Der "alte" 10- DM-Schein enthlt sowohl eine Grafik der Dichtefunktion wie auch die recht komplizierte explizite Formel der Dichtefunktion (siehe unten). 7. Wie lautet der zentrale Grenzwertsatz? Wie ist er zu interpretieren? 8. Welche weiteren wichtigen diskreten und kontinuierlichen Verteilungen sind Ihnen bekannt und wie lauten jeweils die Verteilungsfunktionen?
  • Folie 18
  • Inhalte des Theorieblocks 1. Zufallsexperimente, Zufallsvariablen und Wahrscheinlichkeit 2. berblick ber die Mathematische Statistik 3. Berechnen eines Konfidenz-Intervalls
  • Folie 19
  • Ziehen von Rckschlssen aus einer Stichprobe Historisch: Erste statistische Erhebungen in Preuen zur Zeit des Groen Kurfrsten (1620 1688) durchgefhrt und Ergebnisse als Staatsgeheimnisse gehtet
  • Folie 20
  • Stichprobe vs. Grundgesamtheit
  • Folie 21
  • Der Tenor von Statistik Frage: Welche Aussage ber eine unbekannte Kennzahl (wahrer Parameter) der Grundgesamtheit kann aufgrund der Beobachtung der korrespondierenden realisierten (empirischen, beobachteten, bekannten) Kennzahl der Stichprobe gemacht werden? Mittel: Entwicklung und Begrndung von Verfahren zur Auswertung von zufallsabhngigen Beobachtungsdaten, mit denen sich "vernnftige" Entscheidungen bei ungewisser Sachlage treffen lassen
  • Folie 22
  • Konfidenzniveau Ein Verfahren hat eine Sicherheit (Erfolgswahrscheinlichkeit, Konfidenz- Niveau) von z.B. 0.95, wenn es im Mittel in 95 von 100 Durchfhrungen zu einer richtigen Entscheidung fhrt, und entsprechend eine Irrtumswahrscheinlichkeit von 0.05; d.h. Im Mittel fhren 5 von 100 Durchfhrungen zu einer falschen Entscheidung.
  • Folie 23
  • Einschrnken der gesuchten theoretischen Verteilung auf eine Klasse (parametrische Tests) Bei konkreten Problemen liegen oft genaue oder gewisse Kenntnisse hinsichtlich der "Rahmenbedingungen" eines Zufallsexperimentes vor (z.B. bei einer Lotterie: "n-malige Stichprobenentnahme ohne Zurcklegen von Kugeln"), so dass die Menge aller in Frage kommenden theoretischen Verteilungen auf eine Klasse von Verteilungen eingeschrnkt werden kann.
  • Folie 24
  • Parametrische Tests Verteilungsannahme Einschrnkung auf eine Klasse von Verteilungen, die sich nur noch durch Kenngren wie Lage- oder Streumae (z.B. Erwartungswert, Varianz) unterscheiden Zufallsvariablen Abhngig oder unabhngig? Meist werden sie als unabhngig vorausgesetzt
  • Folie 25
  • Statistische Fragestellungen Beispiel: Bei 100-maligem Wrfeln mit den Augensummen x 1,,x 100 interessiere der unbekannte Erwar