TEIL 3: MESSEN UND SKALIEREN - Willkommen … ist schwierig, geeignete Items für eine solche Skala...
Transcript of TEIL 3: MESSEN UND SKALIEREN - Willkommen … ist schwierig, geeignete Items für eine solche Skala...
Dozent: Dawid Bekalarczyk
Universität Duisburg-Essen
Fachbereich Gesellschaftswissenschaften
Institut für Soziologie
Lehrstuhl für empirische Sozialforschung
Raum: LF 161
TTEEIILL 33:: MMEESSSSEENN UUNNDD SSKKAALLIIEERREENN
Dozent: Dawid Bekalarczyk
Universität Duisburg-Essen
Fachbereich Gesellschaftswissenschaften
Institut für Soziologie
Lehrstuhl für empirische Sozialforschung
Raum: LF 161
GLIEDERUNG
Das Messen – eine Umschreibung
Skalenniveaus von Variablen
Drei Gütekriterien von Messungen
Objektivität
Reliabilität
Validität
Konstruierte Skalen in den Sozialwissenschaften
Likert-Skala
Guttman-Skala
Dozent: Dawid Bekalarczyk
Universität Duisburg-Essen
Fachbereich Gesellschaftswissenschaften
Institut für Soziologie
Lehrstuhl für empirische Sozialforschung
Raum: LF 161
Das Messen – eine Umschreibung
� Der Prozess der Datenerhebung kann auch als Messen bezeichnet werden � Feststellung
der Merkmalsausprägungen von Untersuchungseinheiten (z.B. „Feststellung, wie viel eine
Person wiegt“ oder „Feststellung, wie aggressiv ein Schulkind auf einen Reiz reagiert“)
� Messen ist die Zuordnung von Zahlen zu Objekten oder Ereignissen nach festgelegten Re-geln und zwar so, dass numerische Relative den empirischen Relativen entsprechen
Begriff Empirisches Relativ Numerisches Relativ
Definition Eine Menge von Objekten, über die
eine Relation definiert wurde bzw.
die entsprechend der Relation
geordnet wurden
Eine Menge von Zahlen, über
die eine Relation definiert wur-
de und die entsprechend sor-
tiert wurden
Beispiel (Messung der Kör-
pergröße an drei Personen
in cm)
Otto > Fritz > Hugo 186 > 179 > 168
Dozent: Dawid Bekalarczyk
Universität Duisburg-Essen
Fachbereich Gesellschaftswissenschaften
Institut für Soziologie
Lehrstuhl für empirische Sozialforschung
Raum: LF 161
� Eine Messung im o.g. Sinne ist eine strukturtreue Abbildung � Die Beziehungen der Objek-
te werden durch die Beziehungen der zugeordneten Zahlen korrekt wiedergegeben
� Strukturtreue Abbildungen werden als Morphismen bezeichnet
Beispiel: Vier Schülern A, B, C, D werden ihre Schulnoten in Mathe zugeordnet:
Isomorphismus: umkehr-bar eindeutige Abbildung A <-----------> 1 B <-----------> 2 C <-----------> 3 D <-----------> 4
Homomorphismus: nicht umkehrbar eindeutige Ab-bildung
Dozent: Dawid Bekalarczyk
Universität Duisburg-Essen
Fachbereich Gesellschaftswissenschaften
Institut für Soziologie
Lehrstuhl für empirische Sozialforschung
Raum: LF 161
Skalenniveaus von Variablen
Dozent: Dawid Bekalarczyk
Universität Duisburg-Essen
Fachbereich Gesellschaftswissenschaften
Institut für Soziologie
Lehrstuhl für empirische Sozialforschung
Raum: LF 161
Drei Gütekriterien von Messungen
1. Objektivität (Intersubjektivität):
� Durchführungsobjektivität – Unabhängigkeit zwischen der durchführenden Person und der
Durchführung (z.B. standardisierte Fragen; kein Spielraum für verschiedene Interviewer)
� Auswertungsobjektivität – Unabhängigkeit zwischen einer Auswertung und der auswerten-
den Personen (deshalb gibt es etablierte statistische Analyseverfahren)
� Interpretationsobjektivität – Unabhängigkeit zwischen der interpretierenden Person und
der Interpretation (offene, publizierte Argumentation)
Dozent: Dawid Bekalarczyk
Universität Duisburg-Essen
Fachbereich Gesellschaftswissenschaften
Institut für Soziologie
Lehrstuhl für empirische Sozialforschung
Raum: LF 161
2. Reliabilität (Zuverlässigkeit von Messungen):
� Ausmaß, bei wiederholten Messungen mit einem Messinstrument unter den gleichen Be-dingungen zu dem gleichen Ergebnis zu gelangen
Verfahren zur Überprüfung der Reliabilität:
� Test-Re-Test – ein Test wird an den selben Objekten zwei Mal durchgeführt und es werden
die Ergebnisse auf ihre Übereinstimmung geprüft
� Parallel-Test – die Messungen werden mit zwei unterschiedlichen (leicht abweichenden) In-
strumenten durchgeführt (z.B. mit zwei ähnlichen Fragebögen)
� Konsistenz (split-half-Methode) – Spaltung eines Messinstruments in zwei Hälften und Ver-
gleich der Ergebnisse
Dozent: Dawid Bekalarczyk
Universität Duisburg-Essen
Fachbereich Gesellschaftswissenschaften
Institut für Soziologie
Lehrstuhl für empirische Sozialforschung
Raum: LF 161
3. Validität (Gültigkeit von Messungen)
� Ausmaß, in dem das Messinstrument tatsächlich das misst, was es messen soll
Validitätskonzepte:
� Inhaltsvalidität – bezieht sich darauf, dass möglichst alle Aspekte / Dimensionen des Sach-verhalts, die gemessen werden sollten, berücksichtigt werden (z.B. bei der Messung des
Musikwissens sollten alle gängigen Musikrichtungen abgefragt werden und nicht nur Rock
und Jazz)
� Kriteriumsvalidität – bezieht sich auf den Zusammenhang zwischen den empirisch gemes-
senen Ergebnissen des Messinstrumentes und einem anders gemessenen externen Krite-rium
� Vorhersagevalidität (Prädiktive Validität) – das externe Kriterium liegt in der Zukunft (z.B. mit einem Einstellungstest soll vorausgesagt werden, wie gut jmd. seine Arbeit
später machen wird)
Dozent: Dawid Bekalarczyk
Universität Duisburg-Essen
Fachbereich Gesellschaftswissenschaften
Institut für Soziologie
Lehrstuhl für empirische Sozialforschung
Raum: LF 161
� known-groups – sind zwei Gruppen bekannt, die auf der interessierenden Dimension
Unterschiede aufweisen, so muss ein Messinstrument diese beiden Gruppen unter-scheiden können (die Gruppenzugehörigkeit ist hier also das externe Kriterium
� Expertenvalidierung – Experten überprüfen gefühlsmäßig die Gültigkeit des Messinstru-mentes
� Konstruktvalidität
� liegt dann vor, wenn aus dem Konstrukt empirisch überprüfbare Zusammenhänge die-
ses Konstruktes mit anderen Konstrukten theoretisch hergeleitet und empirisch über-prüft werden können
� ist in dem Sinne die Überprüfung von statistischen Modellen (die auf Hypothesen ba-
sieren)
� dafür stehen komplexe statistische Methoden zur Verfügung
Dozent: Dawid Bekalarczyk
Universität Duisburg-Essen
Fachbereich Gesellschaftswissenschaften
Institut für Soziologie
Lehrstuhl für empirische Sozialforschung
Raum: LF 161
Konstruierte Skalen in den Sozialwissenschaften
� Skalen allgemein sind Homomorphismen, welche für Messungen genutzt werden, und somit
die Ergebnisse der Konstruktion von Messinstrumenten darstellen
� Methoden zur Konstruktion solcher Instrumente bezeichnet man daher als Skalierungsver-fahren
� Konstruierte Skalen: Spezielle Skalen, bei denen die Kombination eine Reihe von „Items“,
die entlang einer inhaltlichen Dimension messen, die Skalenwerte liefern
Dozent: Dawid Bekalarczyk
Universität Duisburg-Essen
Fachbereich Gesellschaftswissenschaften
Institut für Soziologie
Lehrstuhl für empirische Sozialforschung
Raum: LF 161
Items:
� Die kleinsten Bestandteile eines Erhebungsinstrumentes (z.B. einzelne Fragen, Aufgaben
oder Aussagen, die verbunden sind mit der Aufforderung, den Grad der Zustimmung bzw.
Ablehnung oder einer anderen Bewertung anzugeben)
� Man erschließt soziale Einstellungen aus Reaktionen auf sorgfältig ausgewählten State-ments (Items), die als Indikatoren für eine direkt nicht beobachtbare Einstellung betrachtet
werden
BEISPIEL:
Einstellung: Ausländerfeindlichkeit
Item 1: „In wirtschaftlich schlechten Zeiten wie
diesen sollten Ausländer lieber wieder gehen“.
Item 2: „Ausländer können sich nicht an-
passen.“
Dozent: Dawid Bekalarczyk
Universität Duisburg-Essen
Fachbereich Gesellschaftswissenschaften
Institut für Soziologie
Lehrstuhl für empirische Sozialforschung
Raum: LF 161
Weitere Anmerkungen:
� Skalierungsverfahren werden in der empirischen Sozialforschung überwiegend zur Messung von Einstellungen verwendet
� Einstellungen werden dabei als latente Variablen aufgefasst – Ziel der Einstellungsmessung
ist die Feststellung der Ausprägung der latenten Variablen bei den Befragten
� Zur Messung werden den Befragten Aussagen vorgelegt, auf welche die Befragten mit Zu-
stimmung oder Ablehnung reagieren sollen (Items)
� Bei diesen Items geht man davon aus, dass sie die interessierenden Auffassungen / Einstel-
lungen über die Beantwortung zum Ausdruck bringen
� Über verschiedene Regeln, welche von der verwendeten Skalenkonstruktion abhängen,
werden nun die Ergebnisse der Statements einzelner Personen zu einem Skalenwert pro Person verarbeitet
Beispiele für Items zu verschiedenen Themen wie z.B. Politik, mit jeweils fünf Antwortmölichkeiten:
Beispiele für Items zu verschiedenen Themen wie z.B. Politik, mit jeweils fünf Antwortmö
Dozent: Dawid Bekalarczyk
Universität Duisburg-Essen
Fachbereich Gesellschaftswissenschaften
Institut für Soziologie
Lehrstuhl für empirische Sozialforschung
Raum: LF 161
Beispiele für Items zu verschiedenen Themen wie z.B. Politik, mit jeweils fünf Antwortmög-
Dozent: Dawid Bekalarczyk
Universität Duisburg-Essen
Fachbereich Gesellschaftswissenschaften
Institut für Soziologie
Lehrstuhl für empirische Sozialforschung
Raum: LF 161
Dozent: Dawid Bekalarczyk
Universität Duisburg-Essen
Fachbereich Gesellschaftswissenschaften
Institut für Soziologie
Lehrstuhl für empirische Sozialforschung
Raum: LF 161
Likert-Skala:
1. Schritt:
� Die Konstruktion einer Likert-Skala beginnt mit der Sammlung einer großen Zahl von Items (diese Items stellen hierbei Aussagen dar, von denen angenommen wird, dass sie die inter-
essierende Einstellung wiedergeben)
� Diese Items werden einer Stichprobe von Personen vorgelegt, die Befragten werden nun
aufgefordert, zu jedem Statement Stellung zu beziehen; jedes Item hat die gleichen Ant-
wortvorgaben, z.B.:
� stimme voll und ganz zu
� stimme eher zu
� teils / teils
� stimme eher nicht zu
� stimme gar nicht zu
Dozent: Dawid Bekalarczyk
Universität Duisburg-Essen
Fachbereich Gesellschaftswissenschaften
Institut für Soziologie
Lehrstuhl für empirische Sozialforschung
Raum: LF 161
2. Schritt:
� Kodierung der Antwortmöglichkeiten mit Zahlenwerten und ggf. Umkehrung der Zahlen-werte bei negativ formulierten Items, damit die Zahlenwerte immer der gleichen Einstel-
lungsrichtung entsprechen
Beispiel – Einstellung gegenüber der Familie:
ITEM A: “Meine Familie bedeutet mir
sehr viel”
ITEM B: “Meine Familie spielt in meinem
Leben keine große Rolle”
Ausprägungen: Werte: Ausprägungen: Werte:
stimme voll und ganz zu 1 stimme voll und ganz zu 5
stimme eher zu 2 stimme eher zu 4
teils / teils 3 teils / teils 3
stimme eher nicht zu 4 stimme eher nicht zu 2
stimme gar nicht zu 5 stimme gar nicht zu 1
Dozent: Dawid Bekalarczyk
Universität Duisburg-Essen
Fachbereich Gesellschaftswissenschaften
Institut für Soziologie
Lehrstuhl für empirische Sozialforschung
Raum: LF 161
3. Schritt – Item-Analyse:
� Das statistische Verfahren „Item-Analyse“ (Überprüfung der Eindimensionalität) soll ungee-ignete Items aus der Skala aussondern
� Ungeeignete Items: Personen mit sehr unterschiedlicher Einstellung beantworten ein Item
ähnlich oder alle Personen stimmen dem Item zu bzw. alle Personen lehnen es ab
Dozent: Dawid Bekalarczyk
Universität Duisburg-Essen
Fachbereich Gesellschaftswissenschaften
Institut für Soziologie
Lehrstuhl für empirische Sozialforschung
Raum: LF 161
Guttman-Skala:
� Die Guttman-Skala basiert auf der Vorgabe einer Reihe von Aussagen, die in bezug auf die interessierende Einstellung immer extremer werden
� Die Fragen / Aussagen lassen sich nur mit ja / nein beantworten
� Es wird angenommen, dass ein Befragter mit einer bestimmten Einstellung alle Aussagen, die weniger extreme Anschauungen ausdrücken als er selbst besitzt, zustimmt und alle
Aussagen, die extremere Anschauungen ausdrücken, ablehnt
BEISPIEL (Verdrossenheit gegenüber Managern großer Wirtschaftskonzerne):
1. Manager können sich oftmals in die Probleme einfacher Arbeiter nicht hineinversetzen
2. Managern sind Geld und andere Vorteile oft wichtiger, als sich um die Probleme der Arbei-
ter zu kümmern
3. Manager würden über Leichen gehen, um an Geld und Macht zu gelangen – wer und was
dabei auf der Strecke bleibt, interessiert sie nicht
Aufgaben: 1 2 3 4 5 6 7 8 9 10
Dozent: Dawid Bekalarczyk
Universität Duisburg-Essen
Fachbereich Gesellschaftswissenschaften
Institut für Soziologie
Lehrstuhl für empirische Sozialforschung
Raum: LF 161
10
Dozent: Dawid Bekalarczyk
Universität Duisburg-Essen
Fachbereich Gesellschaftswissenschaften
Institut für Soziologie
Lehrstuhl für empirische Sozialforschung
Raum: LF 161
Probleme bei der Guttman-Skala:
� Es ist schwierig, geeignete Items für eine solche Skala zu finden, welche eindimensional sind
und gleichzeitig an Intensität monoton zunehmen
� Es können inkonsistente Antwortmuster auftreten