Sitzung 3: Operationalisierung und Messen Flashcards
statistische Einheit
Träger (zum Beispiel Wähler) von interessierenden Eigenschaften (zum Beispiel Wahlentscheidung)
statistische Masse
Nach sachlichen, räumlichen und zeitlichen Kriterien gebildete Gesamtheit der statistischen Einheiten (alle Wähler)
Merkmal
Eigenschaft eines Untersuchungsobjekts
Merkmalsträger
Objekt, an dem ein bestimmtes Merkmal erhoben wird (= Statistische Einheit).
Merkmalsausprägungen
Mögliche Realisationen des Merkmals (zum Beispiel alle Parteien)
Merkmalswert
Konkrete Realisation der Merkmalsausprägung an einem Merkmalsträger
(Zum Beispiel die Partei, die die Person xy gewählt hat)
Konstante
Merkmal, das nur eine Merkmalsausprägung aufweist (zum Beispiel gibt es nur eine Partei)
Variable
Merkmal, bei dem der Merkmalsträger mindestens zwei Merkmalsausprägungen annehmen kann
Operationalisierung
Messbarmachung einer Variable
Weg vom Konzept zur Messung
Variablen lassen sich nach fünf weiteren Aspekten unterscheiden. Was sind diese?
- Art der Merkmalsausprägung qualitativ vs. quantitativ
- Messniveau stetig, approximativ-stetig, diskret
- Messebene Individualebene vs. Kollektivebene
- Stellung in der Hypothese AV vs. UV
- Manifeste Variablen vs. latente Variablen
A) Stetig
B) Diskret
C) approximativ-stetig
A) zum Beispiel Alter: unendlich viele mögliche Werte
B) zum Beispiel Anzahl Kinder in einer Familie: endlich viele mögliche Werte
C) zum Beispiel die Olympischen Spiele: finden nicht jedes Jahr statt sonder alle 4
A) Individualebene
B) Kollektivebene
A) zum Beispiel eine Person oder ein Land
B) zum Beispiel durchschnittliche Körpergröße
A) manifeste Variablen
B) latente Variablen
A) direkt messbar, zum Beispiel demographische Daten wie Alter oder politisches Interesse
B) nicht direkt messbar, abstraktes theoretisches Konzept, zum Beispiel Demokratie, Variablen lassen sich nur über mehrere Indikatoren konstruieren
Items oder ….
Indikatoren
Statistische Massen können für einen ……. oder einen …….. deniert sein:
Zeitpunktbezogen: ………..
Zeitraumbezogen: …………….
- Zeitpunkt
- Zeitraum
- Bestandsmassen
- Bewegungsmassen
Bestandmassen Beispiele
Wohnbevölkerung zum 1. Januar eines Jahres
Schuldenstand am Ende des Quartals
Anzahl der Abgeordneten im Parlament
Studierende an einer deutschen Universität
Bewegungsmassen Beispiele
Geburten/Todesfälle in einem Jahr
Bruttoinlandsprodukt eines Landes
Anmeldungen im Einwohnermeldeamt
Anzahl an kriegerischen Konikten seit 1945
Über die Bestandsfortschreibung sind Bestands- und Bewegungsmassen miteinander verknüpft (= ………. Massen).
Korrespondierende
Bestimme Merkmalsträger, Merkmalsausprägung und Merkmalswert für das Merkmal: Alter
Merkmalsträger: natürliche Person
Merkmalsausprägung: 0, 1, 2, …. Jahre
Merkmalswert: 25
Bestimme Merkmalsträger, Merkmalsausprägung und Merkmalswert für das Merkmal: Geschlecht
Merkmalsträger: natürliche Person
Merkmalsausprägung: männlich/weiblich
Merkmalswert: männlich
Bestimme Merkmalsträger, Merkmalsausprägung und Merkmalswert für das Merkmal: politische Selbsteinstufung auf einer Skala von 1-10
Merkmalsträger: natürliche Person
Merkmalsausprägung: 1,2,3,…,8,9,10 links…..rechts
Merkmalswert: 4
Bestimme Merkmalsträger, Merkmalsausprägung und Merkmalswert für das Merkmal: Haarfarbe
Merkmalsträger: natürliche Person
Merkmalsausprägung: blond, braun, schwarz, rot
Merkmalswert: blond
Bestimme Merkmalsträger, Merkmalsausprägung und Merkmalswert für das Merkmal: Haushaltsgröße
Merkmalsträger: Haushalt
Merkmalsausprägung: 1, 2, 3, …. Personen
Merkmalswert: 3
Bestimme Merkmalsträger, Merkmalsausprägung und Merkmalswert für das Merkmal: Anzahl an Parteien in der Regierung
Merkmalsträger: Regierung
Merkmalsausprägung: 1,2, 3, …
Merkmalswert: 2
Jede Messung ist die Abbildung einer Eigenschaft eines ………….. durch einen symbolischen Wert (Bild)
empirischen Objekts (Urbild)
Was ist der Definitionsbereich?
Was ist der Wertebereich?
Der Definitionsbereich beschreibt dabei die Menge aller Originalwerte
der Wertebereich beschreibt die Menge aller Bildwerte.
Was sind eindeutige Abbildungen?
Eindeutige Abbildungen sind solche, bei denen jedem Wert aus dem Denitionsbereich genau ein Wert aus dem Wertebereich zugeordnet werden kann (mehreren Originalwerten kann auch derselbe Bildwert zugeordnet werden)
Beispiel Haarfarbe
1. dunkles blond
2. helles blond
= beides Kann blond zugeordnet werden
Was ist eine Bijektion (eineindeutige Abbildung)?
Eineindeutige Abbildungen (Bijektion) sind solche, bei denen auch jedem Bildwert nur genau ein Originalwert zugeordnet werden kann.
Was ist neben dem Abbilden der Objekte noch wichtig für das Messen?
Neben dem Abbilden der Objekte ist auch das der Beziehungen (Relationen) zwischen den Objekten wichtig für das Messen
Wie wird das empirische Relativ abgebildet?
Das empirisches Relativ (Beziehungsgeflecht der Objekte in der Wirklichkeit) wird abgebildet in Form eines numerischen Relativs
Was bedeutet ähnlich?
Zwei Relative heißen ähnlich, wenn sie dieselbe Anzahl an Relationen enthalten und sich die jeweiligen Relationen auf dieselbe Anzahl an Objekten beziehen
Strukturerhaltend oder Morphismus
Eine Abbildung, die ein empirisches Relativ in ein ähnliches Relativ abbildet
Homomorphismus
strukturerhaltende Abbildung, bei der jeder Relation im empirischen Relativ eine Relation im numerischen Relativ zugeordnet werden kann
Isomorphismus
jeder Relation aus dem empirischen Relativ kann eine einzige Relation im numerischen Relativ zugeordnet werden und umgekehrt (Bijektion)
Messen
Messen kann damit definiert werden als die homomorphe Abbildung eines empirischen Relativs in ein numerisches Relativ.
Was bestimmt das Skalenniveau?
Art der Relation
Je höher das …………… desto mehr lässt sich über eine bestimmte Relation aussagen.
Skalenniveau
Was sind die vier Skalenniveaus?
- Ratioskala (am meisten Informationsgehalt)
- Intervallskala
- Ordinalskala
- Nominalskala (am wenigsten Informationsgehalt)
Nominalskala
- geringster Informationsgehalt
- Numerische Kodierung darf ausschließlich als Symbol verstanden werden (z.B. Frau = 0, Mann = 1)
- qualitative Unterscheidung der Objekte (Einteilung in Kategorien)
- Kategoriensystem muss erschöpfend und trennscharf sein
- Dichotome Variablen (zwei Ausprägungen - Fragen mit 2 Auswahlmöglichkeiten, zum Beispiel: „Sind Sie zur Wahl gegangen? Ja/Nein“) werden auch Dummy-Variablen genannt
- ZUM BEISPIEL GESCHLECHT, KANZLERKANDIDATEN, RELIGION
Was ist eine Dummy Variable?
- Kategorien oder Gruppen in numerischer Form darstellen
- Umwandlung von qualitativen in quantitativen Daten
A) Was ist trennscharf?
B) Was ist erschöpfend?
A) Trennung zwischen verschiedenen Kategorien ist deutlich und präzise. Keine Überlappungen.
B) Alle verfügbaren Daten werden in die Analyse einbezogen. Keine Stichprobe, alles.
Ordinalskala
- Merkmale lassen sich in Rangfolge bringen (A ist größer, stärker, länger als B)
- Abstände zwischen Merkmalswerten sind jedoch nicht interpretierbar
- Es muss vorher definiert werden, wie die Werte einer Ordinalskala inhaltlich zu interpretieren sind (z.B. Schulnoten 1 = bester Wert; 6 = schlechtester, wohingegen bei einem Punktebasierten Test eine höhere Punktzahl in der Regel besser ist)
- ZUM BEISPIEL MILITÄRISCHE RÄNGE, BUNDESLIGATABELLE, SCHULNOTEN, DEMOKRATIESKALEN
Intervallskala
- Die Abstände zwischen Werten auf einer Intervallskala sind interpretierbar, ihre Verhältnisse jedoch nicht.
- Kein natürlicher Nullpunkt vorhanden, sondern willkürlich festgelegt.
- Intervallskalierte Variablen können ausschließlich mit Zahlen dargestellt werden.
- Addition und Subtraktion als mathematische Operationen erlaubt.
- Ausreichend für die meisten statistischen Test- und Analyseverfahren.
- ZUM BEISPIEL TEMPERATUR IN CELSIUS, INTELLIGENZQUOTIENT, KALENDERZEIT
Ratio- oder Verhältnisskala
- Zusätzlich Verhältnisse interpretierbar.
- Natürlicher Nullpunkt vorhanden.
- Absolutskala als Sonderfall der Ratioskala, bei der zusätzlich eine natürliche Einheit vorliegt (z.B. Anzahl an Hausbewohnern, Gesamtzahl an Stimmen für eine Partei bei einer Wahl)
- ZUM BEISPIEL LÄNGE, TEMPERATUR IN KELVIN, EINKOMMEN, STIMMENANTEILE IN WAHLEN
A) Modus
B) Median
A) Häufigster Wert
B) mittlerer Wert
Beispiele:
A) Nominialskala
B) Ordinalskala
C) Intervallskala
D) Verhältnisskala (Ratioskala)
A) Geschlecht, Kanzlerkandidaten, Religion
B) Militärische Ränge, Bundesligatabelle, Schulnoten, Demokratieskalen
C) Temperaturin °C, Intelligenzquotient, Kalenderzeit
D) Länge, Temperatur in Kelvin, Einkommen, Stimmenanteile bei Wahlen
Welche mathematischen Durchführungen sind überhaupt erlaubt?
Nicht alle ……………. erhalten die Strukturtreue einer Abbildung
Transformationen
(Zum Beispiel Addieren, subtrahieren, multiplizieren, dividieren)
Wann gilt ein statistisches Verfahren als zulässig?
„Als zulässig gilt ein statistisches Verfahren, wenn die Wahrheit oder Falschheit einer statistischen Aussage unter allen zulässigen Transformationen der Skalenwerte unverändert bleibt. (Schnell/Hill/Esser 135)
Der Idealtypus ist kein normatives Ideal sondern ………………
Ein Mittel der Erkentniss
Idealtypus Merkmale
- einseitige Steigerung eines oder einiger Gesichtspunkte
- nirgend in der Wirklichkeit empirisch vorfindbar (Utopie)
- Für den Zweck der Erforschung und Veranschaulichung aber leistet jener Begriff vorsichtig angewendet seine spezischen Dienste
Was ist ein Adäquatsproblem?
Es bezieht sich auf die Frage, wie gut ein statistisches Modell oder eine statistische Methode die beobachteten Daten beschreibt oder erklärt. Es geht darum, ob das gewählte Modell ausreichend ist, um die Variation in den Daten angemessen zu erklären, oder ob es Verbesserungen oder Erweiterungen erfordert.
Beispiel: Das Konzept der Entwicklung, bzw. des Entwicklungsstandes eines Landes lässt sich nicht direkt messen → Messung mittels Indikator(en) - Messung NUR mittels BIP (=Problem!)
→ Hier liegt eine groÿe logische Diskrepanz zwischen dem Idealtypus und dem statistischen Gattungsbegri vor, da noch weitere Faktoren neben dem BIP eine Rolle spielen dürften.
Was ist ein Index?
Ein Index ist die Kombination mehrerer Indikatoren zu einer Maßzahl um eine latente Variable zu messen
Welche drei Ebenen sind bei der Indexbildung zu beachten?
- Konzeptualisierung: Was soll gemessen werden? Welche Komponenten konstituieren das theoretische Konstrukt?
- Operationalisierung: Welche Indikatoren lassen sich für die Messung heranziehen?
- Aggregation: Wie lassen sich die Einzelwerte der Indikatoren sinnvoll zu einem Gesamtwert verrechnen?
Was ist ein Beispiel für einen additiven Index?
HDI (bis 2009)
Was ist ein Beispiel für einen Multiplikativen Index?
Vanhanens Index of Democratization (ID)
Die Aggregation am Ende verläuft Multiplikativ, nicht additiv
Was sind Skalen in der Messtheorie?
Skalen sind eine Unterform der Indizes, die nach explizit anzugebenden Kriterien konstruiert werden
Die einzelnen Indikatoren, die eine Skala misst, werden zumeist …………. genannt
Items
Was ist die Likert-Skala?
Die bekannteste Skala ist die sogenannte Likert-Skala. Dabei werden die einzelnen Items auf einer mehrstufigen Skala (mindestens 5-stufig) gemessen. Anschließend werden Summen- oder Mittelwerte berechnet, das heißt die Items werden addiert und, zur Berechnung der Mittelwerte, anschließend durch ihre Anzahl dividiert.
„Umgedrehte Items“ bei der Likert-Skala
Zunächst werden gegensinnig formulierte Items umgepolt, dann wird die Summe über alle Items gebildet.
- Es fällt so auf, wenn Probanden immer dasselbe ankreuzen.
Likert-Skala: Wann sind Items ungeeignet?
- Personen mit unterschiedlichen Einstellungen auf ein Item ähnlich/gleich antworten.
- Die Antworten auf ein Item nichts mit den Antworten auf die anderen Items gemein hat.
→ wenn das Item also die Eigenschaft der Skala eindimensional zu messen unterminiert.
Was ist die Guttman-Skala?
Dafür wird ein Set von Items erhoben, die sich strikt nach ihrem Schwierigkeitsgrad staffeln lassen. Zum Beispiel erfasst das erste Item, ob eine Person selbst einen Computer starten kann, das letzte Item, ob der Proband selbst Codes in Programmiersprache schreiben kann. Der Proband antwortet mit Ja oder Nein. Am Ende werden die bejahten Items zusammengezählt.
Es wird davon ausgegangen, dass die Aussagen in eine Reihenfolge gebracht werden können
(Annahme: Wenn ein Befragter das letzte Item bejaht, dann sollte er auch alle davor stehenden Items bejahen).
Die Addition der bejahten Items ergibt den Guttman-Skalenwert.
Bei perfekter Guttman-Skala (d.h. wenn nur zulässige Antwortkombinationen auftreten) kann aus dem Skalenwert das genaue Antwortmuster rückgeschlossen werden.
Was ist neben Indizes und Skalen eine Möglichkeit, etwas zu messen?
Typologien
Kombiniert man mehrere ……………….., so erhält man eine Typologie.
Voneinander unabhängige Merkmale
Wann ist eine Messung eine gute Messung? (Die drei Gütekriterien)
- Objektivität
- Reliabilität
- Validität
Definition Objektivität
Unter Objektivität verstehen wir die Unabhängigkeit einer Messung von demjenigen, der die Messung macht
A) Durchführungsobjektivität
B) Auswertungsobjektivität
A) z.B. verletzt wenn dieselben Fragen von den Befragten in einem Interview je nach Interviewer unterschiedlich beantwortet werden = Interviewereffekt
B) z.B. verletzt wenn zwei Dozierende zu unterschiedlichen Ergebnissen bei der Benotung derselben Arbeit kommen
Was bedeutet reaktiv?
Problematik umso größer je reaktiver das Messverfahren ist, d.h. wenn sich der Gegenstand des Verfahrens durch die Anwendung des Verfahrens abändert.
Wenig reaktives Testverfahren: klassische Klausur
Reliabilität
Zuverlässigkeit einer Messung, d.h. wenn die wiederholte Verwendung des Messinstruments am selben Objekt immer zum selben Ergebnis führt
- Messvorgang ist wiederholbar und konsistent
Was ist die Test-Retest-Methode?
- Wiederholung der Messung zu einem späteren Zeitpunkt und Vergleich der beiden Ergebnisse mittels Korrelation
- Nur unter Annahme der Stabilität der zu messenden Eigenschaft einzusetzen
- Problem bei Lerneffekten / Panelbefragungen
- Bei Wiederholung zu xten Mal funktioniert es auch nicht mehr
Paralleltest-Methode
- Messung des Konstrukts mit Hilfe von zwei unterschiedlichen Methoden. Hohe Korrelation unter diesen → hohe Reliabilität
- Problematik: es wird vorausgesetzt, dass die Vergleichsmessung selber reliabel ist
Was sind Methoden, wie man Reliabilität feststellen kann?
- Test-Retest-Methode
- Paralleltest-Methode
- Inter-Rater-Reliabilität
- Inter-Item Reliabilität
Wann spricht man von einer internen Konsistenz?
Korrelation zwischen Items einer Skala
Berechnung durch Cornbach-Alpha (0;1)
Bei vielen Items ist Cronbach schnell hoch, bei wenigen recht niedrig
Was ist Validität?
Gültigkeit einer Messung, d.h. wird wirklich das gemessen, was man messen will?
Valide = gültig
Was ist Augenscheinvalidität?
Augenscheinvalidität = face validity = Prima facie Validität
Wenn ein Messinstrument plausibel ist und der Intuition des Forschers entspricht
Problem der Subjektivität
Was ist Inhaltsvalidität?
Wenn alle relevanten Dimensionen eines Konzepts durch das Messinstrument abgedeckt werden - alle Aspekte werden berücksichtigt
Bsp. 1 - Vanhanens Demokratiemessung: Partizipation und Wettbewerb müssen jeweils durch mindestens einen Indikator abgedeckt sein
Bsp. 2 - IQ-Test: Reliabilität und Objektivität lassen sich über Test gut gewährleisten, es ist aber unklar ob wirklich alle Aspekte menschlicher Intelligenz adäquat abgeprüft werden (z.B. soziale Intelligenz)
Was ist Kriteriumsvalidität?
- Überprüfung der Validität des Messvorschlags anhand eines bereits bestehenden Messinstruments
- Prognosevalidität (Beispiel: Wahlforschung → Vorhersage von Wahlergebnissen durch Umfragen)
- externe oder Übereinstimmungsvalidität (Beispiel: Demokratiemessung → stimmen die Ergebnisse unterschiedlicher Messmethoden überein?)
= man überprüft also etwas, was schon da ist.
Was ist Konstruktvalidität?
- Wir gehen davon aus, das eine bestimmte Theorie stimmt
- Messinstrument, Überprüfung der Daten
- Ergebnis: gegensprüchlich der Theorie
- Wir gehen nicht davon aus, dass die Theorie falsch ist, sondern dass unsere Messung falsch war
Problem: Ständige Annahme, dass die Theorie stimmt
Was ist eine notwendige Bedingung? (+Beispiel)
muss erfüllt sein, damit eine Aussage wahr ist.
Das Erfüllen dieser Bedingung reicht jedoch nicht zwangsläug bereits aus um eine Aussage zu bewahrheiten. Es können noch weitere Bedingungen notwendig sein.
Das Besitzen eines ausgefüllten Lottoscheins ist eine notwendige Bedingung für das Knacken des Jackpot. (Es gibt noch weitere notwendige Bedingungen: man muss die richtigen Zahlen haben).
Was ist eine hinreichende Bedingung? (+Beispiel)
wenn erfüllt, muss auch die Aussage wahr sein.
Tritt die Aussage ein heißt dies jedoch nicht zwangsläug, dass sie es aufgrund des Vorliegens einer bestimmten hinreichenden Bedingung tut - es kann auch auf eine andere Bedingung zurückgehen.
Das Knacken des Jackpot ist eine hinreichende Bedingung dafür die richtigen Zahlen auf dem Lottoschein zu haben.
Was heißt notwendig und hinreichend? (+Beispiel)
ist eine Bedingung dann wenn nur bei ihrem Erfüllen eine Wirkung zwangsläug eintritt (dann und nur dann)
Eine Mann ist dann und nur dann ein Junggeselle (notwendige und hinreichende Bedingung), wenn er noch nie verheiratet war.
Wiederholung:
A) Nominalskala
B) Ordinalskala
A) wahr/falsch, qualitativ
B) Merkmale in fester Reihenfolge, Abstände nicht interpretierbar, Zum Beispiel militärische Ränge (feste Reihenfolge aber Zeitpunkt bis zur nächsten Beförderung nicht immer gleich), Transitivität notwendig, quantitativ
Wiederholung:
A) Intervallskala
B) Ratioskala
A) Abstände interpretierbar, Darstellung nur durch Zahlen, kein natürlicher Nullpunkt, Verhältnisse nicht interpretierbar
B) Verhältnisse interpretierbar, natürlicher Nullpunkt
……….. ist etwas, sobald es eine Reihenfolge hat.
Quantitativ
Was ist kein zulässiges Verfahren?
Arithmetisches Mittel für Ordinale Daten
Was ist ein akzeptabler Gutmann-Skalenwert?
0,9
Wie kommt der Guttmann-Skalenwert zustande?
1 - Anzahl Fehler / (Anzahl Befragte * Items)
Wie kann man oBjektivität sichern
Durch Standardisierung
was ist interne Konsistenz?
Korrelation zwischen Items einer Skala