4. Daten / Auswahlverfahren Flashcards

1
Q

Datenursprung

A

Sollen eigene Daten erhoben werden?

  1. Primärdatenanalyse:
    selbst erhobene Daten
    + Hohe Qualität und gesicherte Verwendbarkeit
    - sehr aufwendig (= teuer)
  2. Sekundärdatenanalyse:
    Analyse verfügbarer Daten von anderen
    + viele Daten verfügbar; auch historisch (Zeitreihen)
    - Daten passen nicht immer zum Vorhaben
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wichtige Grundbegriffe:
Merkmal

A

Eigenschaft welche erhoben wird

Bei Person z.B. Alter, Einkommen, Geschlecht etc.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wichtige Grundbegriffe:
statistische Einheit

A

Träger der Informationen welche gemessen werden (Personen, Institutionen, Parteien, Staaten); auch Merkmalsträger genannt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wichtige Grundbegriffe:
statistische Masse

A

wird durch die Gesamtheit der möglichen statistischen Einheiten gebildet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wichtige Grundbegriffe:
Merkmalsausprägung

A

mögliche Werte, welche ein Merkmal annehmen kann

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wichtige Grundbegriffe:
Merkmalswert

A

Merkmalsausprägungen bei einem Merkmalsträger

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wichtige Grundbegriffe:
Variable

A

veränderliches Merkmal, bei dem ein Merkmalsträger mindestens zwei Merkmalsausprägungen annehmen kann (nicht gleichzeitig sondern alternativ)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wichtige Grundbegriffe:
Grundgesamtheit

A

Gesamtheit aller Merkmalsträger (Fälle); auch Population genannt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wichtige Grundbegriffe:
Totalerhebung

A

Erhebung aller Fälle der Grundgesamtheit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wichtige Grundbegriffe:
Stichprobe

A

gezogene Teilmenge der Grundgesamtheit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Skalen

A
  • Nominalskala
  • Ordinalskala (auch Rangskala)

Metrische Skalen:
- Intervallskala
- Ratioskala (Verhältnisskala)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Nominalskala

A
  • mögliche Merkmale bilden keine natürliche Rangfolge
  • Übereinstimmung kann bestätigt oder verneint werden
  • Häufigkeiten können gezählt werden (Bestimmung Modus möglich)
  • Beispiel: Herkunft (Bundesland)
  • Sonderfall: Dichotome Skalen (2 mögliche Werte - ja/nein)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Ordinalskala

A
  • mögliche Merkmale bilden natürliche Rangfolge
  • Größer-als Aussage möglich, Median kann berechnet werden (+ Berechnungen bei Nominalskala)
  • kein arithmetischer Mittelwert möglich
  • Beispiel: Political Rights Index
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Intervallskala

A
  • Merkmale in natürlicher Rangfolge, Abstand zwischen Merkmalen interpretierbar
  • Zusätzliche Maße möglich (arithmetischer Mittelwert, Standardabweichung)
  • Beispiel: Inflationsrate
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Klassifikation/Typologie

A

Die Gegenstandsbenennung kann durch eine Klassifikation oder Typologie erfolgen.

Diese muss jedem Fall (Objekt) einen Wert zuweisen (Eindeutigkeit) und dabei darf jeweils nur eine Ausprägung zutreffend sein (Ausschließlichkeit).

Auch müssen alle Merkmalsausprägungen empirisch feststellbar sein (in einem Objekt vorkommen - Vollständigkeit)

Hierbei werden eine Vielzahl von Merkmalen zu einer numerischen Klassifikation oder einer Menge von Typen zusammengefasst.

Problem: Anforderungen an Kriterien häufig nur bedingt zutreffend.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Ratioskala

A
  • Merkmale in natürlicher Rangfolge, Abstand zwischen Merkmalen interpretierbar, zusätzlich existiert ein absoluter Nullpunkt
  • Multiplikation und Division aussagekräftig (SPD hat doppelt so viele Sitze wie die Linke)
  • Beispiel: Anzahl Parlamentssitze, Alter
16
Q

Operationalisierung (Atteslander)

A

Um Hypothesen testen zu können muss zuerst Operationalisiert werden

d.h. zuerst Gegenstandsbenennung:

“Bei der Gegenstandsbenennung gehen wir explizit oder implizit von Modellen aus.
Modelle sind Abbildungen von Gegenständen und Vorgängen.
Um diese theoretischen Abbildungen zu erhalten, müssen wir uns ein Bild der Gegenstände und Vorgänge machen.
Dieses entsteht in unseren Gedanken und hat mit “Begriffen” und “Erkenntnis” zu tun.”
(Atteslander)

17
Q

Aussagekraft einer Hypothese

A

Die Aussagekraft einer Hypothese ist wesentlich abhängig von der Begriffsbildung.

Begriffsbildung = Zuweisung bestimmter Merkmale an ein theoretisches Konstrukt

-> Merkmale operationalisieren, d.h. festlegen wie sie gemessen werden

Ohne sauber definierte Begriffe sowie adäquater Operationalisierung ist Hypothese (mehr oder weniger offensichtlich) nicht überprüfbar.

18
Q

Beispiel für Operationalisierung

A

Die zu beobachtenden Ausschnitte aus der sozialen Wirklichkeit müssen exakt definiert werden.

These: Es existiert ein Zusammenhang zwischen sozio-ökonomischer Situation und Lebenserwartung

Nicht gut: Die Lebenserwartung von armen Personen ist geringer als die von reichen Personen (Wer ist arm?)

Besser: Die Lebenserwartung von Angehörigen niedriger Einkommensschichten ist geringer als die von Angehörigen in anderen Einkommensschichten.

Begriff: sozio-ökonomische Situation
Variable: finanzielle Situation
Indikator: Arbeitseinkommen (Kategorisiert nach Einkommensschicht)
-> nicht Bildungsniveau, Familiensituation o.ä.

19
Q

Indikatoren und Indizes

A

Indikatoren: Messen eines Merkmals anhand von einem Wert

Indizes: Zusammensetzung von mehreren Merkmalen zu einem Wert

Problem: Wird wirklich das gemessen was gemeint ist?

Achtung: Der Begriff Indikator kann auch andere Bedeutungen haben (z.B. Entwicklungsindikator: Wirtschaftsentwicklung)

20
Q

Fragmentierung

A

kann anhand des ENPP (Effective Number of Parliamentary Parties) operationalisiert werden (pi = Anteil der Mandate)

Np = 1 / sum(pi^2)

Index ist im Vergleich aussagekräftig

21
Q

Ausblick: Dimensionen von Theorien

A

Problem: Oft können theoretische Konstrukte nicht durch eine Variable operationalisiert werden.

Eine Theorie bewegt sich über mehrere Dimensionen, welche aber auf das gleiche Konstrukt hinwirken.

In diesem Fall können einzelne Indikatoren aus den jeweiligen Dimensionen den Index bilden.

Beispiel: Wohlstand

22
Q

Datenerhebung: Erhebungsinstrumente und Fallauswahl

A

Bei der Entwicklung der Erhebungsinstrumente (wie z.B. standardisierte Befragung) und auch bei der Fallauswahl sind Qualitätskriterien zu beachten.

Je nach angewandter Methodik: Unterschiedliche Erfordernisse bezüglich der Fallauswahl

Viele statistische Verfahren erfordern Zufallsstichproben, damit die dem Verfahren zugrunde liegenden Annahmen erfüllt werden. Daher ist es in einem ersten Schritt sehr wichtig zu klären, wie die Fallauswahl erfolgen soll.

23
Q

Stichprobenziehung

A

Einfache Stichprobe

Mehrstufige Stichprobe

Klumpenstichprobe

geschichtete Stichprobenziehung

24
Q

Stichprobenziehung:
Einfache Stichprobe

A

Aus einer bekannten Grundgesamtheit wird eine Stichprobe nach reinem Zufallsprinzip gezogen.

25
Q

Stichprobenziehung:
Mehrstufige Stichprobe

A

Ermittlung der Stichprobe über Gruppen.

Beispiel: Auswahl eines beliebigen Einwohners für Stichprobe:
1. Stufe (Gemeinde) ⇒ 2. Stufe (Haushalt) ⇒ 3. Stufe (Person)

26
Q

Stichprobenziehung:
Klumpenstichprobe

A

Ermittlung der Stichprobe über Gruppen, dabei werden alle Personen einer bestimmten Gruppe erfasst.

Beispiel: Auswahl eines beliebigen Einwohners für Stichprobe:
1. Stufe (Gemeinde) ⇒ 2. Stufe (Haushalt – alle Personen des Haushalts gehen in Stichprobe ein)

27
Q

Geschichtete Stichprobenziehung

A

Unterteilung der Grundgesamtheit nach relevanten Schichtungsmerkmalen.

Beispiele:
* Eurobarometer: Gruppierung nach EU-Staaten
* ALLBUS: Gruppierung nach Ost- und Westdeutschland
* Studienwahlmotivation: Gruppierung nach Studiengang

Unterschiedliche Berücksichtigung von Gruppen muss bei der Gesamtauswertung durch Gewichtung der Fälle beachtet werden

28
Q

Stichprobengröße

A

Genauigkeit der Ergebnisse ist von der Anzahl der erfassten Fälle abhängig (je mehr, desto besser).

Abwägung: Kosten vs. Genauigkeit (Üblich: mind. 1000 Fälle bei Bevölkerungsumfragen)

-> Es gilt aber allgemein: Es gibt keine exakte Abbildung, daher müssen wir uns auch Gedanken über die Genauigkeit der Schlüsse aus der Stichprobe für die Grundgesamtheit machen.

ABER: Häufig erfolgt in Studien keine zufallsgesteuerte Auswahl. Daher müssen Sie immer prüfen, wie die Fallauswahl erfolgt ist!