Sitzung 5: Datensammlung - Und Aufarbeitung Flashcards

1
Q

Fundstellen für Sekundärdaten

A
  • Datensätze anderer Forscher (oftmals zeitgleich mit einer Publikation veröffentlicht, z.B. Harvard Dataverse)
  • amtliche Statistik (ausgelöste Statistik - statistische Ämter und nicht ausgelöste Statistik - von Behörden bereitgestellt, deren Aufgabe nicht primär die Erstellung von Statistiken ist)
  • nichtamtliche Statistik (z.B. Meinungsforschungsinstituten)
  • Webseiten (Qualitätskontrolle über automatisiertes web scraping)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Beispiele für Fundstellen für Sekundärdaten

A
  • Statistisches Bundesamt
  • Eurostat
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was sind Aggregatdaten?

A

Keine Individualdaten!
Entweder Daten, die zu einem Kollektiv als Ganzes gehören (zum Beispiel Einwohnerzahl eines Landes) oder aggregierte Individualdaten:
1. Aus Vollerhebungen (z.B. Zensus)
2. Aus möglichst repräsentativen samples

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was sind Unterscheidungskriterien für Befragungen?

A
  1. Fragetyp
  2. Zielgruppe
  3. Erhebungsmodus
  4. Offene vs. Geschlossene Fragen
  5. Standardisierung
  6. Strukturierung beim Interview
  7. Reaktivität
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was sind Fragetypen?

A
  • zu Verhalten
  • Überzeugungen
  • Einstellungen
  • zu soziodemographischen Merkmalen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was sind Zielgruppen in Befragungen?

A
  • Experten
  • repräsentatives sample für bestimmte Grundgesamtheit
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was sind Erhebungsmodi für Befragungen?

A
  • schriftlich
  • mündlich
  • telefonisch
  • online
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was sind offene Fragen?

A

Befragter muss eigene Sprachen verwenden für Antwort

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was sind geschlossene Fragen?

A

Antwortkategorien vorgegeben (Einfach- oder Mehrfachantworten)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was sind Hybridfragen?

A

Vorgegebene Antwortkategorien und freie Antwortmöglichkeit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was sind standardisierte Fragebögen?

A

Antworten in Kategorien zusammengefasst → Vergleichbarkeit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was sind Strukturierungmöglichkeiten beim Interview?

A
  • stark strukturiert
  • nicht-strukturiert
  • Teilstrukturiert (Leitfadeninterview)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was sind Vorteile einer geschlossenen Befragung?

A
  • Jeder Befragte bekommt den gleichen Fragebogen vorgesetzt (der gleiche Stimulus) → Durchführungsobjektivität
  • Wenig Zeit notwendig → gröÿere Stichproben möglich
  • Einfach statistisch bearbeitbar → Ergebnisse von Online-Fragebogen direkt in Excel oder SPSS importierbar
  • Relativ schnell auszuwerten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was sind Nachteile einer geschlossenen Befragung?

A
  • Vorstrukturierung des Fragebogens erfordert Vorwissen
  • Ausblendung potentiell relevanter Kontextmerkmale, denen keine Antwortkategorie zugewiesen wurde
  • Vergleichsweise hohe Reaktivität, da der Fragebogen die Situation für den Befragten immer als Befragung kennzeichnet → keine natürliche Gesprächssituation
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wann sind offene Fragen sinnvoll?

A
  • detailreiche, erschöpfende Informationen erhalten will
  • die Meinung von Individuen untersucht (z.B. auch bei Experteninterviews)
  • noch zu wenig über einen Forschungsbereich weiÿ um Antwortkategorien konstruieren zu können
  • man es mit zu vielen Antwortkategorien zu tun hat (z.B. Beruf, Studienfach…)
  • sicherstellen will, dass die Antwort des Befragten wirklich aus dessen eigenen Wissensbestand kommt und nicht erst durch eine Antwortvorgabe induziert wurde
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wann sind geschlossene Fragen sinnvoll?

A
  • Vergleichbarkeit
  • Durch Standardisierung der Befragungssituation werden mögliche Störfaktoren kontrolliert.
  • Zeitaufwand für die Befragten niedrig.
  • Zeit- und Kostenaufwand für die Auswertung niedrig.
  • Höhere Auswertungsobjektivität als oene Fragen.
  • Sensible Fragen (Einkommenskategorien werden leichter angekreuzt als das exakte Einkommen genannt)
  • Einen Bias durch die Artikulationsfähigkeit des Befragten (bei oenen Fragen kann das ein Problem sein).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Besser gerade oder ungerade Anzahl an Antwortmöglichkeiten?

A
  • gerade: Befragter muss sich in eine Richtung entscheiden
    → Frageform induziert evtl. Meinung.
  • ungerade: Befragter kann sich vor einer tendenziellen Beantwortung
    der Frage drücken.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Auf was ist bei der Frageformulierung zu achten?

A
  • Verständlichkeit
  • Referenzrahmen (Definieren)
  • Eindimensionalität (keine zwei Fragen in einer)
  • erschöpfend und trennscharf
  • Filterfragen
  • Suggestivfragen vermeiden (meinungsbildende Fragen)
  • Meinungslosigkeit sollte abbildbar sein
  • Berücksichtigung der Ja-Sager-Tendenz (Akquieszenz) - positiv und negativ formulierte Fragen verwenden, dadurch kann auch ein gleichmäßiges Antwortmuster (Resonse Seit) vermieden werden
  • motivationshemmende Fragen vermeiden
  • Verglichbarkeit mit früheren Umfragen geht nur über den exakt gleichen Wortlaut
  • Vereinbarkeit mit geplanten Auswertungsverfahren (zum Beispiel Skalenwerte)
  • neutrale Wortwahl
  • keine hypothetischen Frageformulierungen
  • nicht überfordern (z. B. Mathematisch)
  • direkte Fragen nach dem Grund (pro und contra)
  • Retrospektivfragen sind problematisch (zu lang her)
19
Q

Fragebogengestaltung: Umfang/Dauer

A

Max 60 min Face to Face
40min am Telefon
15-20 min online

20
Q

Fragebogengestaltung: Eisbrecherfragen

A

erzeugen Interesse am Thema und sollen den Befragten dazu bringen den Fragebogen zu beantworten

21
Q

Fragebogengestaltung:
A) Filterführung
B) Spannungskurve

A

A) klar und übersichtlich
B) Motivation der Befragten sinkt typischerweise gegen Ende der Befragung → einfach zu beantwortende Fragen z.B. soziodemographische Merkmale am
Schluss abfragen

22
Q

Fragebogengestaltung: Halo-Effekt

A

Wenn ein zuvor im Fragebogen angesprochenes Thema auf die Beantwortung einer Frage ausstrahlt (z.B. Wieviele Fälle sexueller Gewalt gegen Kinder sind Ihnen aus den Medien präsent? → Sind Sie der Meinung die Todesstrafe sollte für bestimmte Straftaten wieder eingeführt werden?)

23
Q

Fragebogengestaltung: Konsistenzeffekt

A

Befragte versuchen sich in ihren Antworten nicht zu widersprechen. (z.B. Stimmen Sie den folgenden Aussagen zu? Aussage 1: Alle Politiker sind korrupt. Aussage 2: Ich habe groÿes Vertrauen in meinen Wahlkreisabgeordneten → solche als sich widersprechend zu interpretierende Fragen weiter auseinander platzieren)

24
Q

Fragebogengestaltung: Layout

A

Übersichtlich, schlicht, seriös

25
Q

Pretext

A

Vor der eigentlichen Hauptuntersuchung sollte immer eine Voruntersuchung (Pretest) gemacht werden:
- Rückmeldungen der Interviewer einarbeiten
- Fehlende Werte analysieren → Warum fehlen die Antworten zu bestimmten Fragen besonders häug? Evtl. Antwortkategorie vergessen?
- Kategorisierung oener Fragen
- Dierenzierung von Fragen, bei denen alle dieselben (sehr ähnliche) Antworten geben
- Erkennen redundanter Fragen → Fragen streichen - Erkennen kognitiver Probleme beim Befragten →
Frageformulierung überarbeiten
- Erkennen technischer Probleme (v.a. bei Online-Surveys)

26
Q

Fehlerquellen

A
  • Interviewereffekt (eliminieren oder konstanthalten)
  • Sponsorship-Effekt
  • soziale Erwünschtheit (Listenexperiment und Randomized Response Technik)
27
Q

Randomises Response Technik (RRT)

A

Befragter bekommt zwei Fragen vorgelegt:
1 Haben Sie schon einmal leistungssteigernde Medikamente genommen?
2 Haben Sie im August Geburtstag?

Befragter macht Zufallsexperiment, dessen Ergebnis der Interviewer nicht erfährt (z.B. einmal Würfeln).
Wenn der Befragte eine 1, 2, oder 3 gewürfelt hat, beantwortet er die erste Frage, bei 4, 5 oder 6 die zweite. D.h. der Interviewer weiÿ nicht auf welche Frage der Befragte antwortet!

Man weiÿ, dass auf die harmlose Frage ca. 1/12 mit ja antworten
Man weiÿ, dass etwa 50% die harmlose/interessierende Frage beantworten Wenn jetzt 14% aller Befragten mit ja geantwortet haben, kann man schlussfolgern
dass 14% − 50% = 9, 83% der Antworten sich auf die Frage nach den Medikamenten 12
bezogen.

→ 19,67% derjenigen, denen die Frage nach dem Medikamentenkonsum gestellt wurde, haben mit ja geantwortet.

28
Q

Wann ist die offene Befragung sinnvoll?

A

Sinnvoll für Expertenbefragungen, detaillierte Analysen von Einzelfällen und wenn eine authentische Gesprächssituation von Vorteil ist.

29
Q

Nachteile offene Befragung

A

Höherer Zeitaufwand (sowohl bei der Befragung als auch bei der Auswertung), schlechte Vergleichbarkeit der Daten, keine einfache statistische Auswertung möglich

30
Q

Verschiedene Arten der offenen Befragung

A
  • Narratives Interview
  • Leitfadeninterview
  • Experteninterview
  • Gruppendiskussion
31
Q

Panel

A

Das Panel stellt einen Spezialfall der Befragung dar, bei der über einen längeren Zeitraum immer derselbe Personenkreis befragt wird.

32
Q

Panel Vorteile

A
  • Einstellungsveränderungen über längeren Zeitraum erfassbar (vs. Ökologischer Fehlschluss. = falscher Schluss von Aggregat auf Individualebene)
  • größeres Vertrauensverhältnis ermöglicht sensiblere Informationen abzufragen
  • geringerer Zufallsfehler bei der Messung von Veränderungen als bei unabhängigen Querschnittsuntersuchungen
33
Q

Nachteile Panel

A
  • Panelsterblichkeit
  • Paneleffekt (Lerneffekt)
34
Q

Was sind mögliche Probleme bei einer Beobachtung als wissenschaftliche Methode?

A
  • Kontextabhängigkeit (z.B. haben bestimmte Gesten je nach Kulturraum unterschiedliche Bedeutungen)
  • Verzerrte und selektive Wahrnehmung
  • Reaktivität
35
Q

Typen der Beobachtung

A
  • strukturiert vs. nicht-strukturiert: Klare a priori Fixierung auf spezische Aspekte oder möglichst offen für sämtliche Eindrücke
  • offen vs. verdeckt: Wissen die Beobachteten, dass sie beobachtet werden?
  • teilnehmend vs. nicht-teilnehmend: Gefahr des Going Native
  • natürlich vs. künstlich: unter experimentellen Laborbedingungen oder im Feld
  • Selbst vs. Fremdbeobachtung: Selbstbeobachtung eher in der Psychologie
  • direkt vs. indirekt: z.B. über physische Spuren (Pizzaessen im weißen Haus)
36
Q

Inhaltsanalyse Definition

A

Die Inhaltsanalyse ist eine empirische Methode zur systematischen, intersubjektiv nachvollziehbaren Beschreibung inhaltlicher und formaler Merkmale von Mitteilungen
(Sender - Mitteilung - Empfänger Beziehung)

37
Q

Beispiel Qualitative Inhaltsanalyse - Comparative Manifesto Project

A
  • Aufsplitten der Wahlprogramme in sogenannte Quasisätze (Sinneinheiten)
  • Einsortieren dieser Quasisätze in zuvor festgelegte Kategorien (z.B. Steuern senken) durch menschliche Kodierer
  • Über die Prozentsätze der einzelnen Kategorien können dann die Parteipositionen bestimmt werden
38
Q

Beispiel Quantitative Inhaltsanalyse

A
  • entweder mit Kodierwörterbuch (Zählen wie häug z.B. der Begri Steuern senken vorkommt)
  • oder rein auf Basis der Häugkeitsverteilungen aller Wörter (wordscore, wordsh, wordle)
39
Q

Was sind Schritte der Datenaufarbeitung?

A
  1. Plausibilitätsprüfung der Daten
  2. Digitalisierung der Daren
  3. Datenbereinigung
  4. Datenarchivierung
40
Q

Plausibilitätsprüfung der Daten

A
  • Wenn in den Rohdaten offensichtliche Ungereimtheiten auftauchen: → auf evtl. Messfehler kontrollieren
  • z.B. bei Wahlumfragen zunächst eine Häugkeitsauszählung der Befragten bezüglich ihres Alters machen (unter 18 Jährige und über 120 Jährige nochmal genau betrachten).
  • einfache Häugkeitsauszählungen und andere deskriptive Statistiken (z.B. Mittelwerte, Streuungsmaÿe, Kreuztabellen) helfen dabei einen Überblick über die Daten zu gewinnen und potentielle Fehler zu identifizieren
41
Q

Digitalisierung der Daten

A

Erstellung eines Codeplans:
- Aussagekräftige Variablenlabel (nicht V1, V2, V3…)
- Bestimmung des Skalenniveaus der Variablen
- Kodierung der Merkmalswerte (z.B. Geschlecht: Mann = 1 , Frau = 0)
- Fehlende Werte ausweisen (z.B. mit 999)

Daten entsprechend dem Codeplan in eine Datenmatrix bringen um sie dann statistisch auszuwerten (z.B. in Excel, SPSS, Stata)

Transkription bei nicht quantizierbaren Merkmalen (z.B. Interviewaufzeichnungen)
- sprachliche Äußerungen
- Gestik und Mimik
- Kontextmerkmale

42
Q

Datenbereinigung

A
  • Sichtkontrolle (Fehlen ganze Spalten oder Zeilen? Sonstige Unregelmäßgikeiten? String-Variablen anstelle von numerischen usw.)
  • Häugkeitsauszählungen für jede einzelne Variable
  • Bei Transkriptionen ist die Fehlersuche komplizierter und häug ist es auch Interpretationssache ob es sich um einen Transkriptionsfehler handelt
43
Q

Datenarchivierung

A
  • Ziel: Replizierbarkeit/Nachvollziehbarkeit gewährleisten
  • Datensatz mit sauberen Variablenlabels/Codebook versehen
  • Originaldaten aufbewahren (z.B. Interviewmitschnitte)
  • Sicherungskopien anfertigen (Ausdrucke, USB-Stick, Clouds…)
  • Open Repositories wie das Harvard Dataverse (nach Publikation)