5. Datenkontrolle Flashcards

1
Q

Wann liegt Non Random Missing vor?

A

Es liegt vor wenn das Fehlen des Wertes nicht von die Variablen des Datensatzes vorhergesehen werden kann

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Problem bei NRM

A

Jede Form der Ersetzung ist sehr schwierig

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Notwendigkeit der Datenkontrolle

A
  • Primäre Aufgabe der Statistik: Datenanalyse

- man muss sich fragen: wie ist diese Datei entstanden?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Erhebungsmethoden

A
  1. Befragungsmethode („Standardmethode“)
    • schriftlich —> sehr ökonomisch
    • Interview —> offen, teilstandardisiert und standardisiert
  2. Beobachtung
  3. Neue Datenquellen (EEG, Blutwerte, Online-Studien)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wofür müssen die Daten vor der Analyse kontrolliert werden?

A

— Verständnis der VPn
— Fehleingaben
— Plausibilität

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Umgang mit Ausreißern?

A
  1. mit und ohne Ausreißern rechnen
  2. Gibt es Unterschiede?
  3. Nur signifikante Ergebnisse mit Ausreißern —> kritische Diskussion

WINSORISIEREN

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Winsorisieren

A

alle werte unterhalb der 5% Grenze —> werden durch den wert der unteren Grenze ersetzt

alle Wert oberhal ber 95% Grenze —> werden durch den Wert der oberen Grenze ersetzt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Winsorisieren: Vorteil?

A

SP Größe bleibt erhalten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Winsorisieren: Nachteil

A

keine gute Schaetzung des wahren Werts –> der ersetzte Wert ist falsch

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Systematischer Dropout

A

Nur bestimmte Personen fallen raus

  • -> die am staerksten belasteten
  • -> die “schlechtesten”
  • -> die ungeeigneten
  • -> die am wenigsten motivierten

VERZERRUNG

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

“Missing Data”

A

wenn Werte im Datensatz fehlen, obwohl die entsprechenden Merkmalsauspraegungen empirisch vorhanden sind

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Umgang mit Missing Data

A

listwise Deletion –> Person wird komplett aus der Analyse geschlossen
Pairwise Deletion –> Person wird teilweise ausgeschlossen
Ersetzung durch den Mittelwert
Regressionsimputation –> Vorhersage

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Missing Data - Diagnose

A
  • Anzahl fehlende Werte pro Variable und pro Person auftragen lassen

–> mehr als 5%?

  • Suche nach Unterschieden zwischen Personen mit und ohne fehlende Werte
  • Unterschiede innerhalb des Merkmals?
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

MCAR

A

Missing Completely at Random

  • fehlende Werte sind VOLLKOMMEN ZUFAELLIG verteilt
  • VPn mit fehlende Werte = VPn ohne
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

MCAR: Folgen

A

keine Verzerrung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

MAR

A

Missing at Random

  • Personen mit fehlenden Werten unterscheiden sich von Personen ohne
  • Das Auftreten eines fehlenden Werts kann durch anderen Variablen vorhergesagt werden
  • nicht von der untersuchten Variablen selbst
17
Q

MAR: Folgen

A

Verzerrung

–> Ersetzungsverafhren moeglich

18
Q

NRM

A

Non-Random Missing

  • Personen mit fehlenden Werten unterscheiden sich von Personen ohne
  • Das Auftreten von fehlenden Werten steht in Zusammenhang mit der Auspraegung der Person in DIESER Variable selbst
19
Q

NRM: Folgen

A

Verzerrung

–> keine Ersetzungsverfahren moeglich