Data Screening Flashcards

1
Q

Warum ist Data-Screening sinnvoll?

A
  • essentiell für eine “ehrliche” Analyse (z.B. Fehleranalyse, Prüfung stat. Voraussetzungen)
  • Fehler im Datensatz könnten Ergebnisse substantiell verzerren
  • wichtig: geplantes Vorgehen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wie können Fehler im Datensatz die Ergebnisse substantiell verzerren?

A
  • “erhöhte Fehlervarianz”
  • Ausreißer
  • Systematische Verzerrungen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Checkliste für das Data-Screening

A
  1. Überprüfung der univariaten Deskriprivstatistik (Out-of-Range Werte, Plausbilität MW und SD, Univariate Ausreißer)
  2. Analyse von Umfang und Verteilung von fehlenden Werten
  3. Überprüfung von paarweisen Scatterplots (Nonlinearität, Heteroskedastizität)
  4. Überprüfung von Normalverteilung (Schiefe und Kurtosis; ggf. Variablen transformieren)
  5. Identifikation multivariater Ausreißer (Welche Variablen sind beteiligt?)
  6. Ausschluss von Multikollinearität und Singularität
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was bedeutet Multikollinearität?

A

Variablen sind sehr hoch korreliert (r > .90)

z.B. zwei Intelligenztests sind multikollinear

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was versteht man unter Singularität?

A
  • Variablen sind perfekt korreliert (d.h. r = 1).
  • Eine Variable lässt sich als Linearkombination anderer Variablen darstellen
  • z.B. Das Gesamtergebnis eines Tests ist singulär zu den Ergebnissen der Sub-Tests
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Welche Probleme gibt es bei Multikollinearität und Singularität?

A
  • Redundante Information wird aufgenommen
  • Statistisches Problem: die Inverse Matrix ist nicht mehr definiert bzw. ist instabil
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wie lassen sich die Probleme von Multikollinearität und Singularität lösen?

A

Durch die Entfernung einer redundanten Variablen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly