Jannis Flashcards
Ablesen von ANOVA Tests
- ) Globaler Test –> Signifikanzzeile H0 muss hier abgelehnt werden (p-Wert< Alpha), da sonst kein signifikanter Unterschied zwischen den Gruppen vorliegt
- ) Einzelne Test–> Signifikanzzeile H0 ablehnen=signifikanter Einfluss H0 nicht ablehnen= kein signifikanter Einfluss –> Sind die Haupteffekte/Interaktionseffekte signifikant?
Lineare Regression (allgemeine Infos)
-Zeigt, ob unabhängige Variablen eine signifikante Beziehung zu der abhängigen Variable haben und dabei die relative Stärke dieser Beziehung, lässt Vorhersagen zu (Extrapolationen / Szenarios)
1.) Unabhängige Variable= metrisch (oder binär -> “Dummy-Variablen”); abhängige Variable= metrisch
Bsp.: Anzahl Tore pro Saison -> Gehalt eines Fussballspielers
2.) H0: β(i)=0 —> Alle Regressionskoeffizienten haben keinen Einfluss
H1: Mindestens einer ist unterschiedlich von 0
Anwendungsgebiete:
- Ursachenanalyse (wie stark unterscheiden sich die Wirkungen der UVs auf die AV?)
- Wirkungsprognose (Welchen Wert erhält AV bei Änderung der UVs?)
- Zeitreihenanalyse (Wie verändert sich AV im Zeitablauf, wenn UV = Zeit)
Ablesen von Linearer Regression: Überprüfen des Gesamtmodells
- ) Globaler Test Signifikanzzeile –> H0 muss wieder abgelehnt werden, da sonst keiner der Beta’s einen Einfluss besitzt
- ) Der zweite Blick geht immer auf das R (Quadrat) bzw. bei vielen Variablen in der Aufgabe auf das adjustierte R (Quadrat)–> hoher Wert bedeutet hohe Erklärungskraft des Models (gut)
- ) Einzelne Test Signifikanzzeile –> H0 ablehnen –> signifikanter Effekt wenn der Effekt signifikant, dann muss auf die Beta Zeile geschaut werden –> hohe Wert=hoher Einfluss der Variable
Mediator
Der Mediator eines Models beschreibt einen “Umweg” einer unabhängigen Variable auf eine abhängige Variable. Die Beziehung zwischen UV/AV wird durch den Mediator erst erklärt
Quotenauswahl
- nicht zufällige Stichprobenziehung
- Auswahl der Stichprobe erfolgt anhand einer Quote und einer bestimmten Merkmalsausprägung, z.B. 40% Männer und 60% Frauen
- Stichprobenfehler kann nicht berechnet werden
Matched Control Group Design
- Pre Experimental Design
- keine Randomisierung der Stichprobe sondern Verteilung per Matchingverfahren
- 1 Versuchs- und Kontrollgruppe
Problem: Verzerrung durch Drittvariablen nicht ausschließbar; es gibt keine perfekte Lösung
mehrstufige Zufallsauswahl
- zufällige Stichprobenziehung -
1. ) erst werden die Primäreinheiten gezogen -
2. ) wird aus den einzelnen Primäreinheiten eine zufällige Stichprobe gezogen -
Problem: es können sehr homogene Gruppen entstehen (z.B. Geschlechterverteilung); vergleichsweise großer Stichprobenfehler
Moderator
Moderator wirkt auf die:
- ) Stärke der Beziehung zwischen UV/AV
- ) Richtung der Beziehung zwischen UV/AV
Experiment (allgemein)
- Untersucht kausalen Zusammenhang zwischen UV/AV
- Die UV wird manipuliert
- Der Einfluss von Drittvariablen/Störfaktoren soll konstant bleiben
- Überprüfung oftmals durch Varianzanalyse
Solomon Four Group Design
- True Experimental Design
- 2 Versuchs- und Kontrollgruppen (Randomisierung)
- 1 Versuchs- und Kontrollgruppe wird vor der Manipulation bereits befragt, anderen beiden Gruppen nicht
- Sehr gutes Design, da Ermüdungs- und Testeffekte ausgeschlossen werden können
- Problem: TEUER!!!
Two Group Before-After Design
- True Experimental Design
- 1 Versuchs- und Kontrollgruppe (Randomisierung)
Messung vor und nach der Manipulation–> Änderung kann beobachtet werden
Problem: Test und Ermüdungseffekte
Evaluation den goodness-of-fit eines Regressionsmodells
- F-Test: testet die Signifikanz des gesamten Modells, also ob ein β sich signifikant von 0 unterscheidet
- R2: Wie “gut” ist das Modell insgesamt -> wie viel % der Varianz erklärt mein Modell [größer als 0,5: Modell ist nutzbar, größer als 0,75: sehr gut, um eine einzelne Hypothese zu testen kann aber ggf. auch ein R2 deutlich kleiner als 0,5 akzeptiert werden]
- PS: Großer Unterschied zwischen R2 und adjustiertem R2 zeigt, dass viele überflüssige Variablen im Modell sind!
- T-Test, Koeffizeiten-Vorzeichen und Größen: Bei signifikanten Variablen auf das Vorzeichen von β achten: negatives Vorzeichen: inverse Wirkung auf abhängige Variable
Größe: unstandardisiertes β: wenn ich β um eine Einheit erhöhe, um wie viele Einheiten erhöht sich die abhängige Variable; standardisiertes β: relative Effektstärke im Vergleich zu den anderen Variablen
Ansprüche an das Sample für Regression
- Sample hat die notwendige Größe:
- n ≥ 50 + 8 * m für F-Test (m=Anzahl der unabhängigen Variablen)
- n ≥ 104 + m um Effekte der einzelnen Effekte der Parameter β zu testen - Sample ist repräsentativ für die Grundgesamtheit
- Abhängige Variable ist intervall- oder ratio-skaliert (falls das nicht gegeben ist: binary logistic regression anwenden)
Regressionsmodell validieren
Stabilität überprüfen:
- Resultate sind stabil im Zeitverlauf
- … unterscheiden sich nicht über verschiedene Situationen hinweg
- … hängen nicht zu stark von den Spezifikationen des Modells ab
- Split-sample Validität: Daten in zwei Hälften splitten und Modell nochmals laufen lassen
- Cross-validation: Ergebnisse auf zweiten neuen Datensatz cross-validieren (dieser Datensatz könnte schwer herzustellen sein)
- Mehr Variablen im Modell: Anzahl der Variablen erhöhen, die vorher noch nicht Teil des Modells waren
Ablesen von Linearer Regression: Überprüfen der einzelnen Koeffizienten