Jannis Flashcards

1
Q

Ablesen von ANOVA Tests

A
  1. ) Globaler Test –> Signifikanzzeile H0 muss hier abgelehnt werden (p-Wert< Alpha), da sonst kein signifikanter Unterschied zwischen den Gruppen vorliegt
  2. ) Einzelne Test–> Signifikanzzeile H0 ablehnen=signifikanter Einfluss H0 nicht ablehnen= kein signifikanter Einfluss –> Sind die Haupteffekte/Interaktionseffekte signifikant?
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Lineare Regression (allgemeine Infos)

A

-Zeigt, ob unabhängige Variablen eine signifikante Beziehung zu der abhängigen Variable haben und dabei die relative Stärke dieser Beziehung, lässt Vorhersagen zu (Extrapolationen / Szenarios)

1.) Unabhängige Variable= metrisch (oder binär -> “Dummy-Variablen”); abhängige Variable= metrisch
Bsp.: Anzahl Tore pro Saison -> Gehalt eines Fussballspielers

2.) H0: β(i)=0 —> Alle Regressionskoeffizienten haben keinen Einfluss
H1: Mindestens einer ist unterschiedlich von 0

Anwendungsgebiete:

  • Ursachenanalyse (wie stark unterscheiden sich die Wirkungen der UVs auf die AV?)
  • Wirkungsprognose (Welchen Wert erhält AV bei Änderung der UVs?)
  • Zeitreihenanalyse (Wie verändert sich AV im Zeitablauf, wenn UV = Zeit)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Ablesen von Linearer Regression: Überprüfen des Gesamtmodells

A
  1. ) Globaler Test Signifikanzzeile –> H0 muss wieder abgelehnt werden, da sonst keiner der Beta’s einen Einfluss besitzt
  2. ) Der zweite Blick geht immer auf das R (Quadrat) bzw. bei vielen Variablen in der Aufgabe auf das adjustierte R (Quadrat)–> hoher Wert bedeutet hohe Erklärungskraft des Models (gut)
  3. ) Einzelne Test Signifikanzzeile –> H0 ablehnen –> signifikanter Effekt wenn der Effekt signifikant, dann muss auf die Beta Zeile geschaut werden –> hohe Wert=hoher Einfluss der Variable
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Mediator

A

Der Mediator eines Models beschreibt einen “Umweg” einer unabhängigen Variable auf eine abhängige Variable. Die Beziehung zwischen UV/AV wird durch den Mediator erst erklärt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quotenauswahl

A
  • nicht zufällige Stichprobenziehung
  • Auswahl der Stichprobe erfolgt anhand einer Quote und einer bestimmten Merkmalsausprägung, z.B. 40% Männer und 60% Frauen
  • Stichprobenfehler kann nicht berechnet werden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Matched Control Group Design

A
  • Pre Experimental Design
  • keine Randomisierung der Stichprobe sondern Verteilung per Matchingverfahren
  • 1 Versuchs- und Kontrollgruppe

Problem: Verzerrung durch Drittvariablen nicht ausschließbar; es gibt keine perfekte Lösung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

mehrstufige Zufallsauswahl

A
  • zufällige Stichprobenziehung -
    1. ) erst werden die Primäreinheiten gezogen -
    2. ) wird aus den einzelnen Primäreinheiten eine zufällige Stichprobe gezogen -

Problem: es können sehr homogene Gruppen entstehen (z.B. Geschlechterverteilung); vergleichsweise großer Stichprobenfehler

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Moderator

A

Moderator wirkt auf die:

  1. ) Stärke der Beziehung zwischen UV/AV
  2. ) Richtung der Beziehung zwischen UV/AV
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Experiment (allgemein)

A
  • Untersucht kausalen Zusammenhang zwischen UV/AV
  • Die UV wird manipuliert
  • Der Einfluss von Drittvariablen/Störfaktoren soll konstant bleiben
  • Überprüfung oftmals durch Varianzanalyse
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Solomon Four Group Design

A
  • True Experimental Design
  • 2 Versuchs- und Kontrollgruppen (Randomisierung)
  • 1 Versuchs- und Kontrollgruppe wird vor der Manipulation bereits befragt, anderen beiden Gruppen nicht
  • Sehr gutes Design, da Ermüdungs- und Testeffekte ausgeschlossen werden können
  • Problem: TEUER!!!
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Two Group Before-After Design

A
  • True Experimental Design
  • 1 Versuchs- und Kontrollgruppe (Randomisierung)

Messung vor und nach der Manipulation–> Änderung kann beobachtet werden

Problem: Test und Ermüdungseffekte

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Evaluation den goodness-of-fit eines Regressionsmodells

A
  1. F-Test: testet die Signifikanz des gesamten Modells, also ob ein β sich signifikant von 0 unterscheidet
  2. R2: Wie “gut” ist das Modell insgesamt -> wie viel % der Varianz erklärt mein Modell [größer als 0,5: Modell ist nutzbar, größer als 0,75: sehr gut, um eine einzelne Hypothese zu testen kann aber ggf. auch ein R2 deutlich kleiner als 0,5 akzeptiert werden]
  3. PS: Großer Unterschied zwischen R2 und adjustiertem R2 zeigt, dass viele überflüssige Variablen im Modell sind!
  4. T-Test, Koeffizeiten-Vorzeichen und Größen: Bei signifikanten Variablen auf das Vorzeichen von β achten: negatives Vorzeichen: inverse Wirkung auf abhängige Variable
    Größe: unstandardisiertes β: wenn ich β um eine Einheit erhöhe, um wie viele Einheiten erhöht sich die abhängige Variable; standardisiertes β: relative Effektstärke im Vergleich zu den anderen Variablen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Ansprüche an das Sample für Regression

A
  1. Sample hat die notwendige Größe:
    - n ≥ 50 + 8 * m für F-Test (m=Anzahl der unabhängigen Variablen)
    - n ≥ 104 + m um Effekte der einzelnen Effekte der Parameter β zu testen
  2. ​Sample ist repräsentativ für die Grundgesamtheit
  3. Abhängige Variable ist intervall- oder ratio-skaliert (falls das nicht gegeben ist: binary logistic regression anwenden)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Regressionsmodell validieren

A

Stabilität überprüfen:

  • Resultate sind stabil im Zeitverlauf
  • … unterscheiden sich nicht über verschiedene Situationen hinweg
  • … hängen nicht zu stark von den Spezifikationen des Modells ab
  1. Split-sample Validität: Daten in zwei Hälften splitten und Modell nochmals laufen lassen
  2. Cross-validation: Ergebnisse auf zweiten neuen Datensatz cross-validieren (dieser Datensatz könnte schwer herzustellen sein)
  3. Mehr Variablen im Modell: Anzahl der Variablen erhöhen, die vorher noch nicht Teil des Modells waren
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Ablesen von Linearer Regression: Überprüfen der einzelnen Koeffizienten

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Vorgehensweise bei Varianzanalyse

A
17
Q

Grundidee der Regressionsanalyse

A