VL 9 & 10 - Mehrebenenmodelle Flashcards
Warum kann keine lineare Regression bei Daten mit Mehrebenenstrukturen angewendet werden? (2 konzeptuelle Probleme)
Stärke und Richtung des Zusammenhangs (Korrelation) zweier Variablen kann sich systematisch zwischen (1) Gruppen und (2) Ebenen unterscheiden
Definition: Simpson-Paradox
Zusammenhang zwischen X und Y hat innerhalb der Gruppen ein anderes Vorzeichen als zwischen den Gruppen bzw. als über alle Personen hinweg
Definition: ökologischer Fehlschluss
Ein auf Gruppenebene gefundener Zusammenhang wird fälschlicherweise auf Individualebene interpretiert (falsche Interpretation)
Warum kann keine lineare Regression bei Daten mit Mehrebenenstrukturen angewendet werden? (statistisches
Problem)
- Menschen sind anderen Menschen in ihrer Gruppe ähnlicher als Menschen aus anderen Gruppen
–> Residuen NICHT unabhängig
(Standardfehler wird unterschätzt, Inflation des Typ a-Fehlers)
Was sind 3 Vorteile von Mehrebenenmodellen?
- hierarchische Struktur und die Abhängigkeiten innerhalb der Gruppen werden berücksichtigt
- Simultane Modellierung der Zusammenhänge auf mehreren Ebenen
- Sehr gut geeignet für die Analyse längsschnittlicher Daten
Was ist die Bedeutung d. Intercept-Only-Modells? (5)
- einfachstes Modell
- enthält einen zufälligen Effekt der Gruppe
- enthält noch keinen Prädiktor
- dient der Bestimmung der Gruppenunterschiede
- dient als Vergleich für komplexere Modelle
Was ist die Intraklassenkorrelation (ICC)?
Anteil an der Gesamtvarianz der Kriteriumsvariablen, der auf die Zugehörigkeit zu einer Level 2-Einheit zurückgeführt werden kann
Wann ist die ICC hoch?
wenn es große Unterschiede der Mittelwerte der AV zwischen den Level 2 gibt
Was sind 3 verschiedene Möglichkeiten der Berücksichtigung von Abhängigkeiten der Daten?
- Gruppenvariable als UV aufnehmen
- Ist bekannt, worin sich die einzelnen Level 2 Einheiten unterscheiden, kann die entsprechende Variable als weiterer Prädiktor aufgenommen werden (z.B. wirtschaftl. Erfolg der Firma)
- Hierarchische lineare Modelle –> viele Level 2 Einheiten/Gruppen nötig
Wofür steht Y00?
gemeinsamer Achsenabschnitt/Mittelwert
(fester Effekt)
Wofür steht v0i?
gruppenspezifischer Achsenabschnitt/ Mittelwert (zufälliger Effekt)
Wofür steht e mi?
individueller Fehler (zufälliger Effekt)
Was kennzeichnet das Random-Intercept-Modell?
Varianz in den Achsenabschnitten ß0i, aber nicht in den Steigungskoeffizienten ß1
Was kann man dem Parameter Y10 d. Random-Intercept-Modell entnehmen? Was wenn dieser 0 ist?
- ob der Prädiktor über die Gruppen hinweg das Kriterium vorhersagen kann
- 0= keine Beziehung zwischen Prädiktor und Kriterium (über alle Gruppen)
Wofür steht Y10 im Random-Intercept-Modell?
- gemeinsame Steigung (fester Effekt)
- Effekt/Gewicht des Prädiktors
Wieso wird das Intercept-Only-Modell mit dem Random-Intercept-Modell verglichen?
um den Effekt eines Prädiktors festzustellen
Was sind feste Effekte in Mehrebenenmodellen?
solche, die für alle Personen gleich sind
–> Wert wird geschätzt
Was sind zufällige Effekte in Mehrebenenmodellen?
- „Fehler“ bzw. Residuen
- lassen sich den verschiedenen Ebenen zuordnen
–> Varianz wird geschätzt
Wie vergleicht man die Varianzaufklärung eines Prädiktors in Mehrebenenmodellen?
man vergleicht die Residualvarianz im Modell, das den Prädiktor enthält (Random-Intercept-Modell) mit der Residualvarianz im Modell, das den Prädiktor nicht enthält (Intercept-Only Modell)
= Pseudo-R²
Was kennzeichnet das Random-Coefficients-Modell?
Varianz in den Achsenabschnitten b0i und in den Steigungskoeffizienten b1i
Wie werden die Parameter in Mehrebenenmodellen geschätzt?
Maximum Likelihood-Schätzung
Was sind allgemein 3 statistische Tests bei der Mehrebenenanalyse?
- Tests für die Koeffizienten (feste Effekte)
- Tests für die Varianzkomponenten (Zufallseffekte)
- Modellvergleich
Welche zwei statistischen Tests gibt es für die einzelnen Koeffizienten (feste Effekte) bei der Mehrebenenanalyse?
t-Test oder Wald-Test
Welchen statistischen Test gibt es für mehrere Koeffizienten (feste Effekte) bei der Mehrebenenanalyse?
Modellvergleich
Welchen Test für die Varianzkomponenten (Zufallseffekte) gibt es?
Modellvergleich
Welchen Test f. d. Modellvergleich gibt es bei geschachtelten Modellen?
Devianzentest (Likelihood Ratio Test)
Welche Tests f. d. Modellvergleich gibt es bei NICHT-geschachtelten Modellen?
Deskriptiver Vergleich der Informationskriterien (z. B. AIC, BIC)
Je größer die Log-Likelihood (LL), ….
desto besser passt das Modell auf die Daten
Je kleiner die Devianz, …
desto besser passt das Modell auf die Daten
Wie berechnet man die Devianz aus der Log-Likelihood (LL)?
Dev = -2 * LL
Was ist die Prüfgröße des Devianzentests?
Dev Modell 2 (restriktiveres M.) - Dev Modell 1 (komplexeres M.)
Was kennzeichnet das restriktivere Modell?
hat eine höhere Devianz und weniger zu schätzende Parameter als das komplexere Modell –> passt immer schlechter
Was bedeutet ein nicht-signifikanter Devianzentest?
beide Modelle unterscheiden sich nicht bedeutsam in ihrem Modellfit –> restriktiveres Modell beibehalten
Was bedeutet ein signifikanter Devianzentest?
restriktiveres Modell passt signifikant schlechter als das komplexere Modell –> komplexeres Modell annehmen
Wie groß sollten AIC und BIC sein, bzw. welches Modell ist besser?
Modell ist besser, wo AIC u. BIC am kleinsten sind
Was wird empfohlen - AIC o. BIC?
AIC
Was ist ein Kontexteffekt?
Wenn eine Variable sowohl auf Personenebene (Level 1) als auch
auf Gruppenebene (Level 2) wirksam ist und sich in den verschiedenen Ebenen unterschiedlich auswirkt (Richtung d. Effekts umgekehrt)
Wie wird die ICC berechnet?
Varianz Level 2/ Gesamtvarianz
Was kann man über die ICC berechnen?
wie stark die Abhängigkeit zwischen den Personen derselben Level-2-Einheit ist
Welche zwei Grundmodelle wurden nur kurz erwähnt?
Modelle mit Level-2-Prädiktorvariablen:
- Modell mit Level 2-Prädiktor für den Level 1- Achsenabschnitt
- Modell mit Level 2-Prädiktor für Level-1-Achsenabshnitt u. -steigungskoeffizienten (Cross-Level-Interaktionen)
Was ist eine Cross- Level-Interaktion?
Interaktionen zwischen Prädiktoren verschiedener Ebenen
Wie kann man bei der Mehrebenenanalyse beurteilen, ob die
Mehrebenenstruktur berücksichtigt werden muss?
- Intraklassenkorrelation berechnen
- Modelle mit und ohne gruppenspezifische Parameter
vergleichen (Sparsamkeit und Modellgüte berücksichtigen) - Bei Modellen mit gruppenspezifischen Parametern diese auf Signifikanz prüfen
- „Erfahrung“: Literatur, vorhergehende Studien etc
Was bedeutet eine ICC von 1?
Es gibt keine Varianz auf Level-1, die gesamte Varianz ist zwischen den Mittelwerten auf Level 2
Woran kann man in der Random-Coefficients Gleichung erkennen, ob die Betrachtung von Level-2 Einheiten überhaupt Sinn macht?
An den beiden Zufallskomponenten v0i und v1i
Was für eine Art von Funktion ist die Likelihood-Funktion?
eine Funktion der Wahrscheinlichkeiten für das Auftreten der in der Untersuchung vorliegenden Daten in Abhängigkeit von
verschiedenen Ausprägungen der Regressionsparameter