HLM Flashcards
Hierarchische Lineare Verfahren HLM, wofür?
ermöglichen die Analyse von hierarchischen oder genesteten Daten
- Befragte genested in Kreisen,
- Schülerinnen in Schulen,
- Messzeitpunkte in Personen (Wiederholungsmessung)
Daher wird HLM auch verwendet für:
- Längsschnittuntersuchungen
- Wachstumskurven
- Metaanlysen
HLM berücksichtigt die Variabilität von Merkmalen gleichzeitig auf verschiedenen Analyseebenen
Voraussetzung um HLM durchführen zu können?
Eine Beobachtung muss eindeutig dem übergeordneten Level zugeordnet werden können.
dh, eine Person darf nicht mehreren Gruppen zugeordnet sein.
Bei hierarchischen Daten SOLL auf HLM zurückgegriffen werden, warum?
- Zusammenhänge auf unterschiedlichen Analyseebenen sind mathematisch voneinander unabhängig
- Disaggregation und Aggregation (was sonst gemacht wird) sind als Auswertungsstrategie suboptimal
- Single-Level-Analysen basieren auf der Annahme unabhängiger Beobachtungen, was bei hierarchischen Daten oft verletzt ist.
Was bedeutet, dass die Zusammenhänge auf unterschiedlichen Analyseebenen mathematisch unabhängig sind?
Dass die Zusammenhänge, je nachdem auf welcher Ebene man sie betrachtet zu völlig unterschiedlichen Ergebenissen kommen kann, zb. sogar auf einer Ebene umgekehrter Zusammenhang etc.
PROBLEM: Gefahr von Fehlschlüssen, wenn von einem Zusammenhang auf einer Analyseebene auf einen Zusammenhang auf der anderen Analyseebene geschlossen wird.(ökologischer, atomistischer Fehlschluss)
HLM löst das, weil simultan auf mehreren Ebenen die Zusammenhänge berechnet werden.
Ökologischer und atomistischer Fehlschluss
Ökologischer Fehlschluss:
Analyse wurde auf höherer Ebene vorgenommen und in der unteren interpretiert
Atomistischer Fehlschluss:
Analyse wurde auf der unteren Ebene vorgenommen und auf der oberen interpretiert
Disaggregation
Eigenschaften der Analyseeinheiten der L2 werden den Analyseeinheiten auf L1 zugeordnet.
Analyseebene = L1
NACHTEILE:
1. Annahme, Zusammenhänge auf unterschiedlichen Ebenen gleich (ist aber oft falsch = random slope)
- da die n auf L2 künstlich auf L1 Ebene vergrößert ist wird die Power überschätzt.
Der Alphafehler wird größer dh bei sig-Test zu schnell sig.
Aggregation
Variablen werden für jede übergeordnete Analyseeinheit zusammengefasst (z.B. für jede Schule ein Mittelwert gebildet)
Analyseebene = L2
NACHTEIL:
Informationen gegen verloren, da n von Schule genommen (wird unterschätzt) -> Verlust an Power
Warum ist die Annahme unabhängiger Beobachtungen bei Single-Level-Analysen problematisch?
Weil die Daten oft abhängig sind -> zB sind sich Schüler in einer Klasse oft ähnlicher als Schülerinnen im Vergleich zu Schüler anderer Klassen
Wird diese Ähnlichkeit bzw. diese Information nicht genutzt, was auf Single-Level-Analysen der Fall ist, kommt es zu Verzerrungen:
- der Standardfehler wird zu KLEIN geschätzt
und folglich die Prüfgrößen zu groß (Schätzung/Fehler) , dh der Fehler 1. Art wird größer und der Test schneller sig.
Welche Größe gibt das Maß der Abhängigkeit der Beobachtungen an?
INTRAKLASSENKORRELATION (ICC):
Anteil der Varianz auf der höheren Ebene L2 an der Gesamtvarianz (ist also Anteilswert und keine Korrelation!) (rho gleich NULL bedeutet UNABHÄNGIG)
rho = sigma u0 quadrat/sigma u0 quadrat + sigma e quadrat
(sigma u0)quadrat = Varianz zwischen den Schulen L2
(sigma e)quadrat = Varianz innerhalb der Schulen
Vorteile HLM kurz gefasst?
- Simultane Analyse von Zusammenhängen auf unterschiedlichen Analyseebenen
- daher Vermeidung ökologischer und atomistischer Fehlschluss
- unverzerrte Schätzung von STANDARDFEHLER - Auch inhaltliche Gründe
Auf welcher Ebene muss sich das Kriterium befinden bei der KLASSISCHEN HLM?
Auf der UNTEREN Analyseeinheit
Basis 2 Level-Regressions-Modell
Auf der ersten Ebene:
yij= ß0j + ß1j X1j + ß2j X2j + eij
Intercept und Slopes variieren auf Gruppenebene daher weitere Gleichungen für jedes ß auf der Gruppen/Klassenebene:
ß0j= gamma00 + gamma01 Zj + u0j ß1j= gamma10 + gamma 11 Zj + u1j ß2j= gamma20 + gamma 21 Zj + u2j
Z ist die Variable auf dem übergeordneten Level
i ist der Personenindex und j der übergeordnete zb Klassenindex
In Longitudinalstudien sind die wiederholten Messungen innerhalb der Individuen das unterste Level.
Interpretationen der ßs für:
yij= ß0j + ß1j X1j + ß2j X2j + eij
ß0: je höher der Intercept allgemein, desto höher