SGM Flashcards
Was ist das Ziel von Strukturgleichungsmodellen?
Freie (also unbekannte) Parameter so schätzen, dass die durch das Modell implizierte Matrix der Ausgangsmatrix möglichst ähnlich ist.
Messmodell erstellen und Testen –> CFA (Hypothese über Repräsentation eines Faktors durch messbare Variable überprüfen)
Achtung: Kausalität ist ausschließlich abhängig von der Qualität der erhobenen Daten! Was rein geht, kommt raus!
Was ist die Vorgehensweise bei SGM?
- Theorie/Hypothese (über Kausalbeziehungen) aufstellen (Kausalbeziehungen zwischen latenten Variablen (also Ergebnissen von Faktoranalysen) –> Strukturmodell) –> Unterschied zu Pfadanalysen, dort keine latenten V.
- Prüfung der Voraussetzungen: Lineare Zusammenhänge? Identifizierbarkeit? SP groß genug?
- Messmodell(e) konstruieren (CFA) –> Was muss ich messen, um Werte für eine latente V. zu bekommen?
- Koeffizienten berechnen (oft iterativ)
- Gütemaße berechnen
Was ist die Grundlage zur Berechnung von CFAs und SGMs?
Korrelationsmatrix bzw. Varianz-Kovarianz-Matrix
Was ist eine Faustregel für n?
25x Anzahl der unbekannten Parameter, minimal 10 Fälle pro Parameter
so groß wie möglich
Wie sieht ein SGM aus?
Einfaches Modell, Pfeile der latenten V. zeigen auf manifeste V.
A B und C sind z.B. latente V. (Strukturmodell). Jede von ihnen wird anhand von weiteren manifesten V. gemessen (Messmodell).
Für jede dieser Beziehungscluster gibt es eine Gleichung und die drei Gleichungen werden dann im Strukturmodell miteinander verrechnet.
Wann ist ein Modell eindeutig identifizierbar?
Wenn alle unbekannten Parameter eindeutig bestimmt werden können
Was sind die zwei Voraussetzungen der Identifizierbarkeit?
- Es gibt mind. so viele Datenpunkte wie man Parameter schätzen möchte
- Jeder latenten V. muss eine Skala zugewiesen werden (übliche Lösung: 1 unstandardisierter Pfad zwischen latenter V. und einer (typischen) manifesten V. wird auf 1 gesetzt –> dadurch Skalierung); Residuen und Fehler auch auf 1, da die auch latente V. sind
Datenpunkte: Korr o. Var & Kovar; Parameter: Pfadkoeff. & Var.
Wenn alle manifesten V. gleich reliabel sind ist es egal welche, sonst reliabelste
Was ist ein unteridentifiziertes Modell?
Weniger Datenpunkte als zu schätzende Parameter –> unendlich viele mögliche Lösungen –> nicht lösbar
Auch bei sehr hohem r -> Multikollinearität
Was ist ein gerade identifiziertes Modell?
Genauso viele Datenpunkte wie zu schätzende Parameter: üblicherweise bei Pfadanalysen gegeben
Was ist ein überidentifiziertes Modell?
Normalfall bei SGM
Mehr Datenpunkte als zu schätzene Parameter
–> keine eindeutige Lösung
–> Grundidee bei Berechnung von Koeffizienten in SGM: man versucht, Fehler mgl. klein zu machen
Wie berechnet man die Koeffizienten?
Durch gezieltes Ausprobieren (meist Maximum-Likelihood-Schätzung der Parameter) –> man erhält die unstandardisierte und die standardisierte (besser interpretierbare) Lösung für die Schätzung der freien Parameter
Freie Parameter sind abhängig von Skalierung der manifesten V.
Welche Gütemaße werden berechnet?
- Chi-quadrat (goodness of fit)
- Absolute Maße
- Inkrementelle Maße
- Fehlermaße
Was passiert beim Chi-Quadrat Test?
- H0: gefundene Varianz-Kovarianz-Struktur entspricht der im Modell postulierten = Idealfall; Normalfall: überidentifiziert
- df = Anzahl der bekannten Var + Kovar - Anzahl der zu schätzenden Parameter
- Je höher der p-Wert, desto besser ist der Fit; signifikant: kein Fit!
- Problem: große Abhängigkeit von n –> großes n führt schnell zu Signifikanz –> CMIN (minimum discrepancy) Faustregel: X^2 sollte nicht größer sein als der df (Anzahl Datenpunkte - Anzhl zu schätzender Parameter –> sozusagen Ausmaß der Überidentifikation)
Signifikanztest, H0 soll aber beibehalten werden
Empfehlung: X^2 / df kleiner gleich 2,5
Welche absoluten Maße gibt es?
- Analog zu R^2
- GFI (goodness of fit)
- AGFI (adjusted goodness of fit - für df): Ausmaß der durch Modell erklärten Varianz: variiert i.d.R. von 0 bis 1 (1 optimal, 0.9 guter Fit)
- PGFI (parsimony goodness of fit): berücksichtigt zusätzlich die Komplexität (Anzahl der geschätzten Parameter); ist normalerweise kleiner als GFI, Wert von .5 noch okay
Was sind und welche Inkrementellen Maße gibt es?
- relative oder inkrementelle Maße: um wieviel besser werden die Daten durch das Modell erklärt als durch ein “Baseline-Modell” wie z.B. das independence Model
- NFI (normed fit index), CFI (comparative fit index, wie NFI, berücksichtigt aber n): 1 optimal, Werte größer als .9 oder .95 okay, CFI generell besser
- RFI (relative fit index), IFI (incremental fit index) TLI (Tucker-Lewis-Index): Variationen des NFI, allg. guter Fit bei Werten größer als .95
Man nimmt mehrere dieser Maße und schaut, ob sie konsistent sind –> gutes Maß für Güte des Ergebnisses