MR Flashcards

1
Q

Eigenschaften und Voraussetzungen mR:

A

a) die Kriteriumsvariable Y muss kontinuierlich sein
b) die Prädiktorvariablen Xj können kontinuierlich oder dichotom sein
c) die Regressionsresiduuen em addieren sich über alle n Personen zu Null auf: E(e)=0
d) die Varianz der Regressionsresiduen ist ein Maß für die Güte der Vorhersage durch das Modell (Var(e)=0 ist perfekt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wie werden bei der multiplen Regression die Regressionskoeffizienten berechnet bzw. geschätzt?

A

Nach dem Kleinste-Quadrate-Kriterium (idR ordinary least squares; OLS oder weighted least squares WLS)
Sie werden so bestimmt, dass die Summe der quadrierten Abweichungen der vorhergesagten Werten von den beobachteten Werten minimiert ist (für jede Person).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was versteht man unter dem multiplen Determinationskoeffizienten R2?

A

Der Anteil der Varianz von Y, der duch alle Prädiktoren in der Gleichung gemeinsam aufgeklärt werden kann.
Er entspricht dem Quotienten aus der Varianz der vorhergesagten Werte und der Varianz der beoabachteten Werte.
Er entspricht dem Quadrat der multiplen Korrelation zwischen beobachtetem und vorhergesagtem Y.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was ist der multiple Indeterminationskoeffizient?

A

1-R2

Anteil der unerklärten Varianz von Y

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wie kann inkrementell Varianz von Y aufgeklärt werden?

A

Durch schrittweise Hinzunahme von Prädiktoren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wie wird die zusätzlich Varianz, die durch Hinzunahme eines neuen Prädiktors aufgeklärt wird bezeichnet?

A

Semipartialdetermination oder Inkrement in R2
Achtung!!!: Für die Gesamtdetermination spielt die Reihenfolge der Aufnahme der Prädiktoren keine Rolle, wohl aber bei den Inkrementen (da der Vorhersagebeitrag eines Prädiktors auch von seinen Kollinearitäten mit anderen Prädiktoren in der Gleichung abhängt.)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was meint man mit “Multikollinearität”

A

wenn die Prädiktorvariablen in der multiplen Regression sehr hoch untereinander korrelieren dh sie sind hoch untereinander konfundiert.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Konsequenzen von Multikollinearität

A
  • kleine Regressionsgewichte von Xi, aber hohe und signifikante bivariate Korrelationen (nullter Ordnung) mit Y
  • Schätzung der b-Gewichte wird ungenau (drückt sich in Erhöhung der Standardfehler der bs aus).
  • Einschränkung der aufgeklärten Varianz (R2)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Lösungen um Konsequenzen der Multikollinearität zu umgehen

A
  • Ausschluss einzelner Prädiktoren
  • Zusammenfassen von Prädiktoren zu Faktoren (Hauptkomponenten); Mittelwertbildung und diesen Mittelwert als Prädiktor verwenden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wie diagnostiziert man Multikollinearität?

A
  1. ) Toleranz (TOL): 1 - Ri2 (Quadrat der multiplen Korr. zwischen einem Prädiktor Xi und allen anderen Prädiktoren.
  2. ) Varianz-Inflations-Faktor: 1/1 - Ri2

Faustregel: Vorsicht bei Tol < .10 und VIF > 10

Aber Achtung: Zusammenhang allein noch kein Problem für die Regression!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was unterscheidet die Regressionsgleichung von der Modellgleichung in der linearen/multiplen Regression?

A

Die Modellgleichung ist die Gleichung der beobachteten Messwerte einschließlich eines Fehlers.
Die Regressionsgleichung ist die Gleichung der vorhergesagten Messwerte einer Person (ohne Fehler).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Bedeutung des b0 im Modell der multiplen Regression?

A
b0 wird als:
- additive Konstante
- interscept oder
- Achsenabschnitt bezeichnet.
Es entspricht der erwarteten Ausprägung von y(dach)m, wenn die Ausprägung auf allen! Prädiktorvariablen gleich Null ist.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Bedeutung bi im Modell der multiplen Regression?

A

bi wird als:
- Regressionsgewicht (der betreffenden Variablen)
- Steigungskoeffizient oder
- Slope bezeichnet.
In der einfachen linearen Regression sagt b1 aus, um wieviele Einheiten sich das Kriterium ändert, wenn sich die Prädiktorvariable um eine Einheit verändert wird.
In der multiplen Regression gibt der jeweilige bi den eigenständigen Effekt der Prädiktorvariable an, wenn die anderen auspartialisiert wurden.

bi’s sind unbekannt un müssen aus den Daten geschätzt werden.
Die Koeffizienten b0 und bi sind für alle Personen identisch! -> fixed effect modell!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Bedeutung der em in der multiplen Regression?

A

em wird als:
- Regressionsresiduum oder
- error bezeichnet.
Es zeigt die Differenz zwischen dem beobachtbaren Messwert ym einer Person m und dem vorhergesagten Messwert y dach m für diese Person an.
Die Regressionsresiduen em addieren sich über alle Personen n hinweg zu 0 -> E/e)=0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Standardschätzfehler der Regression (se)?

A

Die Standardabweichung von e = Wurzel der Varianz des Residuums

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Zusammenhang zwischen der Korrelation zwischen den Prädiktoren und den eigenständigen Anteilen (bi’s)

A

3 Möglichkeiten:

a) b(mult) = b(einf) -> die Prädiktorvariablen sind unkorreliert
b) b(mult) < b(einf) -> Prädiktorvariablen sind untereinander korreliert; diese Kollinearität reduziert den eigenständingen Vorhersagebeitrag einer oder beider Prädiktorvariablen auf das Kriterium
c) b(mult) > b(einf) -> Prädiktorvariablen sind untereinander korreliert; diese Kollinearität erhöht den eigenständigen Anteil einer oder beider Prädiktorvariablen auf das Kriterium (=Suppression)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Was versteht man unter Suppression?

A

Der Einfluss eines Prädiktors auf das Kriterium (Regressionsgewicht) kann sich bei Einschluss weiterer UVs , verändern.
Er bleibt gleich, wenn die UVs nicht korrelieren (bmult=beinf).
Er ist kleiner, wenn die UVs untereinander korrelierien und die Kollinearität den eigenständigen Vorhersagebeitrag reduziert.
Suppression ist nun, wenn die UVs untereinander Korrelieren und diese Kollinearität den eigenständigen Vorhersagebeitrag erhöht. b mult ist größer als beinf!!!

Kennzeichen von Suppression:

  1. Klassische Suppression
    - Kriterium mit Mediator x2 unkorreliert
    - x1 und x2 hoch korreliert
    - korr mult > korr einfach
  2. Reziproke Suppression
    - x1 und x2 korrelieren positiv mit Y (r Yx1>0, r Yx2>0)
    - untereinander jedoch negativ (r x1x2 <0)
  3. Negative Suppression
    - x1 und x2 korrelieren pos miteinander (r x1x2>0;)
    - das Regressionsgewicht verändert bei der mult. sein Vorzeichen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Was versteht man unter hierarchischer linearer Regression?

A

wird auch sequentielle Regression genannt

darunter versteht man die schrittweise Hinzunahme oder Ausschluss von einzelnen Prädiktoren oder Prädiktorblöcken mit dem Ziel,

a) die Veränderung in R2 zu inspizieren (und die eigenständigen Effekte der jeweiligen Prädiktoren zu analysieren
b) ein möglichst sparsames Modell mit hinreichend großer Vorhersagekraft zu finden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Welche Strategien zur Auswahl von Prädiktoren für ein multiples Regressionsmodell werden verwendet?

A

I) In erster Linie sollten theoretische Überlegungen herangezogen werden (Gesamtmodell (nicht hierarchisch) und sequentielle Aufnahme (Inkrement in R quadrat)
II) als Exploratives Vorgehen -> datengesteuerte Auswahl
a) FORWARD Selektion
b) BACKWARD Selektion
c) STEPWISE Selektion

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Was versteht man unter Mediation?

A

Ein Mediator vermittelt den Zusammenhang zwischen einer Prädiktorvariablen mit einem Kriterium:
X1 —> X2 —> Y
er spezifiziert, wie oder warum ein Effekt auftritt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Wie können Mediatoranalysen im Rahmen der multiplen Regression durchgeführt werden?

A

3 Verfahren:

  1. Causal Steps Approach (Baron & Kenny)
  2. Scobel-Test
  3. Bootstrapping Methode
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Mediatorprüfung mit Causal Steps Approach (Baron & Kenny)

A

Es werden 4 Bedingungen geprüft mittels 3 Regressionsgleichungen:
1. Zuerst wird der totale Effekt von X1 auf Y untersucht (mittels Regressionsgleichung ohne Moderator)
1.Reg: ydach= b01 + b11. X1
ist erfüllt wenn b11>0 und sign.
2. Prüfung, ob X1 den Mediator signifikant beeinflusst
2.Reg: X2dach = b02 + b12. X1
ist erfüllt wenn B12>0 und sign.
3. Aufstellen Gesamtgleichung Untersuchung b-Pfad und direkter Effekt
3.Reg: ydach=b03 + b13X1 + b23X2
Bei Kontrolle von X1 muss Mediator Y sig beeinflussen (bedeutet: b23 sig > 0)

  1. Direkte Effekt muss kleiner als b11 sein.
    dh. bei Kontrolle von Mediator muss b13 < b11 sein (partielle Mediation) oder b13
    !!!nicht sig. !!! von 0 verschieden sein.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Kritik bzw. Nachteile am Causal steps approach (Baron & Kenny)

A

Der indirekte Effekt muss erst berechnet werden und kann nicht auf Signifikanz überprüft werden
Berechnung des indirekten Effekts:
beta 12 (a-Pfad) x beta 23 (b-Pfad)

24
Q

Scobel -Test

(indirekter Effekt); Process

A

Ist ein Verfahren zur Überprüfung einer Mediationsanalyse im Rahmen der multiplen Regression.
Mit ihm kann im Gegensatz zum Causal steps approach die signifikante Abweichung des indirekten Effekts gemessen werden.
Es prüft die 0-Hypothese, dass der indirekte Effekt in der Population gleich 0 ist.
Der Test erfolgt über die Standardnormalverteilung (z-Verteilung)
Prüfgröße ist: indirekter Effekt dividiert durch Standardfehler (SE)
Kriterium: indirekte Effekt ist sig, wenn empirische z-Wert größer oder gleich dem krititschen z-Wert auf alpha .05 ist.

Process liefert: indirekten Effekt (unstandardisiert) und p-Wert (Normal theory tests for indirect effect)

25
Q

Nachteile / Probleme Scobel Test

A
  • der Test setzt voraus, dass die Stichprobenkennwerteverteilung des indirekten Effekts (b12.b23) normalverteilt ist und ist dabei nicht robust gegenüber Verletzungen
  • sagt zu schnell Signifikanz und Mediation trifft zu
  • geringere Power als die Bootstrapping-Methode
  • ist nur sinnvoll, bei Stichproben > 400
26
Q

Königsweg um Mediator zu analysieren

Process

A

Bootstrapping Methode (analysiert indirekten Effekt)
Testet die H0: indirekte Effekt in der Population = 0
Prinzip: Stichprobenkennwerteverteilung für den indirekten Effekt wird empirisch generiert aus den Originaldaten mit Zurücklegen ( mindestens 5000 (k) mal), dadurch entstehen k Resamples und indirekte Effekte;
daraus Häufigkeitsverteilung, die wie die Stichprobenkennwerteverteilung indirekter Effekte behandelt wird
BESTIMMUNG KONFIDENZINTERVALL für den indirekten Effekt
KRITERIUM: 95% Intervall KI für den indirekten Effekt beinhaltet NICHT DIE NULL

27
Q

Vorteile Bootstrapping gegenüber Scobel-Test

A

Keine Verteilungsannahme erforderlich, da die Stichprobenkennwerteverteilung durch das Resampling generiert wird.
Ist präferierte Methode für Mediatoranalyse
Analsyse liefert immer UNSTANDARDISIERT:
totaler Effekt, direkter Effekt, (Absicherung t-Test)
indirekter Effekt und KI

28
Q

0 Hypothese beim Scobel-Test?

A

Es wird die Nullhypothese getestet, dass der indirekte Effekt in der Population gleich Null ist.

29
Q

Was ändert sich bei der Moderierten Regressionsanalyse?

A

Durch einen Moderator sind die betas nicht mehr eigenständige, unabhängige Effekte, sondern die Ausprägung eines Prädiktors hängt von der Größe des Moderators ab. Dadurch muss ein Produktterm aufgenommen werden, der die Interaktion misst und die Bedeutung der Betas der Prädiktoren ist nur mehr bedingt. (Abhängigkeit ist symmetrisch)

30
Q

Wie verändert sich die inhaltliche Interpretation der Regressionsgewichte von X1 und X2 durch die Aufnahme der Produktvariablen?

A

Wenn X um eine Einheit steigt und X2 = 0 und folglich auch X1X2 = 0, dann steigtz der Y-Wert um beta-Einheiten zu X1.
Umgekehrt für X2.

31
Q

Was bedeutet das Regressionsgewicht der Produktvariablen?

A

es entspricht der Interaktion;
Der Effekt von X1 nimmt mit jeder Einheit, die X2 steigt um b3 Einheiten zu (Analog Effekt X2)
Das Gewicht des Produktterms gibt also an, in welchem Ausmaß der Effekt von X1 von der Ausprägung von X2 abhängt und umgekehrt.

32
Q

Was bedeutet das b1 bzw. b2 bei der nicht moderierten Regression?

A

Wenn X1 um eine Einheit steigt und X2 konstant gehalten wird (egal welcher Wert), dann steigt Y um b1 Einheiten (Analog für X2/b2).

33
Q

Wann führt man bei einer moderierten Regression eine Zentrierung durch?

A

Wenn bei den bedingten Haupteffekten die 0 Interpretiert werden muss. Man also nicht nur die Interaktionseffekte, sondern auch die bedingten Haupteffekte benötigt.
Ohne Zentrierung kann man nur die mittleren Effekte für b1 und b2 berechnen.
Egal ob zentriert oder nicht, die Interaktionseffekte (Schätzer b3) und der Standardfehler bleiben gleich. Nur die bedingten Haupteffekte (b1, b2) ändern sich durch Zentrierung.

34
Q

Was bedeutet Zentrierung?

A

Der Null wird eine Bedeutung zugewiesen;
nämlich die Null wird zum Mittelwert.
Damit ermöglicht die Zentrierung die direkte Interpretation von b1 und b2.
Achtung, im Gegensatz zur Standardisierung bleibt bei der Zentrierung die ursprüngliche Standardabweichung erhalten.
Prädiktoren werden vor der Produktbildung zentriert.

35
Q

Was kann statt Zentrierung noch verwendet werden?

A

Friedrich-Lösung (selten)
damit ist gemeint, dass die Prädiktoren (und in der Regel auch das Kriterium) vor der Produktbildung standardisiert werden.
Mittelwert = 0
Standardabweichung = 1

36
Q

Warum wird nicht einfach die Varianzanalyse (mit Mediansplit auf den Prädiktoren) verwendet?

A
  • Das Kriterium cut-off ist willkürlich und nicht psychologisch begründet
  • Median ist stichprobenabhängig
  • Das Skalenniveau wird verringert, daher sind moderierte Regressionen meistens teststärker als Varianzanalysen mit Mediansplit
  • Es besteht die Gefahr, dass der reale Effekt über- oder unterschätzt wird. (bei künstl. Kategorisierungen zentral)
37
Q

Wann beeinhaltet ein Produktterm den reinen Interaktionseffekt?

A

Nur dann, wenn auch die Haupteffekte der interagierenden Prädiktoren auspartialisiert wurden - dh sie müssen immer in die Regressionsgleichung mit eingeschlossen werden, auch wenn nur die Interaktionseffekte interessieren (aber Zentrierung ist dann nicht notwendig)

38
Q

Was ist ein weiterer Vorteil der moderierten Regression im Gegensatz zur Varianzanalyse?

A

Moderierte Regression kann auch herangezogen werden, um Interaktionen zwischen einem kategorialen und kontinuierlichen Prädiktor zu testen.

39
Q

Was ist bei der Verwendung eines polytomen kategorialen Prädiktors in der moderierten Regression zu beachten?

A

Der kategoriale Prädiktor muss für die moderierte Regression erst aufbereitet werden, dh es müssen Kodiervariablen erzeugt werden.
(Anzahl der Kategorien minus 1)

40
Q

Welche Typen von Prädiktoren sind für eine Regressionsanalyse zulässig?

A
  • kontinuierliche
  • dichotome kategoriale Prädiktoren (männlich vs. weiblich, EG vs KG) Effekt- oder Dummykodierung
  • polytome kategoriale Prädiktoren (mehr als 2 Kategorieen - muss vor der Aufnahme in Codiervariablen transformiert werden.
41
Q

Prinzip der Kodierung bei polytomen kategorialen Prädiktor

A
  • muss in c-1 Kodiervariablen transformiert werden
  • diese Kodiervariablen müssen in die multiple Regression aufgenommen werden
  • Die bekanntesten Kodierungen sind Dummy- und Effektkodierung
  • Die Wahl der Kodiervariablen hängt von der inhaltlichen Fragestellung ab. (Dummy: intercept=Mittelwert der Referenzkategorie; Effekt: intercept = Gesamtmittelwert)
42
Q

Prinzip Dummykodierung (Wenn Mittelwertsunterschiede interessieren - Kontrastierung)

A
  • Auswahl der Referenzkategorie (sinnvoll ist die Kontrollgruppe zu wählen) KONTRASTIERUNG
  • Bildung Kodiervariable D1 (Personen in der EG1 erhalten eine 1 und alle anderen 0
  • Bildung Kodiervariable D2 (Personen in der EG2 erhalten eine 1 und alle anderen 0
  • die beiden Kodiervariablen werden als Prädiktoren in die Regressionsgleichung aufgenommen
  • INTERCEPT: = Mittelwert der REFERENZKATEGORIE
  • B1: Mittelwertsunterschied der EG1 zu KG(Referenzk)
  • B2: Mittelwertsunterschied der EG2 zu KG(Referenz)
  • VORHERGESAGTE KRITERIUMSWERTE entsprechen den empirischen Gruppenmittelwerten (ist ident zur Effektkodierung!!)
43
Q

Prinzip Effektkodierung (Wenn Gesamtmittelwerte interessieren- keine Kontrastierung)

A
  • Auswahl der Basiskategorie (Beispiel KG)
  • Bildung Kodiervariable E1 (Personen in EG1 erhalten eine 1, Mitglieder der Basiskategorie -1, alle anderen 0)
  • Bildung Kodiervariable E2 (Personen in EG2 erhalten eine 1, Mitglieder der Basiskategorie - 1, alle anderen 0)
  • Aufnahme der beiden Kodiervariablen in die multple Regression
  • INTERCEPT: = Gesamtmittelwert
  • b1: Differenz zwischen EG1 und Gesamtmittelwert aller Kategorien
  • b2: Differenz zwischen EG2 und Gesamtmittelwert aller Kategorien
  • VORHERGESAGTE KRITERIUMSWERTE entsprechen den empirischen Gruppenmittelwerten (ist ident zur Dummykodierung!!)
44
Q

Was versteht man unter moderierten Mediation?

A

Kombination aus Mediation und Moderation

- Prüfung konditionaler indirekter Effekte

45
Q

Möglichkeiten moderierter Mediationen?

A
  • Prädiktor X fungiert als Moderator des b-Pfads (selten)
    häufig sind:
  • Variable W fungiert als Moderator des a-Pfads
  • Variable W fungiert als Moderator des b-Pfads
46
Q

Voraussetzungen der MR

A
  • Korrekte Spezifikation des Modells
  • Messfehlerfreiheit der unabhängigen Variablen bzw. Prädiktoren (Reliabilität)
  • Homoskedastizität (Varianzgleichheit der Residuen bei allen vorhergesagten Y -werten)
  • Normalverteilung der Residuen
47
Q

Problematische Datenkonstellationen in MR

A

AUSREISSER (und MULTIKOLLINEARITÄT):

  • sie können die Regressionskoeffizienten und Standardfehler beeinflussen
  • sie können sowohl auf Y als auch auf X vorliegen

Sie können diagnostiziert werden indem die RESIDUEN (ym - y^m) inspiziert werden.

ACHTUNG: Ausschluss nicht allein Frage der Statistik sondern auch inhaltlich (Beispiel: Hochbegabung)

48
Q

Bedeutung korrekte Spezifikation des Modells?

A
  • Ist das Zusammenhangmuster zwischen Prädiktoren und Y richtig spezifiziert? (zB. Mediatoren, Zusammenhangsform linear oder anders, irrelevante Prädiktoren (Overfitting))
  • Können die Effekte kausal interpretiert werden? (Richtung eindeutig interpretierbar, Konfundierungen oder Alternativerklärungen)
49
Q

Welchen Einfluss haben Messfehler der UV bzw. Prädiktoren (Reliabiltät) in der MR?

A

In der BIVARIATEN REGGRESSIONSANALYSE führt die Messfehlerbehaftetheit des Prädiktors zu einer UNTERSCHÄTZUNG des wahren REGRESSIONSGEWICHT.

In der MULTIPLEN kann es zu einer UNTER- oder ÜBERSCHÄTZUNG des wahren REGRESSIONSGEWICHTS

Bei stark messfehlerbehafteten Variablen sollte auf Modelle mit LATENTEN VARIABLEN zurückgegriffen werden (lineare Strukturgleichungsmodelle)

50
Q

Diagnose von Messfehlerbehaftetheit

A

Die Reliabilität kann aus den Daten geschätzt werden

51
Q

Homoskedastizität

A

Varianzgleichheit bzw. genauer: bedeutet, dass sich die bedingten Residualvarianzen von Y in der Population alle identisch verteilen = Varianz der Residuen em ist bei allen vorhergesagten Werten für Y identisch

Ist Pedant zur Varianzhomogenität bei der Varianzanalyse

Gegenteil ist Heteroskedastizität

Heteroskedastizität führt NICHT zu Verzerrung der Punktschätzer der Regressionskoeffizienten, wohl aber zu einer Verzerrung des STANDARDFEHLERS (und damit Verzerrung des Alphafehlers bei inferenzstat. Absicherung)

52
Q

Diagnose Heteroskedastizität/Homo…

A

RESIDUENPLOT (Residuen gegen vorhergesagte y-Werte

53
Q

Residuenplot zeigt:
je größer der vorhergesagte Wert, desto größer die Residuen

Bedeutung?

A

Möglicher Moderatoreffekt einer ausgelassenen Drittvariablen

54
Q

Residuenplot zeigt:
Vorhersage ist im mittleren Bereich von Y fehlerfreier als im extremen Bereich

Bedeutung?

A

Eventuell ist die Messung von Y im extremen Bereich unreliabler

55
Q

stochastische Unabhängigkeit der Residuen

Bedeutung; wann verletzt; Folge von Verletzung; Lösung

A

BEDEUTUNG: Residuum einer beliebigen Person kann nicht durch das Residuum einer beliebigen anderen Person vorhergesagt werden.
Ist VERLETZT bei ABHÄNGIGEN DATEN (Mehrfachmessungen, Paarlingen) und bei HIERARCHISCHEN DATENSTRUKTUREN (Schülern in Klassen; Patienten in Therapiegruppen
FOLGEN WENN VERLETZT: Standardfehler werden unterschätzt und die Tests zu schnell signifikant.

LÖSUNG. Hierarchische lineare Modelle

56
Q

Normalverteilung

Bedeutung; Diagnostik; Verletzungsfolgen; Lösungsmöglichkeiten

A

BEDEUTUNG: bedingten/unbedingten Residuen in der Population sollen der Normalverteilung folgen

DIAGNOSTIK: mit Hilfe von graphischen Tests:

  • Histogramm
  • P-P-Plot (erwartete kummulative p/beobachtete kum.p)
  • Q-Q-Plot

VERLETZUNGSFOLGEN: nur auf den Standardfehler und da auch nur dann, wenn Stichprobe zu klein (nicht auf den Schätzer des Regressionskoeffizienten).
Und damit dann auch auf die Ergebnisse der inferenzstatistischen Tests
NICHTNORMALVERTEILUNG KANN HINWEIS AUF FEHLSPEZIFIZIERTES MODELL SEIN!

LÖSUNGSMÖGLICHKEIT: Transformation der Variablen zb. Logarithmustransformation