Modellvergleiche&Allgemine lineares Modell Flashcards

1
Q

Modell

A

Set aus Prädiktoren und der Kriteriumsvariablen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Jedes Modell erklärt unterschiedlich

A

viel Varinaz auf der kriteriumsvariablen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Zwei Modelle heißen geschachtelt (englisch: genested) wenn

A

das größere Modell sämtliche Prädiktoren des kleineren Modells und noch mindestens einen weiteren enthält.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Bei genesteten Modellen ist es möglich zu überprüfen, ob

A

das größere Modell signifikant mehr Varianz erklärt. zusätzliche Varianz würde dann durch die
zusätzlichen Prädiktoren erklärt werden. Auf diese Weise kann auch der Beitrag eines einzelnen Prädiktors untersucht werden, wenn das eingeschränkte Modell

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Modellvergleiche - Idee

A

wissenschaftliche Erklärungen & Modelle möglichst wenige Entitäten (sprich: Variablen) enthalten sollten. Nur wenn eine weitere Variable wirklich notwendig ist, um etwas zu erklären, sollte sie aufgenommen werden.
Dies heißt auch Parsimonitätsprinzip oder Ockhams Rasiermesser.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Vorgehensweisen bei der schrittweisen Aufnahme von Prädiktoren

A

Theoretische Auswahl

datengesteuerten Auswahl

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Theoretische Auswahl

A

basiert auf begründeten Annahmen über die Prädiktoren.
Dies ist wissenschaftlich gesehen die beste Vorgehensweise. Allerdings kann es je nach Überlegung unterschiedliche präferierte Reihenfolgen geben (z.B. nach erwartetem Einfluss, nach kausaler Priorität oder nach Pragmatismus)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

datengesteuerten Auswahl

A

wird automatisiert aufgrund der Ergebnisse einzelner Regressionen entschieden, welche Prädiktoren aufgenommen werden. Dabei wird vorher ein a-Niveau festgelegt, um festzulegen, ab wann ein zusätzlicher Prädiktor einen Beitrag zur Erklärung der Varianz liefert.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

datengesteuerten Auswahl drei Typen:

A

Vorwärtsselektion
Rückwärtselimination
schrittweise Regression

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Vorwärtsselektion:

A

zunächst der stärkste Prädiktor & dann immer der weitere, der den größten Zuwachs erzeugt, dies wird fortgesetzt, bis die Hinzunahme nicht signifikant besser wird.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Rückwärtselimination:

A

Alle Prädiktoren werden aufgenommen, dann wird Schritt für Schritt immer derjenige entfernt, deren F-Wert am geringsten und nicht-signifikant ist und die daher am Varianz aufklärt. Dies wird fortgesetzt, bis alle F-Werte signifikant sind.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Die schrittweise Regression:

A

Das Vorgehen gleicht zunächst der Vorwärtsselektion, wobei es zwischendurch dazu kommen kann, dass bereits aufgenommene Prädiktoren wieder entfernt werden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Effektgröße Modellvergleich

A

Determinationskoeffizient korrigiert

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Metrische Prädiktoren:

A

mind. kardinalskalierte Variablen,

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Dichotome Prädiktoren:

A

Also Variablen mit genau zwei Ausprägungen,

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Prognosefähigkeit

A

überprüfen, ob ein Modell tatsächlich in der Lage ist, unbekannte Werte vorherzusagen,
Datensatz in 2 Teile aufgeteilt
1 Teil:Regressionsgleichung errechnet
Gleichung im zweite Teil verwendet um individuelle Werte vorherzusagen
Korrelation vorhergesagte Werte&tasächliche Werte -Prognosengüte

17
Q

Overfitting

A

Prognosegüte für unbekannte Daten kann bei einem umfangreichen Modell mit vielen Prädiktoren sogar schlechter sein als bei einem kleineren Modell
entsteht, wenn zu viele Prädiktoren in das Modell aufgenommen wurden. Dadurch können die individuellen Prognosen sogar schlechter sein als bei einem kleineren Modell.
Aus diesem Grund sollte man es vermeiden, Prädiktoren in die Gleichung aufzunehmen, die in der Population ein Regressionsgewicht von 0 haben

18
Q

Wann kann die Stichporbengröße durch G Power im VOrfeld bestimmt werden?

A

wenn a, b und die erwartete Effektgröße bekannt sind.

19
Q

Überprüfung der Voraussetzungen: Homoskedastizität

A

Residuenplots betrachtet Residuen (auf der y- Achse) in Relation zu den geschätzten Werden (auf der x-Achse) gesetzt.Die Varianz der Residuen sollte über alle Werte hinweg unsystematisch um 0 schwanken.
Tests überprüft werden. Eine einfache Variante wäre beispielsweise das Unterteilen der Stichprobe in Gruppen anhand ihrer x-Werte und dem Vergleich der Varianzen in den (möglichst gleich großen) Teilstichproben. Die Varianzen sollten dabei um weniger als den Faktor 10 unterschiedlich sein.

20
Q

Wenn Heterosekdastizität festgestellt wird,

A

kann bei sehr großen Stichproben auf eine gewichtetes Kleinste-Quadrate-Schätzverfahren zurückgegriffen werden. Dies sorgt dann aber dafür, dass manche Kenngrößen wie der Determinationskoeffizent ihre klare Bedeutung verlieren.

21
Q

Überprüfung der Voraussetzungen: Unabhängigkeit der Residuen

A

vor allem verletzt, wenn Klumpenstichproben vorliegen oder bei serialen Abhängigkeiten
Ist die Unabhängigkeit der Residuen verletzt, so steigt die Wahrscheinlichkeit eines a-Fehlers deutlich.
Das Problem kann durch eine sorgfältige Versuchsplanung vermieden werden. Abhängigkeiten durch Klumpen können grade in großen Stichproben durch hierarchische lineare Modelle abgebildet werden

22
Q

Hypothen Modellvergleich

A

H0:Pu = Pe
H1: Pu> Pe

23
Q

Wofür steht jede Dummy Variable

A

für den Unterschied einer Faktorstufe zu einer Referenzbedimgumg