Verfahren zur Überprüfung von Zusammenhangshypothesen Flashcards

1
Q

Welche Arten von Forschungsfragen drehen sich oft um den Zusammenhang zwischen Variablen?

A

Forschungsfragen, die sich um den Zusammenhang zwischen kategorialen oder kontinuierlichen Variablen drehen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Welche Verfahren werden zur Testung von Unterschieden zwischen kategorialen Variablen verwendet?

A

t-Tests und die Varianzanalyse werden oft zur Testung von Unterschieden zwischen kategorialen Variablen verwendet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Warum werden t-Tests und die Varianzanalyse oft für kategoriale Variablen eingesetzt?

A

Diese Verfahren sind geeignet, um Unterschiede zwischen Gruppen zu untersuchen, die durch kategoriale Variablen definiert sind

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was passiert, wenn die beteiligten Variablen nicht kategorial, sondern kontinuierlich sind?

A

Wenn die Variablen kontinuierlich sind, könnten sie durch einen Mediansplit in Kategorien aufgeteilt werden, um Unterschiede zu untersuchen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was wäre eine Möglichkeit, kontinuierliche Variablen in Kategorien aufzuteilen, um Unterschiede zu untersuchen?

A
  • Eine Möglichkeit wäre ein Mediansplit
  • bei dem die Variablen in zwei Gruppen anhand des Medianwerts aufgeteilt werden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Welche Informationen gehen verloren, wenn kontinuierliche Variablen durch einen Mediansplit in Kategorien aufgeteilt werden?

A
  • Durch einen Mediansplit gehen Informationen über mögliche Unterschiede innerhalb der Gruppen verloren
  • da nur die Mittelwerte der definierten Gruppen verwendet werden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Welche Annahme treffen wir, wenn wir einen Zusammenhang zwischen zwei Variablen vermuten?

A

Wir nehmen an, dass die Variabilität in der einen Variable systematisch mit der Variabilität in der anderen zusammenhängt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist die Kovarianz und welche Information liefert sie?

A
  • Die Kovarianz misst, wie stark die Variablen gemeinsam variieren
  • liefert Informationen über die Richtung des Zusammenhangs
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Warum ist die Korrelation eines der wichtigsten Maße in der Statistik?

A
  • Die Korrelation ist ein standardisiertes Maß für den Zusammenhang zwischen Variablen
  • ermöglicht eine präzise Quantifizierung dieses Zusammenhangs
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wie können wir Hypothesen über Korrelationen testen?

A
  • Wir können Hypothesen über Korrelationen testen
  • indem wir statistische Tests wie den Pearson-Korrelationskoeffizienten verwenden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was ermöglicht uns der Zusammenhang von Variablen in Bezug auf Vorhersagen?

A

ermöglicht es uns, Vorhersagen über eine Variable basierend auf den Werten einer anderen Variable abzuleiten

> was in verschiedenen Anwendungen nützlich ist

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wie quantifizieren wir den Zusammenhang zwischen Variablen?

A

indem wir die Kovarianz und anschließend die Korrelation berechnen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was ist die Kovarianz und wie wird sie berechnet?

A
  • Die Kovarianz ist die Summe der multiplizierten Abweichungen zweier Variablen
  • dividiert durch die Anzahl der Freiheitsgrade
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wann spricht man von einem positiven linearen Zusammenhang?

A

Man spricht von einem positiven linearen Zusammenhang, wenn höhere Werte auf der einen Variable mit höheren Werten auf der anderen einhergehen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was bedeutet ein positiver Wert der Kovarianz?

A

zeigt an, dass die Variablen gleichsinnig zusammenhängen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wie bezeichnet man einen gleichsinnigen Zusammenhang und was zeigt eine negative Kovarianz an?

A
  • Einen gleichsinnigen Zusammenhang nennt man auch positiven Zusammenhang
  • Eine negative Kovarianz zeigt einen gegensinnigen Zusammenhang an
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Wann ist die Kovarianz 0 und was bedeutet das?

A
  • Die Kovarianz ist 0, wenn die Variablen unabhängig voneinander sind
  • Das bedeutet, dass kein linearer Zusammenhang zwischen den Variablen besteht
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Was ist die Einschränkung der Kovarianz in Bezug auf die Interpretation des Zusammenhangs?

A

Die Kovarianz hängt von der Einheit der Variablen ab

> was ihre Interpretation erschwert

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Wie können wir die Stärke des Zusammenhangs zwischen Variablen interpretieren?

A

Um die Stärke des Zusammenhangs zu interpretieren, standardisieren oder z-transformieren wir die Kovarianz, um die Korrelation zu erhalten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Wie standardisieren wir die Kovarianz?

A

Wir setzen die Kovarianz ins Verhältnis zum Produkt der Standardabweichungen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Was ist der Pearson-Korrelationskoeffizient und wie wird er berechnet?

A

Der Pearson-Korrelationskoeffizient ist ein Maß für den linearen Zusammenhang zwischen zwei Variablen

  • Er wird berechnet, indem die Kovarianz der beiden Variablen durch das Produkt ihrer Standardabweichungen geteilt wird
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Welche Eigenschaften hat der Pearson- Korrelationskoeffizient?

A
  • Der Pearson-Korrelationskoeffizient liegt immer zwischen -1 und 1
  • Bei einem perfekten positiven linearen Zusammenhang ist er 1
  • bei einem perfekten negativen linearen Zusammenhang -1
  • bei keinem linearen Zusammenhang 0
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Wie interpretieren wir den Pearson-Korrelationskoeffizienten?

A
  • Je näher der Pearson-Korrelationskoeffizient an 1 oder -1 liegt, desto stärker ist der lineare Zusammenhang zwischen den Variablen
  • Ein Wert von 0 zeigt an, dass kein linearer Zusammenhang besteht
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Nach Cohen
(1988) gelten folgende Konventionen für die Klassifizierung von rxy:

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Wofür dient die Korrelation zunächst?
Sie dient der Beschreibung des Zusammenhangs zwischen zwei Merkmalen in einer Stichprobe
26
Was repräsentiert der Korrelationskoeffizient 𝑟𝑥𝑦 in Bezug auf die Population?
Er schätzt die Korrelation der Merkmale in der Population
27
Welche Bezeichnung hat die wahre Korrelation in der Population?
Die wahre Korrelation in der Population wird mit dem griechischen Buchstaben 𝜌 („rho“) bezeichnet
28
Welche Faktoren beeinflussen die Teststatistik für die Populationskorrelation?
Die Teststatistik hängt nur von der Größe der Korrelation und der Stichprobengröße ab
29
Welche Möglichkeiten gibt es, Hypothesen über die Population anhand von 𝑟𝑥𝑦 zu testen?
- Mit einem t-Test für die berechnete t-Statistik - durch Bestimmung des kritischen Werts der t-Verteilung basierend auf dem festgelegten α-Niveau
30
Was ist Fishers Z-Transformation?
- Eine Methode, um Hypothesen über die Population basierend auf der Korrelation zu testen - wenn sich die Schätzungen mit 𝑟𝑥𝑦 nicht normal verteilen
31
Was ist die Korrelation und wofür dient sie?
- Die Korrelation ist ein Maß für den linearen Zusammenhang zwischen zwei Merkmalen > dient der Quantifizierung dieses Zusammenhangs
32
Was bedeutet es, wenn die Korrelation zwischen zwei Merkmalen 0 ist?
Wenn die Korrelation 0 ist, bedeutet dies, dass es keinen linearen Zusammenhang zwischen den beiden Merkmalen gibt
33
Warum bedeutet eine Korrelation von 0 nicht unbedingt, dass die Merkmale unabhängig voneinander sind?
- Eine Korrelation von 0 bedeutet nicht zwangsläufig, dass die Merkmale unabhängig voneinander sind > da der Zusammenhang auch nichtlinear sein kann
34
Warum kann die Korrelation durch Ausreißer stark beeinflusst werden?
Ausreißer können die Korrelation stark verändern, da sie einen großen Einfluss auf das Maß haben können
35
Welche weiteren Zusammenhangsmaße können robuster gegenüber Ausreißern sein?
Spearmans Rangkorrelation ist ein Beispiel für ein Zusammenhangsmaß, das robuster gegenüber Ausreißern ist
36
Auf welchen Annahmen beruhen inferenzstatistische Verfahren zur Korrelation?
- Inferenzstatistische Verfahren zur Korrelation beruhen auf der Annahme, dass die beiden Variablen bivariat normalverteilt sind - mit einer wahren Korrelation 𝜌
37
Was kann bei groben Verletzungen dieser Annahmen passieren?
Bei groben Verletzungen dieser Annahmen können die Fehlerraten der statistischen Tests größer sein als angenommen
38
Was ist das Ziel der linearen Regression?
Das Ziel der linearen Regression ist es, eine Variable aufgrund einer anderen Variable vorherzusagen
39
Was bedeutet es, eine Variable aufgrund einer anderen Variable vorherzusagen?
- Es bedeutet, den Zusammenhang zwischen den Variablen zu nutzen - um Werte einer Variable basierend auf den Werten einer anderen Variable vorherzusagen
40
Was ist der Unterschied zwischen Korrelation und Vorhersage?
- Die Korrelation quantifiziert den Zusammenhang zwischen Variablen - während die Vorhersage den Versuch unternimmt, eine Variable basierend auf einer anderen Variable zu prognostizieren
41
Was versteht man unter einer linearen Regression?
Bei der linearen Regression wird versucht, den linearen Zusammenhang zwischen zwei oder mehr Variablen zu modellieren, um eine Vorhersage zu treffen
42
Wann spricht man von einer multiplen linearen Regression?
Man spricht von einer multiplen linearen Regression, wenn mehrere Prädiktoren verwendet werden, um eine Variable vorherzusagen
43
Was ist ein deterministischer Zusammenhang?
Ein deterministischer Zusammenhang besteht: - wenn der Zusammenhang zwischen den Variablen perfekt ist - jede Variable exakt vorhergesagt werden kann
44
Warum ist eine perfekte Vorhersage in der Psychologie oft nicht möglich?
da komplexe menschliche Verhaltensweisen und Variabilität die Vorhersage erschweren
45
Was ist ein stochastischer Zusammenhang?
Ein stochastischer Zusammenhang besteht, wenn die Vorhersage von Variablen aufgrund anderer Variablen nicht exakt ist, sondern Wahrscheinlichkeiten beinhaltet
46
Wie wird die Güte einer Vorhersage gemessen?
- Die Güte einer Vorhersage wird gemessen, indem man die Abweichungen zwischen den vorhergesagten Werten und den tatsächlichen Werten betrachtet > Je geringer die Abweichungen, desto besser ist die Vorhersage
47
Die einfache lineare Regression ist eine Methode, um den Wert …
… einer kontinuierlichen Kriteriumsvariable durch eine Prädiktorvariable vorherzusagen
48
Was sind die beiden Parameter, die die Regressionsgerade definieren?
Die beiden Parameter sind a und b > auch bekannt als Regressionsgewichte oder -koeffizienten
49
Wie wird der Parameter a auch genannt und was repräsentiert er?
Der Parameter a wird auch als y-Achsenabschnitt oder Intercept bezeichnet > Er repräsentiert den Wert von Y, wenn X = 0 ist
50
Wie wird der Parameter b auch genannt und was repräsentiert er?
Der Parameter b wird Steigung genannt > Er repräsentiert die Veränderung in unserer Vorhersage für Y, wenn sich der Prädiktor X um eine Einheit verändert
51
Was beschreibt der Parameter a in Bezug auf die Regressionsgerade?
Der Parameter a beschreibt den y-Achsenabschnitt > also den Wert von Y, wenn X = 0 ist
52
Was repräsentiert der Parameter b in Bezug auf die Regressionsgerade?
- Der Parameter b repräsentiert die Steigung der Regressionsgerade - also die Veränderung in unserer Vorhersage für Y, wenn sich der Prädiktor X um eine Einheit verändert
53
Wie werden die Parameter a und b ausgewählt, um die Vorhersage zu optimieren?
Die Parameter a und b werden so ausgewählt, dass die Summe der quadrierten Abweichungen von der resultierenden Geraden minimal wird
54
Was bedeutet die "Methode der kleinsten Quadrate"?
Die "Methode der kleinsten Quadrate" bezieht sich auf die Auswahl der Regressionskoeffizienten, um die quadrierten Abweichungen von der Regressionsgerade zu minimieren
55
Müssen alle möglichen Kombinationen von a und b ausprobiert werden, um die optimalen Regressionskoeffizienten zu finden?
Nein, es gibt Formeln zur Berechnung der optimalen Regressionskoeffizienten, sodass nicht alle möglichen Kombinationen ausprobiert werden müssen
56
Wie hängen Korrelation und Regression zusammen?
Korrelation und Regression sind eng miteinander verbunden > da sie beide den Zusammenhang zwischen Variablen beschreiben
57
Was beschreibt die Korrelation?
Die Korrelation beschreibt den linearen Zusammenhang zwischen zwei Variablen
58
Wofür wird die Regression verwendet?
Die Regression wird verwendet, um das Kriterium mithilfe des Prädiktors vorherzusagen > basierend auf dem linearen Zusammenhang zwischen den Variablen
59
Was ist ein entscheidender Unterschied zwischen Korrelation und Regression?
Ein entscheidender Unterschied besteht darin, dass die Einheiten der Messwerte bei der Regression eine Rolle spielen > während die Korrelation standardisiert ist und unabhängig von den Einheiten ist
60
Was spielt bei der Regression eine Rolle, was bei der Korrelation nicht berücksichtigt wird?
Bei der Regression spielen die Einheiten der Messwerte eine Rolle > während die Korrelation unabhängig von den Einheiten ist
61
Was bedeutet es, die Varianz aufzuklären?
dass wir versuchen, Unterschiede im Kriterium basierend auf Unterschieden im Prädiktor vorherzusagen
62
Wie wird der Determinationskoeffizient definiert und wie wird er berechnet?
Der Determinationskoeffizient wird definiert als das Quadrat der Korrelation zwischen dem Prädiktor und dem Kriterium Er wird berechnet, indem man das Quadrat des Korrelationskoeffizienten r xy nimmt: Rhoch2 =rhoch2xy
63
Welche Werte kann der Determinationskoeffizient annehmen und was bedeuten sie?
Der Determinationskoeffizient kann Werte zwischen 0 und 1 annehmen - Ein Wert von 0 bedeutet, dass der Prädiktor keinen linearen Zusammenhang mit dem Kriterium hat und keine Vorhersagequalität besitzt - Ein Wert von 1 bedeutet, dass der Prädiktor und das Kriterium perfekt linear zusammenhängen
64
Was ist der Standardschätzfehler und welche Information liefert er?
- beschreibt eine Art mittleres Residuum und gibt an, wie stark die Kriteriumswerte im Allgemeinen von den vorhergesagten Werten abweichen > Er liefert Informationen über die Genauigkeit der Vorhersage
65
Warum wird der korrigierte Determinationskoeffizient berechnet und wie wird er berechnet?
Der korrigierte Determinationskoeffizient wird berechnet, um eine bessere Schätzung des Anteils der Kriteriumsvarianz in der Population zu erhalten. > Er wird berechnet, indem der ursprüngliche Determinationskoeffizient anhand der Stichprobengröße und der Anzahl der Prädiktoren korrigiert wird
66
Der Determinationskoeffizient ist das Verhältnis …
… cer Quadratsumme der vorhergesagten Werte zur Quadratsumme der Kriteriumswerte
67
Was ist der Unterschied zwischen einfacher und multipler linearer Regression?
- Bei der einfachen linearen Regression wird eine Variable durch eine andere Variable vorhergesagt - während bei der multiplen linearen Regression eine Variable durch mehrere Variablen vorhergesagt wird
68
Warum wird die multiple lineare Regression verwendet?
- Die multiple lineare Regression wird verwendet, um die Vorhersagegenauigkeit zu erhöhen - um den individuellen Einfluss verschiedener Prädiktoren auf ein Kriterium zu untersuchen, während andere Prädiktoren kontrolliert werden
69
Wie können mehrere Prädiktoren gleichzeitig zur Vorhersage eines Kriteriums genutzt werden?
Mehrere Prädiktoren werden gleichzeitig in die Regressionsgleichung eingeführt, wodurch die Vorhersage des Kriteriums basierend auf den Werten der Prädiktoren erfolgt
70
Welchen Vorteil bietet die Verwendung mehrerer Prädiktoren in der Regression?
Die Verwendung mehrerer Prädiktoren ermöglicht eine genauere Vorhersage des Kriteriums und die Untersuchung individueller Prädiktoreneffekte unter Kontrolle anderer Prädiktoren
71
Was bedeutet es, den Einfluss einzelner Prädiktoren zu testen, während andere Prädiktoren kontrolliert werden?
Dies bedeutet, dass der spezifische Einfluss jedes Prädiktors auf das Kriterium getestet wird > während die Effekte anderer Prädiktoren in der Analyse berücksichtigt werden, um sicherzustellen, dass sie nicht fälschlicherweise einem anderen Prädiktor zugeschrieben werden
72
Was ist eine Regressionsgleichung?
eine mathematische Darstellung des Regressionsmodells
73
Was geben die Steigungskoeffizienten b1 und b2 in der multiplen linearen Regression an?
Die Steigungskoeffizienten b1 und b2 geben an, wie sich das Kriterium Y ändert > wenn sich der entsprechende Prädiktor um eine Einheit erhöht und der andere Prädiktor konstant bleibt
74
Wie wird der Effekt eines Prädiktors auf das Kriterium berechnet?
indem die Veränderung des Kriteriums mit der Veränderung des entsprechenden Prädiktors multipliziert wird
75
Warum ist der Zusatz "der andere Prädiktor bleibt konstant" wichtig bei der Interpretation der Steigungskoeffizienten?
um den alleinigen Effekt eines Prädiktors auf das Kriterium zu isolieren > unbeeinflusst vom anderen Prädiktor
76
Warum werden die Steigungskoeffizienten als "partielle" Regressionskoeffizienten bezeichnet?
- weil sie den Effekt eines Prädiktors auf das Kriterium widerspiegeln - bereinigt um den Einfluss des anderen Prädiktors
77
Was bedeutet es, wenn ein Steigungskoeffizient "partiell" ist?
zeigt den spezifischen Effekt eines Prädiktors auf das Kriterium an > nachdem der Einfluss anderer Prädiktoren herausgerechnet wurde
78
Es ist möglich, die Stärke des Effekts jedes Prädiktors auf das Kriterium zu vergleichen, indem …
… man die Steigungskoeffizienten standardisiert
79
Was ist die Statistische Kontrolle?
der Vorgang, bei dem eine Variable von dem Einfluss von einer oder mehreren Störvariablen bereinigt wird
80
Was dient in der multiplen Regression als Maß der Vorhersagegüte?
Der Determinationskoeffizient R² dient als Maß der Vorhersagegüte
81
Wie wird der Determinationskoeffizient R² in der multiplen Regression berechnet?
Der Determinationskoeffizient R² wird berechnet, indem die quadrierte multiple Korrelation verwendet wird, also R² = r²yy
82
Was gibt der Determinationskoeffizient in der multiplen Regression an?
Der Determinationskoeffizient gibt den Anteil der aufgeklärten Varianz des Kriteriums durch die Prädiktoren wieder
83
Wie kann der Determinationskoeffizient R² über die multiple Korrelation berechnet werden?
Der Determinationskoeffizient R² kann über die multiple Korrelation berechnet werden, indem die quadrierte multiple Korrelation verwendet wird, also R² = r²yy
84
Welche Fragestellungen interessieren Forscher in der multiplen linearen Regression?
- ob mindestens einer der k Prädiktoren Varianz des Kriteriums erklären kann, ob ein bestimmter Prädiktor Varianz des Kriteriums erklären kann - ob ein Set an Prädiktoren mehr Varianz des Kriteriums aufklären kann als ein anderes Set an Prädiktoren
85
Was testet der hierarchische F-Test in Bezug auf die Prädiktoren?
Der hierarchische F-Test testet, ob ein zusätzliches Prädiktorenset B, ergänzt zu einem bestehenden Set A, signifikant Varianz des Kriteriums erklären kann
86
Wie werden die Freiheitsgrade in der Teststatistik des hierarchischen F-Tests berechnet?
Die Freiheitsgrade in der Teststatistik des hierarchischen F-Tests werden wie folgt berechnet: df1 = kb und df2 = n - kA - kb - 1 - wobei kb die Anzahl der Prädiktoren im Set B - kA die Anzahl der Prädiktoren im Set A - n die Gesamtanzahl der Beobachtungen ist
87
Was ist eine zentrale Annahme der linearen (multiplen) Regression?
Eine zentrale Annahme ist, dass der wahre Zusammenhang zwischen dem Kriterium und den Prädiktoren linear ist
88
Warum ist es wichtig, nichtlineare Zusammenhänge in der Regression zu erkennen und zu berücksichtigen?
Es ist wichtig, nichtlineare Zusammenhänge zu erkennen, da lineare Modelle diese nicht angemessen erfassen können > was zu ungenauen Vorhersagen führen kann
89
Wie kann man in der Regression nichtlineare Zusammenhänge integrieren?
- Nichtlineare Zusammenhänge können durch die Verwendung von nichtlinearen Regressionsmodellen wie der quadratischen Regression integriert werden > um die Beziehung zwischen den Variablen genauer abzubilden
90
Was besagt die Homoskedastizitätsannahme in Bezug auf die lineare Regression?
besagt, dass die Varianz der Kriteriumswerte über alle Prädiktorenwertekombinationen hinweg konstant ist
91
Welche Auswirkungen hat eine Verletzung der Homoskedastizitätsannahme auf die inferenzstatistischen Tests in der Regression?
Eine Verletzung dieser Annahme führt zu einer erhöhten α-Fehlerrate in den Hypothesentests > obwohl die Schätzungen der Regressionskoeffizienten selbst nicht verzerrt sind
92
Wie wird eine Verletzung der Homoskedastizitätsannahme in einem Scale-Location-Plot dargestellt?
In einem Scale-Location-Plot wird die Varianz der Residuen als Funktion der vorhergesagten Werte dargestellt > Bei einer Verletzung der Annahme nimmt die Varianz der Residuen mit steigenden vorhergesagten Werten zu
93
Was besagt die Annahme der Normalverteilung in Bezug auf die lineare Regression?
esagt, dass die Residuen (die Unterschiede zwischen den beobachteten und den vorhergesagten Werten) normalverteilt sind
94
Wie kann die Annahme der Normalverteilung mittels eines Q-Q-Diagramms überprüft werden?
- Im Q-Q-Diagramm werden die beobachteten Quantile der Residuen gegenüber den theoretischen Quantilen der Normalverteilung abgetragen > Wenn die Residuen normalverteilt sind, liegen die Punkte entlang einer Diagonalen
95
Was deutet darauf hin, dass die Residuen einer Regression nicht normalverteilt sind?
- werden deutlich, wenn die Punkte im Q-Q-Diagramm nicht entlang einer Diagonalen liegen, sondern davon abweichen > Dies ist besonders deutlich, da Abweichungen im Q-Q-Diagramm besser erkennbar sind als im Histogramm
96
Was ist der Bayes-Faktor und wie wird er im bayesianischen Hypothesentesten verwendet?
Der Bayes-Faktor vergleicht zwei statistische Modelle und quantifiziert, wie wahrscheinlich die Daten unter einem Modell im Vergleich zum anderen Modell sind > Ein höherer Bayes-Faktor deutet auf stärkere Evidenz für ein Modell hin
97
Was ist das Ziel der bayesianischen Regression und wie wird sie durchgeführt?
In der bayesianischen Regression werden verschiedene statistische Modelle verglichen, die bestimmte Prädiktoren enthalten oder nicht > Das Ziel ist es, die Evidenz in den Daten für ein Modell im Vergleich zu anderen Modellen zu bestimmen
98
Welche Rolle spielen die statistischen Modelle und die Prior-Verteilungen in der bayesianischen Regression?
- Die statistischen Modelle beschreiben die Beziehung zwischen den Prädiktoren und dem Kriterium - Die Prior-Verteilungen werden verwendet, um die Unsicherheit über die Modellparameter vor der Analyse zu beschreiben
99
Was ist die Korrelation und welche Informationen liefert sie über den Zusammenhang zweier Variablen?
- Die Korrelation ist die standardisierte Kovarianz zweier Variablen > gibt die Stärke und Richtung ihres Zusammenhangs an
100
Was ist das Ziel der einfachen linearen Regression und wie werden dabei der y-Achsenabschnitt und der Steigungskoeffizient geschätzt?
- Das Ziel ist es, eine Variable (das Kriterium) durch eine andere Variable (den Prädiktor) vorherzusagen - Der y-Achsenabschnitt und der Steigungskoeffizient werden durch das Kriterium der kleinsten Quadrate geschätzt
101
Was quantifiziert der Determinationskoeffizient in der einfachen linearen Regression?
Der Determinationskoeffizient quantifiziert den Anteil aufgeklärter Varianz des Kriteriums durch den Prädikator
102
Wie funktioniert die multiple Regression und welche Möglichkeiten bietet sie im Vergleich zur einfachen linearen Regression?
- In der multiplen Regression können mehrere Prädiktoren gleichzeitig verwendet werden - um das Kriterium vorherzusagen > Dies ermöglicht eine komplexere Analyse der Beziehung zwischen den Variablen
103
Was ist der hierarchische F-Test in Bezug auf die multiple Regression und welche Fragestellungen können damit beantwortet werden?
Der hierarchische F-Test überprüft, ob das gesamte Modell, einzelne Prädiktoren oder Sets von Prädiktoren einen signifikanten Anteil an Varianz des Kriteriums erklären können
104
Wie können die Annahmen der linearen Regression visuell überprüft werden?
Die Annahmen können durch visuelle Inspektion der Residuen überprüft werden > zum Beispiel durch Scatterplots der Residuen gegen die vorhergesagten Werte
105
Wie wird der Bayes-Faktor in der bayesianischen Regression verwendet, um statistische Modelle zu vergleichen?
- Der Bayes-Faktor vergleicht statistische Modelle - quantifiziert, wie wahrscheinlich die Daten unter einem Modell im Vergleich zum anderen Modell sind, was die Stärke der Evidenz für ein Modell gegenüber dem anderen anzeigt
106
Welche Fragen sind bei der Multiplen Regression interessant?
1. Test des Gesamtmodells, d. h., sind alle Prädiktoren zusammen in der Lage, einen signifikanten Anteil an Varianz des Kriteriums zu erklären? 2. Test eines spezifischen Prädiktors, d. h., kann ein spezifischer Prädiktor einen signifikanten zusätzlichen Anteil an Varianz des Kriteriums erklären? 3. Test eines Sets an Prädiktoren, d. h., kann ein Set an Prädiktoren einen signifikanten zusätzlichen Anteil an Varianz des Kriteriums erklären?
107
Intepretation der Kovarianz cov
108
Interpretation der Korrelation
109
Unterschied Korrelation und Kovarianz
- Die KORRELATION ist standardisiert (als Maß für einen Linearzusammenhang) - Die KOVARIANZ hängt dagegen von der Einheit der Messwerte ab
110
Was repräsentiert die Regressionsgerade bei der linearen Regression?
Repräsentiert die vorhergesagten Werte des Kriteriums
111
Wie kann die multiple lineare Regression als einfache lineare Regression dargestellt werden?
indem man zuerst die durch die Linearkombination der multiplen Prädiktoren vorhergesagten Werte bestimmt und mit diesen vorhergesagten Werten des Kriteriums dann wiederrum das Kriterium selbst vorhersagt
112
Was sind die drei Voraussetzungen der linearen Regression?
1. Linearität 2. Homoskedastizität 3. Normalverteilung der Residuen
113
Was ist Linearität?
- Die Beziehung zwischen den unabhängigen Variablen (Prädiktoren) und der abhängigen Variable (Kriterium) muss linear sein > bedeutet, dass die Änderung der abhängigen Variable durch eine lineare Funktion der unabhängigen Variablen erklärt werden kann
114
Was ist Homoskedastizität?
Die Varianz der Fehlerterme (Residuen) sollte für alle Werte der unabhängigen Variablen konstant sein > bedeutet, dass die Streuung der Residuen unabhängig vom Niveau der unabhängigen Variablen ist
115
Was heißt Normalverteilung der Residuen?
Die Fehlerterme (Residuen) sollten normalverteilt sein > besonders wenn es um Konfidenzintervalle und Hypothesentests geht
116
Zusammenhang bayesianische multiple Regression und bayesianische ANOVA
- Das identische Vorgehen bei der Hypothesentestung - beruht auf Modellvergleichen
117
Wie werden a und b in der linearen Regression genannt?
Regressionskoeffizienten
118
Die Korrelation zwischen vorhergesagten Werten und Kriteriumswerten entspricht …
… der Korrelation zwischen Prädiktor und Kriterium
119
Die Voraussetzung der Varianzhomogenität (Homoskedastizität) wird verletzt, wenn …
… die Varianzen der Stichproben signifikant unterschiedlich sind
120
Welcher Test sollte verwendet werden, wenn die Annahme der Varianzhomogenität nicht gegeben ist?
Welch-Test
121
Auf welcher Teststatistik basiert die bayesianische ANOVA?
Verwendet die Bayes-Faktoren zur Bewertung der Evidenz für oder gegen bestimmte Modelle
122
Erläutere wie bei der bayesianischen ANOVA mit dem Bayes-Faktor getestet werden kann, ob es einen Haupteffekt eines Faktors gibt oder nicht
In der bayesianischen ANOVA wird typischerweise das Nullmodell (kein Effekt) mit einem Modell, das den Haupteffekt eines Faktors enthält, verglichen
123
Wie interpretiert man BFm und BF10?
124
Wie berechnet man den Prädiktor B bei der linearen Regression mit gegebenen Daten?
125
Welches Maß wird für die Varianz bei der linearen Regression verwendet?
Residual Mean / Square (MS_residual) / Residualvarianz
126
Wie viele Modelle sind zu vergleichen bei einer bayesianischen Regression mit 3 Prädiktoren?
127
Was ist der Prädiktor und was das Kriterium bei der Aussage "Depression auf Intelligenz"?
Prädiktor: Intelligenz Kriterium: Depression > Erklärung: Der Prädiktor (Intelligenz) wird verwendet, um das Kriterium (Depression) vorherzusagen.
128
In einer Studie wird der Einfluss von Alkohol (in Promille X1) und Schlaf (in Stunden X2) auf die Reaktionszeit (in Ms y) in einer standardisierten Aufgabe untersucht. Die geschätzten Regressionskoeffizienten dieser multiplen Regression lauten a= 400 b1 = 200 b2 = 25 Bitte beschreiben Sie, wie die einzelnen Koeffizienten zu interpretieren sind.
Y= a+b*X Y = 400 + 200*x+25*x - A ist der Y-Achsenabschnitt (Intercept) - b1 und b2 sind die Steigungskoeffizienten (Slopes) > Bei 0 Promille und 0 Stunden Schlaf hat man eine Reaktionszeit von 400 ms Je mehr Alkohol man trinkt und je mehr Stunden man schläft, desto stärker erhöht sich die Reaktionszeit in ms > Allerdings hat de Promille eine deutlich höhere Auswirkung auf die Erhöhung der Reaktionszeit, als der Schlaf
129
Erklärung Mediansplit
Zerlegung einer kontinuierlichen Variable durch Trennung in die Gruppe der Messwerte, die über dem Median liegen, und die, die unter dem Median liegen
130
Formel Korrelation
Im Zähler ist die Kovarianz
131
Formel t-Test zur Korrelation
132
Regressionsgleichung
133
Wie berechne ich a in der Regressionsgleichung?
Ablesen von der AV (Kriterium), wo der Strich die Y-Achse durchkreuzt
134
Wie berechne ich b in der Regressionsgleichung?
y2 – y1 : x2 – x1
135
Formel Determinationskoeffizient