Verfahren zur Überprüfung von Zusammenhangshypothesen Flashcards

1
Q

Welche Arten von Forschungsfragen drehen sich oft um den Zusammenhang zwischen Variablen?

A

Forschungsfragen, die sich um den Zusammenhang zwischen kategorialen oder kontinuierlichen Variablen drehen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Welche Verfahren werden zur Testung von Unterschieden zwischen kategorialen Variablen verwendet?

A

t-Tests und die Varianzanalyse werden oft zur Testung von Unterschieden zwischen kategorialen Variablen verwendet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Warum werden t-Tests und die Varianzanalyse oft für kategoriale Variablen eingesetzt?

A

Diese Verfahren sind geeignet, um Unterschiede zwischen Gruppen zu untersuchen, die durch kategoriale Variablen definiert sind

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was passiert, wenn die beteiligten Variablen nicht kategorial, sondern kontinuierlich sind?

A

Wenn die Variablen kontinuierlich sind, könnten sie durch einen Mediansplit in Kategorien aufgeteilt werden, um Unterschiede zu untersuchen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was wäre eine Möglichkeit, kontinuierliche Variablen in Kategorien aufzuteilen, um Unterschiede zu untersuchen?

A
  • Eine Möglichkeit wäre ein Mediansplit
  • bei dem die Variablen in zwei Gruppen anhand des Medianwerts aufgeteilt werden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Welche Informationen gehen verloren, wenn kontinuierliche Variablen durch einen Mediansplit in Kategorien aufgeteilt werden?

A
  • Durch einen Mediansplit gehen Informationen über mögliche Unterschiede innerhalb der Gruppen verloren
  • da nur die Mittelwerte der definierten Gruppen verwendet werden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Welche Annahme treffen wir, wenn wir einen Zusammenhang zwischen zwei Variablen vermuten?

A

Wir nehmen an, dass die Variabilität in der einen Variable systematisch mit der Variabilität in der anderen zusammenhängt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist die Kovarianz und welche Information liefert sie?

A
  • Die Kovarianz misst, wie stark die Variablen gemeinsam variieren
  • liefert Informationen über die Richtung des Zusammenhangs
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Warum ist die Korrelation eines der wichtigsten Maße in der Statistik?

A
  • Die Korrelation ist ein standardisiertes Maß für den Zusammenhang zwischen Variablen
  • ermöglicht eine präzise Quantifizierung dieses Zusammenhangs
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wie können wir Hypothesen über Korrelationen testen?

A
  • Wir können Hypothesen über Korrelationen testen
  • indem wir statistische Tests wie den Pearson-Korrelationskoeffizienten verwenden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was ermöglicht uns der Zusammenhang von Variablen in Bezug auf Vorhersagen?

A

ermöglicht es uns, Vorhersagen über eine Variable basierend auf den Werten einer anderen Variable abzuleiten

> was in verschiedenen Anwendungen nützlich ist

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wie quantifizieren wir den Zusammenhang zwischen Variablen?

A

indem wir die Kovarianz und anschließend die Korrelation berechnen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was ist die Kovarianz und wie wird sie berechnet?

A
  • Die Kovarianz ist die Summe der multiplizierten Abweichungen zweier Variablen
  • dividiert durch die Anzahl der Freiheitsgrade
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wann spricht man von einem positiven linearen Zusammenhang?

A

Man spricht von einem positiven linearen Zusammenhang, wenn höhere Werte auf der einen Variable mit höheren Werten auf der anderen einhergehen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was bedeutet ein positiver Wert der Kovarianz?

A

zeigt an, dass die Variablen gleichsinnig zusammenhängen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wie bezeichnet man einen gleichsinnigen Zusammenhang und was zeigt eine negative Kovarianz an?

A
  • Einen gleichsinnigen Zusammenhang nennt man auch positiven Zusammenhang
  • Eine negative Kovarianz zeigt einen gegensinnigen Zusammenhang an
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Wann ist die Kovarianz 0 und was bedeutet das?

A
  • Die Kovarianz ist 0, wenn die Variablen unabhängig voneinander sind
  • Das bedeutet, dass kein linearer Zusammenhang zwischen den Variablen besteht
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Was ist die Einschränkung der Kovarianz in Bezug auf die Interpretation des Zusammenhangs?

A

Die Kovarianz hängt von der Einheit der Variablen ab

> was ihre Interpretation erschwert

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Wie können wir die Stärke des Zusammenhangs zwischen Variablen interpretieren?

A

Um die Stärke des Zusammenhangs zu interpretieren, standardisieren oder z-transformieren wir die Kovarianz, um die Korrelation zu erhalten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Wie standardisieren wir die Kovarianz?

A

Wir setzen die Kovarianz ins Verhältnis zum Produkt der Standardabweichungen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Was ist der Pearson-Korrelationskoeffizient und wie wird er berechnet?

A

Der Pearson-Korrelationskoeffizient ist ein Maß für den linearen Zusammenhang zwischen zwei Variablen

  • Er wird berechnet, indem die Kovarianz der beiden Variablen durch das Produkt ihrer Standardabweichungen geteilt wird
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Welche Eigenschaften hat der Pearson- Korrelationskoeffizient?

A
  • Der Pearson-Korrelationskoeffizient liegt immer zwischen -1 und 1
  • Bei einem perfekten positiven linearen Zusammenhang ist er 1
  • bei einem perfekten negativen linearen Zusammenhang -1
  • bei keinem linearen Zusammenhang 0
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Wie interpretieren wir den Pearson-Korrelationskoeffizienten?

A
  • Je näher der Pearson-Korrelationskoeffizient an 1 oder -1 liegt, desto stärker ist der lineare Zusammenhang zwischen den Variablen
  • Ein Wert von 0 zeigt an, dass kein linearer Zusammenhang besteht
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Nach Cohen
(1988) gelten folgende Konventionen für die Klassifizierung von rxy:

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Wofür dient die Korrelation zunächst?

A

Sie dient der Beschreibung des Zusammenhangs zwischen zwei Merkmalen in einer Stichprobe

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Was repräsentiert der Korrelationskoeffizient
𝑟𝑥𝑦 in Bezug auf die Population?

A

Er schätzt die Korrelation der Merkmale in der Population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Welche Bezeichnung hat die wahre Korrelation in der Population?

A

Die wahre Korrelation in der Population wird mit dem griechischen Buchstaben
𝜌 („rho“) bezeichnet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Welche Faktoren beeinflussen die Teststatistik für die Populationskorrelation?

A

Die Teststatistik hängt nur von der Größe der Korrelation und der Stichprobengröße ab

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Welche Möglichkeiten gibt es, Hypothesen über die Population anhand von
𝑟𝑥𝑦 zu testen?

A
  • Mit einem t-Test für die berechnete t-Statistik
  • durch Bestimmung des kritischen Werts der t-Verteilung basierend auf dem festgelegten α-Niveau
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Was ist Fishers Z-Transformation?

A
  • Eine Methode, um Hypothesen über die Population basierend auf der Korrelation zu testen
  • wenn sich die Schätzungen mit 𝑟𝑥𝑦 nicht normal verteilen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

Was ist die Korrelation und wofür dient sie?

A
  • Die Korrelation ist ein Maß für den linearen Zusammenhang zwischen zwei Merkmalen

> dient der Quantifizierung dieses Zusammenhangs

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

Was bedeutet es, wenn die Korrelation zwischen zwei Merkmalen 0 ist?

A

Wenn die Korrelation 0 ist, bedeutet dies, dass es keinen linearen Zusammenhang zwischen den beiden Merkmalen gibt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

Warum bedeutet eine Korrelation von 0 nicht unbedingt, dass die Merkmale unabhängig voneinander sind?

A
  • Eine Korrelation von 0 bedeutet nicht zwangsläufig, dass die Merkmale unabhängig voneinander sind

> da der Zusammenhang auch nichtlinear sein kann

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

Warum kann die Korrelation durch Ausreißer stark beeinflusst werden?

A

Ausreißer können die Korrelation stark verändern, da sie einen großen Einfluss auf das Maß haben können

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

Welche weiteren Zusammenhangsmaße können robuster gegenüber Ausreißern sein?

A

Spearmans Rangkorrelation ist ein Beispiel für ein Zusammenhangsmaß, das robuster gegenüber Ausreißern ist

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q

Auf welchen Annahmen beruhen inferenzstatistische Verfahren zur Korrelation?

A
  • Inferenzstatistische Verfahren zur Korrelation beruhen auf der Annahme, dass die beiden Variablen bivariat normalverteilt sind
  • mit einer wahren Korrelation 𝜌
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
37
Q

Was kann bei groben Verletzungen dieser Annahmen passieren?

A

Bei groben Verletzungen dieser Annahmen können die Fehlerraten der statistischen Tests größer sein als angenommen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
38
Q

Was ist das Ziel der linearen Regression?

A

Das Ziel der linearen Regression ist es, eine Variable aufgrund einer anderen Variable vorherzusagen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
39
Q

Was bedeutet es, eine Variable aufgrund einer anderen Variable vorherzusagen?

A
  • Es bedeutet, den Zusammenhang zwischen den Variablen zu nutzen
  • um Werte einer Variable basierend auf den Werten einer anderen Variable vorherzusagen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
40
Q

Was ist der Unterschied zwischen Korrelation und Vorhersage?

A
  • Die Korrelation quantifiziert den Zusammenhang zwischen Variablen
  • während die Vorhersage den Versuch unternimmt, eine Variable basierend auf einer anderen Variable zu prognostizieren
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
41
Q

Was versteht man unter einer linearen Regression?

A

Bei der linearen Regression wird versucht, den linearen Zusammenhang zwischen zwei oder mehr Variablen zu modellieren, um eine Vorhersage zu treffen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
42
Q

Wann spricht man von einer multiplen linearen Regression?

A

Man spricht von einer multiplen linearen Regression, wenn mehrere Prädiktoren verwendet werden, um eine Variable vorherzusagen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
43
Q

Was ist ein deterministischer Zusammenhang?

A

Ein deterministischer Zusammenhang besteht:

  • wenn der Zusammenhang zwischen den Variablen perfekt ist
  • jede Variable exakt vorhergesagt werden kann
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
44
Q

Warum ist eine perfekte Vorhersage in der Psychologie oft nicht möglich?

A

da komplexe menschliche Verhaltensweisen und Variabilität die Vorhersage erschweren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
45
Q

Was ist ein stochastischer Zusammenhang?

A

Ein stochastischer Zusammenhang besteht, wenn die Vorhersage von Variablen aufgrund anderer Variablen nicht exakt ist, sondern Wahrscheinlichkeiten beinhaltet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
46
Q

Wie wird die Güte einer Vorhersage gemessen?

A
  • Die Güte einer Vorhersage wird gemessen, indem man die Abweichungen zwischen den vorhergesagten Werten und den tatsächlichen Werten betrachtet

> Je geringer die Abweichungen, desto besser ist die Vorhersage

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
47
Q

Die einfache lineare Regression ist eine Methode, um den Wert …

A

… einer kontinuierlichen Kriteriumsvariable
durch eine Prädiktorvariable vorherzusagen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
48
Q

Was sind die beiden Parameter, die die Regressionsgerade definieren?

A

Die beiden Parameter sind a und b

> auch bekannt als Regressionsgewichte oder -koeffizienten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
49
Q

Wie wird der Parameter a auch genannt und was repräsentiert er?

A

Der Parameter a wird auch als y-Achsenabschnitt oder Intercept bezeichnet

> Er repräsentiert den Wert von Y, wenn X = 0 ist

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
50
Q

Wie wird der Parameter b auch genannt und was repräsentiert er?

A

Der Parameter b wird Steigung genannt

> Er repräsentiert die Veränderung in unserer Vorhersage für Y, wenn sich der Prädiktor X um eine Einheit verändert

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
51
Q

Was beschreibt der Parameter a in Bezug auf die Regressionsgerade?

A

Der Parameter a beschreibt den y-Achsenabschnitt

> also den Wert von Y, wenn X = 0 ist

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
52
Q

Was repräsentiert der Parameter b in Bezug auf die Regressionsgerade?

A
  • Der Parameter b repräsentiert die Steigung der Regressionsgerade
  • also die Veränderung in unserer Vorhersage für Y, wenn sich der Prädiktor X um eine Einheit verändert
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
53
Q

Wie werden die Parameter a und b ausgewählt, um die Vorhersage zu optimieren?

A

Die Parameter a und b werden so ausgewählt, dass die Summe der quadrierten Abweichungen von der resultierenden Geraden minimal wird

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
54
Q

Was bedeutet die “Methode der kleinsten Quadrate”?

A

Die “Methode der kleinsten Quadrate” bezieht sich auf die Auswahl der Regressionskoeffizienten, um die quadrierten Abweichungen von der Regressionsgerade zu minimieren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
55
Q

Müssen alle möglichen Kombinationen von a und b ausprobiert werden, um die optimalen Regressionskoeffizienten zu finden?

A

Nein, es gibt Formeln zur Berechnung der optimalen Regressionskoeffizienten, sodass nicht alle möglichen Kombinationen ausprobiert werden müssen

56
Q

Wie hängen Korrelation und Regression zusammen?

A

Korrelation und Regression sind eng miteinander verbunden

> da sie beide den Zusammenhang zwischen Variablen beschreiben

57
Q

Was beschreibt die Korrelation?

A

Die Korrelation beschreibt den linearen Zusammenhang zwischen zwei Variablen

58
Q

Wofür wird die Regression verwendet?

A

Die Regression wird verwendet, um das Kriterium mithilfe des Prädiktors vorherzusagen

> basierend auf dem linearen Zusammenhang zwischen den Variablen

59
Q

Was ist ein entscheidender Unterschied zwischen Korrelation und Regression?

A

Ein entscheidender Unterschied besteht darin, dass die Einheiten der Messwerte bei der Regression eine Rolle spielen

> während die Korrelation standardisiert ist und unabhängig von den Einheiten ist

60
Q

Was spielt bei der Regression eine Rolle, was bei der Korrelation nicht berücksichtigt wird?

A

Bei der Regression spielen die Einheiten der Messwerte eine Rolle

> während die Korrelation unabhängig von den Einheiten ist

61
Q

Was bedeutet es, die Varianz aufzuklären?

A

dass wir versuchen, Unterschiede im Kriterium basierend auf Unterschieden im Prädiktor vorherzusagen

62
Q

Wie wird der Determinationskoeffizient definiert und wie wird er berechnet?

A

Der Determinationskoeffizient wird definiert als das Quadrat der Korrelation zwischen dem Prädiktor und dem Kriterium

Er wird berechnet, indem man das Quadrat des Korrelationskoeffizienten r xy nimmt: Rhoch2 =rhoch2xy

63
Q

Welche Werte kann der Determinationskoeffizient annehmen und was bedeuten sie?

A

Der Determinationskoeffizient kann Werte zwischen 0 und 1 annehmen

  • Ein Wert von 0 bedeutet, dass der Prädiktor keinen linearen Zusammenhang mit dem Kriterium hat und keine Vorhersagequalität besitzt
  • Ein Wert von 1 bedeutet, dass der Prädiktor und das Kriterium perfekt linear zusammenhängen
64
Q

Was ist der Standardschätzfehler und welche Information liefert er?

A
  • beschreibt eine Art mittleres Residuum und gibt an, wie stark die Kriteriumswerte im Allgemeinen von den vorhergesagten Werten abweichen

> Er liefert Informationen über die Genauigkeit der Vorhersage

65
Q

Warum wird der korrigierte Determinationskoeffizient berechnet und wie wird er berechnet?

A

Der korrigierte Determinationskoeffizient wird berechnet, um eine bessere Schätzung des Anteils der Kriteriumsvarianz in der Population zu erhalten.

> Er wird berechnet, indem der ursprüngliche Determinationskoeffizient anhand der Stichprobengröße und der Anzahl der Prädiktoren korrigiert wird

66
Q

Der Determinationskoeffizient ist das Verhältnis …

A

… cer Quadratsumme der vorhergesagten
Werte zur Quadratsumme der Kriteriumswerte

67
Q

Was ist der Unterschied zwischen einfacher und multipler linearer Regression?

A
  • Bei der einfachen linearen Regression wird eine Variable durch eine andere Variable vorhergesagt
  • während bei der multiplen linearen Regression eine Variable durch mehrere Variablen vorhergesagt wird
68
Q

Warum wird die multiple lineare Regression verwendet?

A
  • Die multiple lineare Regression wird verwendet, um die Vorhersagegenauigkeit zu erhöhen
  • um den individuellen Einfluss verschiedener Prädiktoren auf ein Kriterium zu untersuchen, während andere Prädiktoren kontrolliert werden
69
Q

Wie können mehrere Prädiktoren gleichzeitig zur Vorhersage eines Kriteriums genutzt werden?

A

Mehrere Prädiktoren werden gleichzeitig in die Regressionsgleichung eingeführt, wodurch die Vorhersage des Kriteriums basierend auf den Werten der Prädiktoren erfolgt

70
Q

Welchen Vorteil bietet die Verwendung mehrerer Prädiktoren in der Regression?

A

Die Verwendung mehrerer Prädiktoren ermöglicht eine genauere Vorhersage des Kriteriums und die Untersuchung individueller Prädiktoreneffekte unter Kontrolle anderer Prädiktoren

71
Q

Was bedeutet es, den Einfluss einzelner Prädiktoren zu testen, während andere Prädiktoren kontrolliert werden?

A

Dies bedeutet, dass der spezifische Einfluss jedes Prädiktors auf das Kriterium getestet wird

> während die Effekte anderer Prädiktoren in der Analyse berücksichtigt werden, um sicherzustellen, dass sie nicht fälschlicherweise einem anderen Prädiktor zugeschrieben werden

72
Q

Was ist eine Regressionsgleichung?

A

eine mathematische Darstellung
des Regressionsmodells

73
Q

Was geben die Steigungskoeffizienten b1 und b2 in der multiplen linearen Regression an?

A

Die Steigungskoeffizienten b1 und b2 geben an, wie sich das Kriterium Y ändert

> wenn sich der entsprechende Prädiktor um eine Einheit erhöht und der andere Prädiktor konstant bleibt

74
Q

Wie wird der Effekt eines Prädiktors auf das Kriterium berechnet?

A

indem die Veränderung des Kriteriums mit der Veränderung des entsprechenden Prädiktors multipliziert wird

75
Q

Warum ist der Zusatz “der andere Prädiktor bleibt konstant” wichtig bei der Interpretation der Steigungskoeffizienten?

A

um den alleinigen Effekt eines Prädiktors auf das Kriterium zu isolieren

> unbeeinflusst vom anderen Prädiktor

76
Q

Warum werden die Steigungskoeffizienten als “partielle” Regressionskoeffizienten bezeichnet?

A
  • weil sie den Effekt eines Prädiktors auf das Kriterium widerspiegeln
  • bereinigt um den Einfluss des anderen Prädiktors
77
Q

Was bedeutet es, wenn ein Steigungskoeffizient “partiell” ist?

A

zeigt den spezifischen Effekt eines Prädiktors auf das Kriterium an

> nachdem der Einfluss anderer Prädiktoren herausgerechnet wurde

78
Q

Es ist möglich, die Stärke des Effekts jedes Prädiktors auf das
Kriterium zu vergleichen, indem …

A

… man die Steigungskoeffizienten standardisiert

79
Q

Was ist die Statistische Kontrolle?

A

der Vorgang, bei dem eine
Variable von dem Einfluss
von einer oder mehreren
Störvariablen bereinigt
wird

80
Q

Was dient in der multiplen Regression als Maß der Vorhersagegüte?

A

Der Determinationskoeffizient R² dient als Maß der Vorhersagegüte

81
Q

Wie wird der Determinationskoeffizient R² in der multiplen Regression berechnet?

A

Der Determinationskoeffizient R² wird berechnet, indem die quadrierte multiple Korrelation verwendet wird, also R² = r²yy

82
Q

Was gibt der Determinationskoeffizient in der multiplen Regression an?

A

Der Determinationskoeffizient gibt den Anteil der aufgeklärten Varianz des Kriteriums durch die Prädiktoren wieder

83
Q

Wie kann der Determinationskoeffizient R² über die multiple Korrelation berechnet werden?

A

Der Determinationskoeffizient R² kann über die multiple Korrelation berechnet werden, indem die quadrierte multiple Korrelation verwendet wird, also R² = r²yy

84
Q

Welche Fragestellungen interessieren Forscher in der multiplen linearen Regression?

A
  • ob mindestens einer der k Prädiktoren Varianz des Kriteriums erklären kann, ob ein bestimmter Prädiktor Varianz des Kriteriums erklären kann
  • ob ein Set an Prädiktoren mehr Varianz des Kriteriums aufklären kann als ein anderes Set an Prädiktoren
85
Q

Was testet der hierarchische F-Test in Bezug auf die Prädiktoren?

A

Der hierarchische F-Test testet, ob ein zusätzliches Prädiktorenset B, ergänzt zu einem bestehenden Set A, signifikant Varianz des Kriteriums erklären kann

86
Q

Wie werden die Freiheitsgrade in der Teststatistik des hierarchischen F-Tests berechnet?

A

Die Freiheitsgrade in der Teststatistik des hierarchischen F-Tests werden wie folgt berechnet:

df1 = kb und df2 = n - kA - kb - 1

  • wobei kb die Anzahl der Prädiktoren im Set B
  • kA die Anzahl der Prädiktoren im Set A
  • n die Gesamtanzahl der Beobachtungen ist
87
Q

Was ist eine zentrale Annahme der linearen (multiplen) Regression?

A

Eine zentrale Annahme ist, dass der wahre Zusammenhang zwischen dem Kriterium und den Prädiktoren linear ist

88
Q

Warum ist es wichtig, nichtlineare Zusammenhänge in der Regression zu erkennen und zu berücksichtigen?

A

Es ist wichtig, nichtlineare Zusammenhänge zu erkennen, da lineare Modelle diese nicht angemessen erfassen können

> was zu ungenauen Vorhersagen führen kann

89
Q

Wie kann man in der Regression nichtlineare Zusammenhänge integrieren?

A
  • Nichtlineare Zusammenhänge können durch die Verwendung von nichtlinearen Regressionsmodellen wie der quadratischen Regression integriert werden

> um die Beziehung zwischen den Variablen genauer abzubilden

90
Q

Was besagt die Homoskedastizitätsannahme in Bezug auf die lineare Regression?

A

besagt, dass die Varianz der Kriteriumswerte über alle Prädiktorenwertekombinationen hinweg konstant ist

91
Q

Welche Auswirkungen hat eine Verletzung der Homoskedastizitätsannahme auf die inferenzstatistischen Tests in der Regression?

A

Eine Verletzung dieser Annahme führt zu einer erhöhten α-Fehlerrate in den Hypothesentests

> obwohl die Schätzungen der Regressionskoeffizienten selbst nicht verzerrt sind

92
Q

Wie wird eine Verletzung der Homoskedastizitätsannahme in einem Scale-Location-Plot dargestellt?

A

In einem Scale-Location-Plot wird die Varianz der Residuen als Funktion der vorhergesagten Werte dargestellt

> Bei einer Verletzung der Annahme nimmt die Varianz der Residuen mit steigenden vorhergesagten Werten zu

93
Q

Was besagt die Annahme der Normalverteilung in Bezug auf die lineare Regression?

A

esagt, dass die Residuen (die Unterschiede zwischen den beobachteten und den vorhergesagten Werten) normalverteilt sind

94
Q

Wie kann die Annahme der Normalverteilung mittels eines Q-Q-Diagramms überprüft werden?

A
  • Im Q-Q-Diagramm werden die beobachteten Quantile der Residuen gegenüber den theoretischen Quantilen der Normalverteilung abgetragen

> Wenn die Residuen normalverteilt sind, liegen die Punkte entlang einer Diagonalen

95
Q

Was deutet darauf hin, dass die Residuen einer Regression nicht normalverteilt sind?

A
  • werden deutlich, wenn die Punkte im Q-Q-Diagramm nicht entlang einer Diagonalen liegen, sondern davon abweichen

> Dies ist besonders deutlich, da Abweichungen im Q-Q-Diagramm besser erkennbar sind als im Histogramm

96
Q

Was ist der Bayes-Faktor und wie wird er im bayesianischen Hypothesentesten verwendet?

A

Der Bayes-Faktor vergleicht zwei statistische Modelle und quantifiziert, wie wahrscheinlich die Daten unter einem Modell im Vergleich zum anderen Modell sind

> Ein höherer Bayes-Faktor deutet auf stärkere Evidenz für ein Modell hin

97
Q

Was ist das Ziel der bayesianischen Regression und wie wird sie durchgeführt?

A

In der bayesianischen Regression werden verschiedene statistische Modelle verglichen, die bestimmte Prädiktoren enthalten oder nicht

> Das Ziel ist es, die Evidenz in den Daten für ein Modell im Vergleich zu anderen Modellen zu bestimmen

98
Q

Welche Rolle spielen die statistischen Modelle und die Prior-Verteilungen in der bayesianischen Regression?

A
  • Die statistischen Modelle beschreiben die Beziehung zwischen den Prädiktoren und dem Kriterium
  • Die Prior-Verteilungen werden verwendet, um die Unsicherheit über die Modellparameter vor der Analyse zu beschreiben
99
Q

Was ist die Korrelation und welche Informationen liefert sie über den Zusammenhang zweier Variablen?

A
  • Die Korrelation ist die standardisierte Kovarianz zweier Variablen

> gibt die Stärke und Richtung ihres Zusammenhangs an

100
Q

Was ist das Ziel der einfachen linearen Regression und wie werden dabei der y-Achsenabschnitt und der Steigungskoeffizient geschätzt?

A
  • Das Ziel ist es, eine Variable (das Kriterium) durch eine andere Variable (den Prädiktor) vorherzusagen
  • Der y-Achsenabschnitt und der Steigungskoeffizient werden durch das Kriterium der kleinsten Quadrate geschätzt
101
Q

Was quantifiziert der Determinationskoeffizient in der einfachen linearen Regression?

A

Der Determinationskoeffizient quantifiziert den Anteil aufgeklärter Varianz des Kriteriums durch den Prädikator

102
Q

Wie funktioniert die multiple Regression und welche Möglichkeiten bietet sie im Vergleich zur einfachen linearen Regression?

A
  • In der multiplen Regression können mehrere Prädiktoren gleichzeitig verwendet werden
  • um das Kriterium vorherzusagen

> Dies ermöglicht eine komplexere Analyse der Beziehung zwischen den Variablen

103
Q

Was ist der hierarchische F-Test in Bezug auf die multiple Regression und welche Fragestellungen können damit beantwortet werden?

A

Der hierarchische F-Test überprüft, ob das gesamte Modell, einzelne Prädiktoren oder Sets von Prädiktoren einen signifikanten Anteil an Varianz des Kriteriums erklären können

104
Q

Wie können die Annahmen der linearen Regression visuell überprüft werden?

A

Die Annahmen können durch visuelle Inspektion der Residuen überprüft werden

> zum Beispiel durch Scatterplots der Residuen gegen die vorhergesagten Werte

105
Q

Wie wird der Bayes-Faktor in der bayesianischen Regression verwendet, um statistische Modelle zu vergleichen?

A
  • Der Bayes-Faktor vergleicht statistische Modelle
  • quantifiziert, wie wahrscheinlich die Daten unter einem Modell im Vergleich zum anderen Modell sind, was die Stärke der Evidenz für ein Modell gegenüber dem anderen anzeigt
106
Q

Welche Fragen sind bei der Multiplen Regression interessant?

A
  1. Test des Gesamtmodells, d. h., sind alle Prädiktoren zusammen in der Lage, einen signifikanten Anteil an Varianz des Kriteriums zu erklären?
  2. Test eines spezifischen Prädiktors, d. h., kann ein spezifischer Prädiktor einen signifikanten zusätzlichen Anteil an Varianz des Kriteriums erklären?
  3. Test eines Sets an Prädiktoren, d. h., kann ein Set an Prädiktoren einen signifikanten zusätzlichen Anteil an Varianz des Kriteriums erklären?
107
Q

Intepretation der Kovarianz cov

A
108
Q

Interpretation der Korrelation

A
109
Q

Unterschied Korrelation und Kovarianz

A
  • Die KORRELATION ist standardisiert (als Maß für einen Linearzusammenhang)
  • Die KOVARIANZ hängt dagegen von der Einheit der Messwerte ab
110
Q

Was repräsentiert die Regressionsgerade bei der linearen Regression?

A

Repräsentiert die vorhergesagten Werte des Kriteriums

111
Q

Wie kann die multiple lineare Regression als einfache lineare Regression dargestellt werden?

A

indem man zuerst die durch die Linearkombination der multiplen Prädiktoren vorhergesagten Werte bestimmt und mit diesen vorhergesagten Werten des Kriteriums dann wiederrum das Kriterium selbst vorhersagt

112
Q

Was sind die drei Voraussetzungen der linearen Regression?

A
  1. Linearität
  2. Homoskedastizität
  3. Normalverteilung der Residuen
113
Q

Was ist Linearität?

A
  • Die Beziehung zwischen den unabhängigen Variablen (Prädiktoren) und der abhängigen Variable (Kriterium) muss linear sein

> bedeutet, dass die Änderung der abhängigen Variable durch eine lineare Funktion der unabhängigen Variablen erklärt werden kann

114
Q

Was ist Homoskedastizität?

A

Die Varianz der Fehlerterme (Residuen) sollte für alle Werte der unabhängigen Variablen konstant sein

> bedeutet, dass die Streuung der Residuen unabhängig vom Niveau der unabhängigen Variablen ist

115
Q

Was heißt Normalverteilung der Residuen?

A

Die Fehlerterme (Residuen) sollten normalverteilt sein

> besonders wenn es um Konfidenzintervalle und Hypothesentests geht

116
Q

Zusammenhang bayesianische multiple Regression und bayesianische ANOVA

A
  • Das identische Vorgehen bei der Hypothesentestung
  • beruht auf Modellvergleichen
117
Q

Wie werden a und b in der linearen Regression genannt?

A

Regressionskoeffizienten

118
Q

Die Korrelation zwischen vorhergesagten Werten und Kriteriumswerten entspricht …

A

… der Korrelation zwischen Prädiktor und Kriterium

119
Q

Die Voraussetzung der Varianzhomogenität (Homoskedastizität) wird verletzt, wenn …

A

… die Varianzen der Stichproben signifikant unterschiedlich sind

120
Q

Welcher Test sollte verwendet werden, wenn die Annahme der Varianzhomogenität nicht gegeben ist?

A

Welch-Test

121
Q

Auf welcher Teststatistik basiert die bayesianische ANOVA?

A

Verwendet die Bayes-Faktoren zur Bewertung der Evidenz für oder gegen bestimmte Modelle

122
Q

Erläutere wie bei der bayesianischen ANOVA mit dem Bayes-Faktor getestet werden kann, ob es einen Haupteffekt eines Faktors gibt oder nicht

A

In der bayesianischen ANOVA wird typischerweise das Nullmodell (kein Effekt) mit einem Modell, das den Haupteffekt eines Faktors enthält, verglichen

123
Q

Wie interpretiert man BFm und BF10?

A
124
Q

Wie berechnet man den Prädiktor B bei der linearen Regression mit gegebenen Daten?

A
125
Q

Welches Maß wird für die Varianz bei der linearen Regression verwendet?

A

Residual Mean / Square (MS_residual) / Residualvarianz

126
Q

Wie viele Modelle sind zu vergleichen bei einer bayesianischen Regression mit 3 Prädiktoren?

A
127
Q

Was ist der Prädiktor und was das Kriterium bei der Aussage “Depression auf Intelligenz”?

A

Prädiktor: Intelligenz
Kriterium: Depression

> Erklärung: Der Prädiktor (Intelligenz) wird verwendet, um das Kriterium (Depression) vorherzusagen.

128
Q

In einer Studie wird der Einfluss von Alkohol (in Promille X1) und Schlaf (in Stunden X2) auf
die Reaktionszeit (in Ms y) in einer standardisierten Aufgabe untersucht.
Die geschätzten Regressionskoeffizienten dieser multiplen Regression lauten

a= 400
b1 = 200
b2 = 25

Bitte beschreiben Sie, wie die einzelnen Koeffizienten zu interpretieren sind.

A

Y= a+bX
Y = 400 + 200
x+25*x

  • A ist der Y-Achsenabschnitt (Intercept)
  • b1 und b2 sind die Steigungskoeffizienten (Slopes)

> Bei 0 Promille und 0 Stunden Schlaf hat man eine Reaktionszeit von 400 ms

Je mehr Alkohol man trinkt und je mehr Stunden man schläft, desto stärker erhöht sich die Reaktionszeit in ms

> Allerdings hat de Promille eine deutlich höhere Auswirkung auf die Erhöhung der
Reaktionszeit, als der Schlaf

129
Q

Erklärung Mediansplit

A

Zerlegung einer kontinuierlichen Variable durch Trennung in die Gruppe der Messwerte, die über dem Median liegen, und die, die unter dem Median liegen

130
Q

Formel Korrelation

A

Im Zähler ist die Kovarianz

131
Q

Formel t-Test zur Korrelation

A
132
Q

Regressionsgleichung

A
133
Q

Wie berechne ich a in der Regressionsgleichung?

A

Ablesen von der AV (Kriterium), wo der Strich die Y-Achse durchkreuzt

134
Q

Wie berechne ich b in der Regressionsgleichung?

A

y2 – y1 : x2 – x1

135
Q

Formel Determinationskoeffizient

A