Verfahren zur Überprüfung von Zusammenhangshypothesen Flashcards

Question

Wofür dient die Korrelation zunächst?

Answer 1

Sie dient der Beschreibung des Zusammenhangs zwischen zwei Merkmalen in einer Stichprobe

Answer 2

Er schätzt die Korrelation der Merkmale in der Population

Answer 3

Die wahre Korrelation in der Population wird mit dem griechischen Buchstaben 𝜌 („rho“) bezeichnet

Answer 4

Die Teststatistik hängt nur von der Größe der Korrelation und der Stichprobengröße ab

Answer 5

- Mit einem t-Test für die berechnete t-Statistik - durch Bestimmung des kritischen Werts der t-Verteilung basierend auf dem festgelegten α-Niveau

Answer 6

- Eine Methode, um Hypothesen über die Population basierend auf der Korrelation zu testen - wenn sich die Schätzungen mit 𝑟𝑥𝑦 nicht normal verteilen

Answer 7

- Die Korrelation ist ein Maß für den linearen Zusammenhang zwischen zwei Merkmalen > dient der Quantifizierung dieses Zusammenhangs

Answer 8

Wenn die Korrelation 0 ist, bedeutet dies, dass es keinen linearen Zusammenhang zwischen den beiden Merkmalen gibt

Answer 9

- Eine Korrelation von 0 bedeutet nicht zwangsläufig, dass die Merkmale unabhängig voneinander sind > da der Zusammenhang auch nichtlinear sein kann

Answer 10

Ausreißer können die Korrelation stark verändern, da sie einen großen Einfluss auf das Maß haben können

Answer 11

Spearmans Rangkorrelation ist ein Beispiel für ein Zusammenhangsmaß, das robuster gegenüber Ausreißern ist

Answer 12

- Inferenzstatistische Verfahren zur Korrelation beruhen auf der Annahme, dass die beiden Variablen bivariat normalverteilt sind - mit einer wahren Korrelation 𝜌

Answer 13

Bei groben Verletzungen dieser Annahmen können die Fehlerraten der statistischen Tests größer sein als angenommen

Answer 14

Das Ziel der linearen Regression ist es, eine Variable aufgrund einer anderen Variable vorherzusagen

Answer 15

- Es bedeutet, den Zusammenhang zwischen den Variablen zu nutzen - um Werte einer Variable basierend auf den Werten einer anderen Variable vorherzusagen

Answer 16

- Die Korrelation quantifiziert den Zusammenhang zwischen Variablen - während die Vorhersage den Versuch unternimmt, eine Variable basierend auf einer anderen Variable zu prognostizieren

Answer 17

Bei der linearen Regression wird versucht, den linearen Zusammenhang zwischen zwei oder mehr Variablen zu modellieren, um eine Vorhersage zu treffen

Answer 18

Man spricht von einer multiplen linearen Regression, wenn mehrere Prädiktoren verwendet werden, um eine Variable vorherzusagen

Answer 19

Ein deterministischer Zusammenhang besteht: - wenn der Zusammenhang zwischen den Variablen perfekt ist - jede Variable exakt vorhergesagt werden kann

Answer 20

da komplexe menschliche Verhaltensweisen und Variabilität die Vorhersage erschweren

Answer 21

Ein stochastischer Zusammenhang besteht, wenn die Vorhersage von Variablen aufgrund anderer Variablen nicht exakt ist, sondern Wahrscheinlichkeiten beinhaltet

Answer 22

- Die Güte einer Vorhersage wird gemessen, indem man die Abweichungen zwischen den vorhergesagten Werten und den tatsächlichen Werten betrachtet > Je geringer die Abweichungen, desto besser ist die Vorhersage

Answer 23

… einer kontinuierlichen Kriteriumsvariable durch eine Prädiktorvariable vorherzusagen

Answer 24

Die beiden Parameter sind a und b > auch bekannt als Regressionsgewichte oder -koeffizienten

Answer 25

Der Parameter a wird auch als y-Achsenabschnitt oder Intercept bezeichnet > Er repräsentiert den Wert von Y, wenn X = 0 ist

Answer 26

Der Parameter b wird Steigung genannt > Er repräsentiert die Veränderung in unserer Vorhersage für Y, wenn sich der Prädiktor X um eine Einheit verändert

Answer 27

Der Parameter a beschreibt den y-Achsenabschnitt > also den Wert von Y, wenn X = 0 ist

Answer 28

- Der Parameter b repräsentiert die Steigung der Regressionsgerade - also die Veränderung in unserer Vorhersage für Y, wenn sich der Prädiktor X um eine Einheit verändert

Answer 29

Die Parameter a und b werden so ausgewählt, dass die Summe der quadrierten Abweichungen von der resultierenden Geraden minimal wird

Answer 30

Die "Methode der kleinsten Quadrate" bezieht sich auf die Auswahl der Regressionskoeffizienten, um die quadrierten Abweichungen von der Regressionsgerade zu minimieren

Answer 31

Nein, es gibt Formeln zur Berechnung der optimalen Regressionskoeffizienten, sodass nicht alle möglichen Kombinationen ausprobiert werden müssen

Answer 32

Korrelation und Regression sind eng miteinander verbunden > da sie beide den Zusammenhang zwischen Variablen beschreiben

Answer 33

Die Korrelation beschreibt den linearen Zusammenhang zwischen zwei Variablen

Answer 34

Die Regression wird verwendet, um das Kriterium mithilfe des Prädiktors vorherzusagen > basierend auf dem linearen Zusammenhang zwischen den Variablen

Answer 35

Ein entscheidender Unterschied besteht darin, dass die Einheiten der Messwerte bei der Regression eine Rolle spielen > während die Korrelation standardisiert ist und unabhängig von den Einheiten ist

Answer 36

Bei der Regression spielen die Einheiten der Messwerte eine Rolle > während die Korrelation unabhängig von den Einheiten ist

Answer 37

dass wir versuchen, Unterschiede im Kriterium basierend auf Unterschieden im Prädiktor vorherzusagen

Answer 38

Der Determinationskoeffizient wird definiert als das Quadrat der Korrelation zwischen dem Prädiktor und dem Kriterium Er wird berechnet, indem man das Quadrat des Korrelationskoeffizienten r xy nimmt: Rhoch2 =rhoch2xy

Answer 39

Der Determinationskoeffizient kann Werte zwischen 0 und 1 annehmen - Ein Wert von 0 bedeutet, dass der Prädiktor keinen linearen Zusammenhang mit dem Kriterium hat und keine Vorhersagequalität besitzt - Ein Wert von 1 bedeutet, dass der Prädiktor und das Kriterium perfekt linear zusammenhängen

Answer 40

- beschreibt eine Art mittleres Residuum und gibt an, wie stark die Kriteriumswerte im Allgemeinen von den vorhergesagten Werten abweichen > Er liefert Informationen über die Genauigkeit der Vorhersage

Answer 41

Der korrigierte Determinationskoeffizient wird berechnet, um eine bessere Schätzung des Anteils der Kriteriumsvarianz in der Population zu erhalten. > Er wird berechnet, indem der ursprüngliche Determinationskoeffizient anhand der Stichprobengröße und der Anzahl der Prädiktoren korrigiert wird

Answer 42

… cer Quadratsumme der vorhergesagten Werte zur Quadratsumme der Kriteriumswerte

Answer 43

- Bei der einfachen linearen Regression wird eine Variable durch eine andere Variable vorhergesagt - während bei der multiplen linearen Regression eine Variable durch mehrere Variablen vorhergesagt wird

Answer 44

- Die multiple lineare Regression wird verwendet, um die Vorhersagegenauigkeit zu erhöhen - um den individuellen Einfluss verschiedener Prädiktoren auf ein Kriterium zu untersuchen, während andere Prädiktoren kontrolliert werden

Answer 45

Mehrere Prädiktoren werden gleichzeitig in die Regressionsgleichung eingeführt, wodurch die Vorhersage des Kriteriums basierend auf den Werten der Prädiktoren erfolgt

Answer 46

Die Verwendung mehrerer Prädiktoren ermöglicht eine genauere Vorhersage des Kriteriums und die Untersuchung individueller Prädiktoreneffekte unter Kontrolle anderer Prädiktoren

Answer 47

Dies bedeutet, dass der spezifische Einfluss jedes Prädiktors auf das Kriterium getestet wird > während die Effekte anderer Prädiktoren in der Analyse berücksichtigt werden, um sicherzustellen, dass sie nicht fälschlicherweise einem anderen Prädiktor zugeschrieben werden

Answer 48

eine mathematische Darstellung des Regressionsmodells

Answer 49

Die Steigungskoeffizienten b1 und b2 geben an, wie sich das Kriterium Y ändert > wenn sich der entsprechende Prädiktor um eine Einheit erhöht und der andere Prädiktor konstant bleibt

Answer 50

indem die Veränderung des Kriteriums mit der Veränderung des entsprechenden Prädiktors multipliziert wird

Answer 51

um den alleinigen Effekt eines Prädiktors auf das Kriterium zu isolieren > unbeeinflusst vom anderen Prädiktor

Answer 52

- weil sie den Effekt eines Prädiktors auf das Kriterium widerspiegeln - bereinigt um den Einfluss des anderen Prädiktors

Answer 53

zeigt den spezifischen Effekt eines Prädiktors auf das Kriterium an > nachdem der Einfluss anderer Prädiktoren herausgerechnet wurde

Answer 54

… man die Steigungskoeffizienten standardisiert

Answer 55

der Vorgang, bei dem eine Variable von dem Einfluss von einer oder mehreren Störvariablen bereinigt wird

Answer 56

Der Determinationskoeffizient R² dient als Maß der Vorhersagegüte

Answer 57

Der Determinationskoeffizient R² wird berechnet, indem die quadrierte multiple Korrelation verwendet wird, also R² = r²yy

Answer 58

Der Determinationskoeffizient gibt den Anteil der aufgeklärten Varianz des Kriteriums durch die Prädiktoren wieder

Answer 59

Der Determinationskoeffizient R² kann über die multiple Korrelation berechnet werden, indem die quadrierte multiple Korrelation verwendet wird, also R² = r²yy

Answer 60

- ob mindestens einer der k Prädiktoren Varianz des Kriteriums erklären kann, ob ein bestimmter Prädiktor Varianz des Kriteriums erklären kann - ob ein Set an Prädiktoren mehr Varianz des Kriteriums aufklären kann als ein anderes Set an Prädiktoren

Answer 61

Der hierarchische F-Test testet, ob ein zusätzliches Prädiktorenset B, ergänzt zu einem bestehenden Set A, signifikant Varianz des Kriteriums erklären kann

Answer 62

Die Freiheitsgrade in der Teststatistik des hierarchischen F-Tests werden wie folgt berechnet: df1 = kb und df2 = n - kA - kb - 1 - wobei kb die Anzahl der Prädiktoren im Set B - kA die Anzahl der Prädiktoren im Set A - n die Gesamtanzahl der Beobachtungen ist

Answer 63

Eine zentrale Annahme ist, dass der wahre Zusammenhang zwischen dem Kriterium und den Prädiktoren linear ist

Answer 64

Es ist wichtig, nichtlineare Zusammenhänge zu erkennen, da lineare Modelle diese nicht angemessen erfassen können > was zu ungenauen Vorhersagen führen kann

Answer 65

- Nichtlineare Zusammenhänge können durch die Verwendung von nichtlinearen Regressionsmodellen wie der quadratischen Regression integriert werden > um die Beziehung zwischen den Variablen genauer abzubilden

Answer 66

besagt, dass die Varianz der Kriteriumswerte über alle Prädiktorenwertekombinationen hinweg konstant ist

Answer 67

Eine Verletzung dieser Annahme führt zu einer erhöhten α-Fehlerrate in den Hypothesentests > obwohl die Schätzungen der Regressionskoeffizienten selbst nicht verzerrt sind

Answer 68

In einem Scale-Location-Plot wird die Varianz der Residuen als Funktion der vorhergesagten Werte dargestellt > Bei einer Verletzung der Annahme nimmt die Varianz der Residuen mit steigenden vorhergesagten Werten zu

Answer 69

esagt, dass die Residuen (die Unterschiede zwischen den beobachteten und den vorhergesagten Werten) normalverteilt sind

Answer 70

- Im Q-Q-Diagramm werden die beobachteten Quantile der Residuen gegenüber den theoretischen Quantilen der Normalverteilung abgetragen > Wenn die Residuen normalverteilt sind, liegen die Punkte entlang einer Diagonalen

Answer 71

- werden deutlich, wenn die Punkte im Q-Q-Diagramm nicht entlang einer Diagonalen liegen, sondern davon abweichen > Dies ist besonders deutlich, da Abweichungen im Q-Q-Diagramm besser erkennbar sind als im Histogramm

Answer 72

Der Bayes-Faktor vergleicht zwei statistische Modelle und quantifiziert, wie wahrscheinlich die Daten unter einem Modell im Vergleich zum anderen Modell sind > Ein höherer Bayes-Faktor deutet auf stärkere Evidenz für ein Modell hin

Answer 73

In der bayesianischen Regression werden verschiedene statistische Modelle verglichen, die bestimmte Prädiktoren enthalten oder nicht > Das Ziel ist es, die Evidenz in den Daten für ein Modell im Vergleich zu anderen Modellen zu bestimmen

Answer 74

- Die statistischen Modelle beschreiben die Beziehung zwischen den Prädiktoren und dem Kriterium - Die Prior-Verteilungen werden verwendet, um die Unsicherheit über die Modellparameter vor der Analyse zu beschreiben

Answer 75

- Die Korrelation ist die standardisierte Kovarianz zweier Variablen > gibt die Stärke und Richtung ihres Zusammenhangs an

Answer 76

- Das Ziel ist es, eine Variable (das Kriterium) durch eine andere Variable (den Prädiktor) vorherzusagen - Der y-Achsenabschnitt und der Steigungskoeffizient werden durch das Kriterium der kleinsten Quadrate geschätzt

Answer 77

Der Determinationskoeffizient quantifiziert den Anteil aufgeklärter Varianz des Kriteriums durch den Prädikator

Answer 78

- In der multiplen Regression können mehrere Prädiktoren gleichzeitig verwendet werden - um das Kriterium vorherzusagen > Dies ermöglicht eine komplexere Analyse der Beziehung zwischen den Variablen

Answer 79

Der hierarchische F-Test überprüft, ob das gesamte Modell, einzelne Prädiktoren oder Sets von Prädiktoren einen signifikanten Anteil an Varianz des Kriteriums erklären können

Answer 80

Die Annahmen können durch visuelle Inspektion der Residuen überprüft werden > zum Beispiel durch Scatterplots der Residuen gegen die vorhergesagten Werte

Answer 81

- Der Bayes-Faktor vergleicht statistische Modelle - quantifiziert, wie wahrscheinlich die Daten unter einem Modell im Vergleich zum anderen Modell sind, was die Stärke der Evidenz für ein Modell gegenüber dem anderen anzeigt

Answer 82

1. Test des Gesamtmodells, d. h., sind alle Prädiktoren zusammen in der Lage, einen signifikanten Anteil an Varianz des Kriteriums zu erklären? 2. Test eines spezifischen Prädiktors, d. h., kann ein spezifischer Prädiktor einen signifikanten zusätzlichen Anteil an Varianz des Kriteriums erklären? 3. Test eines Sets an Prädiktoren, d. h., kann ein Set an Prädiktoren einen signifikanten zusätzlichen Anteil an Varianz des Kriteriums erklären?

Answer 83

- Die KORRELATION ist standardisiert (als Maß für einen Linearzusammenhang) - Die KOVARIANZ hängt dagegen von der Einheit der Messwerte ab

Answer 84

Repräsentiert die vorhergesagten Werte des Kriteriums

Answer 85

indem man zuerst die durch die Linearkombination der multiplen Prädiktoren vorhergesagten Werte bestimmt und mit diesen vorhergesagten Werten des Kriteriums dann wiederrum das Kriterium selbst vorhersagt

Answer 86

1. Linearität 2. Homoskedastizität 3. Normalverteilung der Residuen

Answer 87

- Die Beziehung zwischen den unabhängigen Variablen (Prädiktoren) und der abhängigen Variable (Kriterium) muss linear sein > bedeutet, dass die Änderung der abhängigen Variable durch eine lineare Funktion der unabhängigen Variablen erklärt werden kann

Answer 88

Die Varianz der Fehlerterme (Residuen) sollte für alle Werte der unabhängigen Variablen konstant sein > bedeutet, dass die Streuung der Residuen unabhängig vom Niveau der unabhängigen Variablen ist

Answer 89

Die Fehlerterme (Residuen) sollten normalverteilt sein > besonders wenn es um Konfidenzintervalle und Hypothesentests geht

Answer 90

- Das identische Vorgehen bei der Hypothesentestung - beruht auf Modellvergleichen

Answer 91

Regressionskoeffizienten

Answer 92

… der Korrelation zwischen Prädiktor und Kriterium

Answer 93

… die Varianzen der Stichproben signifikant unterschiedlich sind

Answer 94

Welch-Test

Answer 95

Verwendet die Bayes-Faktoren zur Bewertung der Evidenz für oder gegen bestimmte Modelle

Answer 96

In der bayesianischen ANOVA wird typischerweise das Nullmodell (kein Effekt) mit einem Modell, das den Haupteffekt eines Faktors enthält, verglichen

Answer 97

Residual Mean / Square (MS_residual) / Residualvarianz

Answer 98

Prädiktor: Intelligenz Kriterium: Depression > Erklärung: Der Prädiktor (Intelligenz) wird verwendet, um das Kriterium (Depression) vorherzusagen.

Answer 99

Y= a+b*X Y = 400 + 200*x+25*x - A ist der Y-Achsenabschnitt (Intercept) - b1 und b2 sind die Steigungskoeffizienten (Slopes) > Bei 0 Promille und 0 Stunden Schlaf hat man eine Reaktionszeit von 400 ms Je mehr Alkohol man trinkt und je mehr Stunden man schläft, desto stärker erhöht sich die Reaktionszeit in ms > Allerdings hat de Promille eine deutlich höhere Auswirkung auf die Erhöhung der Reaktionszeit, als der Schlaf

Answer 100

Zerlegung einer kontinuierlichen Variable durch Trennung in die Gruppe der Messwerte, die über dem Median liegen, und die, die unter dem Median liegen

Answer 101

Im Zähler ist die Kovarianz

Answer 102

Ablesen von der AV (Kriterium), wo der Strich die Y-Achse durchkreuzt

Answer 103

y2 – y1 : x2 – x1