Verfahren zur Überprüfung von Zusammenhangshypothesen Flashcards
Welche Arten von Forschungsfragen drehen sich oft um den Zusammenhang zwischen Variablen?
Forschungsfragen, die sich um den Zusammenhang zwischen kategorialen oder kontinuierlichen Variablen drehen
Welche Verfahren werden zur Testung von Unterschieden zwischen kategorialen Variablen verwendet?
t-Tests und die Varianzanalyse werden oft zur Testung von Unterschieden zwischen kategorialen Variablen verwendet
Warum werden t-Tests und die Varianzanalyse oft für kategoriale Variablen eingesetzt?
Diese Verfahren sind geeignet, um Unterschiede zwischen Gruppen zu untersuchen, die durch kategoriale Variablen definiert sind
Was passiert, wenn die beteiligten Variablen nicht kategorial, sondern kontinuierlich sind?
Wenn die Variablen kontinuierlich sind, könnten sie durch einen Mediansplit in Kategorien aufgeteilt werden, um Unterschiede zu untersuchen
Was wäre eine Möglichkeit, kontinuierliche Variablen in Kategorien aufzuteilen, um Unterschiede zu untersuchen?
- Eine Möglichkeit wäre ein Mediansplit
- bei dem die Variablen in zwei Gruppen anhand des Medianwerts aufgeteilt werden
Welche Informationen gehen verloren, wenn kontinuierliche Variablen durch einen Mediansplit in Kategorien aufgeteilt werden?
- Durch einen Mediansplit gehen Informationen über mögliche Unterschiede innerhalb der Gruppen verloren
- da nur die Mittelwerte der definierten Gruppen verwendet werden
Welche Annahme treffen wir, wenn wir einen Zusammenhang zwischen zwei Variablen vermuten?
Wir nehmen an, dass die Variabilität in der einen Variable systematisch mit der Variabilität in der anderen zusammenhängt
Was ist die Kovarianz und welche Information liefert sie?
- Die Kovarianz misst, wie stark die Variablen gemeinsam variieren
- liefert Informationen über die Richtung des Zusammenhangs
Warum ist die Korrelation eines der wichtigsten Maße in der Statistik?
- Die Korrelation ist ein standardisiertes Maß für den Zusammenhang zwischen Variablen
- ermöglicht eine präzise Quantifizierung dieses Zusammenhangs
Wie können wir Hypothesen über Korrelationen testen?
- Wir können Hypothesen über Korrelationen testen
- indem wir statistische Tests wie den Pearson-Korrelationskoeffizienten verwenden
Was ermöglicht uns der Zusammenhang von Variablen in Bezug auf Vorhersagen?
ermöglicht es uns, Vorhersagen über eine Variable basierend auf den Werten einer anderen Variable abzuleiten
> was in verschiedenen Anwendungen nützlich ist
Wie quantifizieren wir den Zusammenhang zwischen Variablen?
indem wir die Kovarianz und anschließend die Korrelation berechnen
Was ist die Kovarianz und wie wird sie berechnet?
- Die Kovarianz ist die Summe der multiplizierten Abweichungen zweier Variablen
- dividiert durch die Anzahl der Freiheitsgrade
Wann spricht man von einem positiven linearen Zusammenhang?
Man spricht von einem positiven linearen Zusammenhang, wenn höhere Werte auf der einen Variable mit höheren Werten auf der anderen einhergehen
Was bedeutet ein positiver Wert der Kovarianz?
zeigt an, dass die Variablen gleichsinnig zusammenhängen
Wie bezeichnet man einen gleichsinnigen Zusammenhang und was zeigt eine negative Kovarianz an?
- Einen gleichsinnigen Zusammenhang nennt man auch positiven Zusammenhang
- Eine negative Kovarianz zeigt einen gegensinnigen Zusammenhang an
Wann ist die Kovarianz 0 und was bedeutet das?
- Die Kovarianz ist 0, wenn die Variablen unabhängig voneinander sind
- Das bedeutet, dass kein linearer Zusammenhang zwischen den Variablen besteht
Was ist die Einschränkung der Kovarianz in Bezug auf die Interpretation des Zusammenhangs?
Die Kovarianz hängt von der Einheit der Variablen ab
> was ihre Interpretation erschwert
Wie können wir die Stärke des Zusammenhangs zwischen Variablen interpretieren?
Um die Stärke des Zusammenhangs zu interpretieren, standardisieren oder z-transformieren wir die Kovarianz, um die Korrelation zu erhalten
Wie standardisieren wir die Kovarianz?
Wir setzen die Kovarianz ins Verhältnis zum Produkt der Standardabweichungen
Was ist der Pearson-Korrelationskoeffizient und wie wird er berechnet?
Der Pearson-Korrelationskoeffizient ist ein Maß für den linearen Zusammenhang zwischen zwei Variablen
- Er wird berechnet, indem die Kovarianz der beiden Variablen durch das Produkt ihrer Standardabweichungen geteilt wird
Welche Eigenschaften hat der Pearson- Korrelationskoeffizient?
- Der Pearson-Korrelationskoeffizient liegt immer zwischen -1 und 1
- Bei einem perfekten positiven linearen Zusammenhang ist er 1
- bei einem perfekten negativen linearen Zusammenhang -1
- bei keinem linearen Zusammenhang 0
Wie interpretieren wir den Pearson-Korrelationskoeffizienten?
- Je näher der Pearson-Korrelationskoeffizient an 1 oder -1 liegt, desto stärker ist der lineare Zusammenhang zwischen den Variablen
- Ein Wert von 0 zeigt an, dass kein linearer Zusammenhang besteht
Nach Cohen
(1988) gelten folgende Konventionen für die Klassifizierung von rxy:
Wofür dient die Korrelation zunächst?
Sie dient der Beschreibung des Zusammenhangs zwischen zwei Merkmalen in einer Stichprobe
Was repräsentiert der Korrelationskoeffizient
𝑟𝑥𝑦 in Bezug auf die Population?
Er schätzt die Korrelation der Merkmale in der Population
Welche Bezeichnung hat die wahre Korrelation in der Population?
Die wahre Korrelation in der Population wird mit dem griechischen Buchstaben
𝜌 („rho“) bezeichnet
Welche Faktoren beeinflussen die Teststatistik für die Populationskorrelation?
Die Teststatistik hängt nur von der Größe der Korrelation und der Stichprobengröße ab
Welche Möglichkeiten gibt es, Hypothesen über die Population anhand von
𝑟𝑥𝑦 zu testen?
- Mit einem t-Test für die berechnete t-Statistik
- durch Bestimmung des kritischen Werts der t-Verteilung basierend auf dem festgelegten α-Niveau
Was ist Fishers Z-Transformation?
- Eine Methode, um Hypothesen über die Population basierend auf der Korrelation zu testen
- wenn sich die Schätzungen mit 𝑟𝑥𝑦 nicht normal verteilen
Was ist die Korrelation und wofür dient sie?
- Die Korrelation ist ein Maß für den linearen Zusammenhang zwischen zwei Merkmalen
> dient der Quantifizierung dieses Zusammenhangs
Was bedeutet es, wenn die Korrelation zwischen zwei Merkmalen 0 ist?
Wenn die Korrelation 0 ist, bedeutet dies, dass es keinen linearen Zusammenhang zwischen den beiden Merkmalen gibt
Warum bedeutet eine Korrelation von 0 nicht unbedingt, dass die Merkmale unabhängig voneinander sind?
- Eine Korrelation von 0 bedeutet nicht zwangsläufig, dass die Merkmale unabhängig voneinander sind
> da der Zusammenhang auch nichtlinear sein kann
Warum kann die Korrelation durch Ausreißer stark beeinflusst werden?
Ausreißer können die Korrelation stark verändern, da sie einen großen Einfluss auf das Maß haben können
Welche weiteren Zusammenhangsmaße können robuster gegenüber Ausreißern sein?
Spearmans Rangkorrelation ist ein Beispiel für ein Zusammenhangsmaß, das robuster gegenüber Ausreißern ist
Auf welchen Annahmen beruhen inferenzstatistische Verfahren zur Korrelation?
- Inferenzstatistische Verfahren zur Korrelation beruhen auf der Annahme, dass die beiden Variablen bivariat normalverteilt sind
- mit einer wahren Korrelation 𝜌
Was kann bei groben Verletzungen dieser Annahmen passieren?
Bei groben Verletzungen dieser Annahmen können die Fehlerraten der statistischen Tests größer sein als angenommen
Was ist das Ziel der linearen Regression?
Das Ziel der linearen Regression ist es, eine Variable aufgrund einer anderen Variable vorherzusagen
Was bedeutet es, eine Variable aufgrund einer anderen Variable vorherzusagen?
- Es bedeutet, den Zusammenhang zwischen den Variablen zu nutzen
- um Werte einer Variable basierend auf den Werten einer anderen Variable vorherzusagen
Was ist der Unterschied zwischen Korrelation und Vorhersage?
- Die Korrelation quantifiziert den Zusammenhang zwischen Variablen
- während die Vorhersage den Versuch unternimmt, eine Variable basierend auf einer anderen Variable zu prognostizieren
Was versteht man unter einer linearen Regression?
Bei der linearen Regression wird versucht, den linearen Zusammenhang zwischen zwei oder mehr Variablen zu modellieren, um eine Vorhersage zu treffen
Wann spricht man von einer multiplen linearen Regression?
Man spricht von einer multiplen linearen Regression, wenn mehrere Prädiktoren verwendet werden, um eine Variable vorherzusagen
Was ist ein deterministischer Zusammenhang?
Ein deterministischer Zusammenhang besteht:
- wenn der Zusammenhang zwischen den Variablen perfekt ist
- jede Variable exakt vorhergesagt werden kann
Warum ist eine perfekte Vorhersage in der Psychologie oft nicht möglich?
da komplexe menschliche Verhaltensweisen und Variabilität die Vorhersage erschweren
Was ist ein stochastischer Zusammenhang?
Ein stochastischer Zusammenhang besteht, wenn die Vorhersage von Variablen aufgrund anderer Variablen nicht exakt ist, sondern Wahrscheinlichkeiten beinhaltet
Wie wird die Güte einer Vorhersage gemessen?
- Die Güte einer Vorhersage wird gemessen, indem man die Abweichungen zwischen den vorhergesagten Werten und den tatsächlichen Werten betrachtet
> Je geringer die Abweichungen, desto besser ist die Vorhersage
Die einfache lineare Regression ist eine Methode, um den Wert …
… einer kontinuierlichen Kriteriumsvariable
durch eine Prädiktorvariable vorherzusagen
Was sind die beiden Parameter, die die Regressionsgerade definieren?
Die beiden Parameter sind a und b
> auch bekannt als Regressionsgewichte oder -koeffizienten
Wie wird der Parameter a auch genannt und was repräsentiert er?
Der Parameter a wird auch als y-Achsenabschnitt oder Intercept bezeichnet
> Er repräsentiert den Wert von Y, wenn X = 0 ist
Wie wird der Parameter b auch genannt und was repräsentiert er?
Der Parameter b wird Steigung genannt
> Er repräsentiert die Veränderung in unserer Vorhersage für Y, wenn sich der Prädiktor X um eine Einheit verändert
Was beschreibt der Parameter a in Bezug auf die Regressionsgerade?
Der Parameter a beschreibt den y-Achsenabschnitt
> also den Wert von Y, wenn X = 0 ist
Was repräsentiert der Parameter b in Bezug auf die Regressionsgerade?
- Der Parameter b repräsentiert die Steigung der Regressionsgerade
- also die Veränderung in unserer Vorhersage für Y, wenn sich der Prädiktor X um eine Einheit verändert
Wie werden die Parameter a und b ausgewählt, um die Vorhersage zu optimieren?
Die Parameter a und b werden so ausgewählt, dass die Summe der quadrierten Abweichungen von der resultierenden Geraden minimal wird
Was bedeutet die “Methode der kleinsten Quadrate”?
Die “Methode der kleinsten Quadrate” bezieht sich auf die Auswahl der Regressionskoeffizienten, um die quadrierten Abweichungen von der Regressionsgerade zu minimieren