Probeklausur B Flashcards
Welchen Einfluss hat die Stichprobenverteilung auf die Testung?
• Stichprobenverteilung = die Ergebnisverteilung der Stichprobenwerte bzgl. bestimmter statistischer Größen
• Wichtigkeit der bekannten Stichprobenverteilung für die Auswahl des Testverfahrens und der Bewertung auf Genauigkeit des Ergebnisses (STICHPROBENVERTEILUNG HAT EINFLUSS AUF TESTVERFAHREN, SOMIT AUCH AUF TESTSTÄRKE!)
• In der Hypothesentestung erfolgt die Ziehung einer Stichprobe aus der größeren Population zufällig um Rückschlüsse auf die Population ziehen zu können Analyse, wenn Stichprobengröße ausreichend und die Annahme der Normalverteilung der Population erfüllt ist
Mittels einer Nachricht über eine Fitness-App soll untersucht werden, ob diese einen positiven
Effekt auf die Fitness einer Person hat:
a) Fitness-App mit 2 Stichproben: Es gibt 2 Gruppen, eine Experimentalgruppe (EG) und eine
Kontrollgruppe (KG). Die EG erhält über 2 Wochen täglich Motivationsnachrichten über
eine Fitness-App, die KG hingegen erhält keine Nachrichten. Nun soll getestet inwieweit sich
die Nachrichten auf die Schrittanzahl der jeweiligen Gruppen auswirkt. Welcher Test sollte
angewendet werden?
c) Fitness-App mit 3 Stichproben. Nun soll ausgeschlossen werden, dass die Benachrichtigung
per App eine Motivation bewirkt. Deshalb kommt nun zusätzliche eine Kontrollgruppe
dazu, welche ebenfalls Nachrichten über die App erhält, allerdings keine
Motivationsnachricht. Welcher Test kann nun angewendet werden? + Nullhypothese
angeben und erklären, wie würden Sie weiter vorgehen?
a) AV (Schrittanzahl =Intervallskaliert), 2 Stichproben:
- Stichproben unabhängig: zwei Gruppen (EG und KG), nicht die Rede von einem „vorher-nachher“- Vergleich
- zwei unabhängige Stichprobe bei einmaliger Erhebung nach 2 Wochen, AV intervallskaliert: t-Test für zwei unabhängige Stichproben
- fall abhängige Stichprobe vorliegt (Messwiederholung für Ende Gruppe vor/nach Intervention): t-Test für abhängige Stichproben wäre anzuwenden
c) AV (Schrittanzahl =Intervallskaliert), 3 Stichproben
- Wenn abhängig = Varianzanalyse mit Messwiederholungen
- Wenn unabhängig = Varianzanalyse ohne Messwiederholungen
Definition Prädiktor
Ein Prädiktor (auch UV) ist eine Variable, die verwendet wird, um die Werte des Kriteriums vorherzusagen.
Definition Kriterium
Ein Kriterium ist die Variable, die vorhergesagt werden soll. Demnach wird die Abhängige Variable
durch die unabhängige Variable beeinflusst/erklärt.
Definition Standarfschätzfehler
- spezieller Fall des Standardfehlers, der sich auf Schätzungen von Regressionsparametern bezieht. Er gibt an, wie genau die Schätzungen der Regressionsparameter sind und beschreibt die Streuung der wahren 𝑦𝑖-Werte um die Regressionsgerade (also die Abweichungen zwischen den geschätzten und den tatsächlichen Werten der Regressionsparameter).
Nennen Sie die Voraussetzungen der ANOVA.
- mindestens Intervallskalenniveau der abhängigen Variable
- mindestens Normalverteilung der abhängigen Variablen in allen Testgruppen
- Varianzhomogenität in allen Gruppen
- mindestens 20 Elemente pro Stichprobe, ähnlich stark besetzte Gruppen
- Messwerte unabhängig
Vorteil der Varianzanalyse gegenüber mehrerer t-Tests.
❗️Problem bei mehreren tTests:
• bei jedem t-Test besteht die Gefahr eines aFehlers, bei mehreren t-test würde die Summierung dieser Fehler zu einer aFehler-Inflation führen. Je mehr t-Tests durchgeführt werden, desto größer ist also die Wahrscheinlichkeit, bei mindestens einem dieser t-Tests einen aFehler zu begehen.
• Einsatz von Korrekturen, die das AlphaNiveau herabsetzen = Chance signifikante Unterschiede zu finden wird geringer
❗️Warum Varianzanalyse:
• Um Gefahr von aFehler-Inflationierung/große Anzahl von Korrekturen zu umgehen: Varianzanalyse, welche Mittelwertsvergleich mit mehr als zwei Gruppen ohne jegliche Korrektur erlaubt, statt mehrere t-Tests durchzuführen
• Varianzanalyse überprüft, ob statistisch signifikante Unterschiede zwischen mehr als zwei Gruppen vorliegen. Hierfür werden die Mittelwerte der jeweiligen Gruppen miteinander verglichen. Der t-Test prüft hingegen auf Unterschiede zwischen lediglich zwei Gruppen.
Warum ist die zweifaktorielle Varianzanalyse besser als die einfaktorielle?
Eine zweifaktorielle Varianzanalyse (ANOVA) ermöglicht:
- die Untersuchung des Einflusses zweier unabhängiger Variablen (Faktoren) auf eine abhängige Variable (Merkmal) gleichzeitig
1️⃣Einfluss Faktor A Lernmethode auf Note
2️⃣Einfluss Faktor B Intelligenz auf Note - die Untersuchung der Interaktionen zwischen den Faktoren (Interaktion = wenn der Einfluss eines Faktors auf das Merkmal von dem Einfluss des anderen Faktors abhängt)
1️⃣↔️2️⃣Lernmethode (F1) hat nur dann einen signifikanten Einfluss auf Note, wenn Schüler eine bestimmte Intelligenz (F2) haben - die bessere und komplexere Untersuchung und Interpretation von Unterschieden zwischen den Gruppen
- der Anteil der nicht-erklärbaren Varianz (Fehlervarianz) bei zweifaktorieller ANOVA wird gegenüber der einfaktoriellen ANOVA um die auf den zweiten Faktor und die Interaktion zurückgehende Varianz reduziert
- somit ist dieses Verfahren Teststärker und ein Faktor kann signifikant werden, der in der einfaktoriellen Varianzanalyse nicht signifikant werden würde
- zweifaktorielle Varianzanalyse kontrolliert selbstständig die aFehler-Kummulierung, während bei mehreren bzw. zwei einfaktoriellen Varianzanalysen die Gefahr einer aFehler-Inflation besteht
❗️Die einfaktorielle ANOVA kann nur feststellen, ob es insgesamt Unterschiede zwischen den Gruppen gibt, aber nicht, welche Gruppen sich unterscheiden. Des Weiteren ermöglicht sie nur die Untersuchung des Einflusses einer unabhängigen Variablen auf eine abhängige Variable.
❗️Beispiel: Experiment, das den Einfluss von Lernmethode (Faktor 1) und Intelligenz (Faktor 2) auf die Leistung im Mathematikunterricht (Merkmal) untersucht, könnte feststellen, dass die Lernmethode nur dann einen signifikanten Einfluss hat, wenn die Schüler eine bestimmte Intelligenz haben. Eine ei
ANOVA Zufriedenheit/Geschlecht/Bildung
Die Tabelle zeigt die Ergebnisse einer ANOVA (Varianzanalyse) mit drei Prädiktoren: Geschlecht, Bildung und deren Interaktion (G × B). Hier ist die Interpretation der einzelnen Ergebnisse:
- Hauptwirkung Geschlecht• df (Zähler/nenner): 1,52
• F-Wert: 0.59
• p-Wert: 0.448
• η² (Partielles Eta-Quadrat): 0.001
Die Hauptwirkung des Geschlechts ist nicht signifikant (p=0.448), was bedeutet, dass Geschlecht keinen signifikanten Einfluss auf die abhängige Variable (Arbeitszufriedenheit) hat. Das partielle Eta-Quadrat von 0.01 zeigt, dass nur 1 % der Varianz in der Arbeitszufriedenheit durch Geschlecht erklärt wird.
- Hauptwirkung Bildung• df (Zähler/nenner): 2,52
• F-Wert: 189,7
• p-Wert: < 0.001
• η² (Partielles Eta-Quadrat): 0.88
Die Hauptwirkung der Bildung ist hochsignifikant (p < 0.001), was bedeutet, dass die Bildungsstufe einen starken Einfluss auf die Arbeitszufriedenheit hat. Das partielle Eta-Quadrat von 0.88 zeigt, dass 88 % der Varianz in der Arbeitszufriedenheit durch Bildung erklärt werden.
- Interaktion Geschlecht × Bildung (G × B)• df (Zähler/nenner): 2,52
• F-Wert: 7.34
• p-Wert: 0.002
• η² (Partielles Eta-Quadrat): 0.22
Die Interaktion zwischen Geschlecht und Bildung ist signifikant (p=0.002), was darauf hinweist, dass der Einfluss von Bildung auf die Arbeitszufriedenheit vom Geschlecht abhängt. Das partielle Eta-Quadrat von 0.22 zeigt, dass 22 % der Varianz in der Arbeitszufriedenheit durch diese Interaktion erklärt werden.
Fazit
• Bildung hat den stärksten Einfluss auf die Arbeitszufriedenheit (88 % der Varianz erklärt). • Geschlecht hat allein keinen signifikanten Einfluss. • Die Interaktion zwischen Geschlecht und Bildung ist signifikant und erklärt 22 % der Varianz, was darauf hinweist, dass sich der Einfluss der Bildung auf die Arbeitszufriedenheit zwischen den Geschlechtern unterscheidet.