Verfahren zur Überprüfung von Unterschiedshypothesen mit zwei Gruppen Flashcards
Was ist der t-Test und warum ist er einer der häufigsten Tests in der psychologischen Forschung?
- Der t-Test ist ein statistischer Test
- wird verwendet, um festzustellen, ob es einen signifikanten Unterschied zwischen den Mittelwerten von zwei Gruppen gibt
> Er ist häufig, weil er einfach durchzuführen ist und robuste Ergebnisse liefert
Was sind Unterschiedshypothesen und welche Arten von Forschungsfragen können damit beantwortet werden?
- Unterschiedshypothesen untersuchen, ob es einen Unterschied zwischen Gruppen gibt
Beispiele:
- Einfluss von Musik auf die Leistung
- Geschlechterunterschiede bei depressiven Störungen
- Auswirkungen einer Gesundheitsintervention auf das Ernährungsverhalten
Welche Varianten des t-Tests gibt es und wie unterscheiden sie sich voneinander?
- einseitigen t-Test
- zweiseitigen t-Test für unabhängige Gruppen
- gepaarten t-Test für abhängige Gruppen
> Sie unterscheiden sich in der Art der Vergleichsgruppen
Auf welchen Annahmen basiert der t-Test?
- Der t-Test basiert auf Annahmen über die Verteilung der Daten
> insbesondere auf der Annahme einer normalen Verteilung und der Homogenität der Varianzen
Was ist, wenn die Annahmen, auf die der t-Test basiert, nicht zutreffen?
- die Ergebnisse können verzerrt sein
- die Interpretation der Ergebnisse kann schwierig sein
Wie kann man überprüfen, ob die Annahmen des t-Tests erfüllt sind?
- durch grafische Methoden wie Histogramme oder QQ-Plots
- durch formelle Test wie den Shapiro-Wilk-Test oder den Levene-Test
Was kann man tun, wenn die Annahmen des t-Tests nicht zutreffen?
- nichtparametrische Tests verwenden
- alternative Analysestrategien wie die Transformation der Daten anwenden
Warum werden parametrische Tests häufiger eingesetzt als nichtparametrische Tests?
- Parametrische Tests sind effizienter und liefern robustere Ergebnisse
> wenn ihre Annahmen erfüllt sind
- Nichtparametrische Tests als alternative Methode, wenn Annahmen der parametrischen Tests nicht erfüllt sind
Um was geht es bei dem Einstichproben-z-Test?
Es geht darum, den empirischen
Mittelwert einer Stichprobe mit einem fixen Wert zu vergleichen
Warum ist es wichtig, neben p-Werten und Teststatistiken auch Effektstärken zu berichten?
Effektstärken bieten zusätzliche Informationen über die Stärke von Effekten und die praktische Relevanz von Studienergebnissen
Was wird von der Amerikanischen Gesellschaft für Psychologie in Bezug auf die Berichterstattung von Studienergebnissen gefordert?
Neben p-Werten und Teststatistiken wird auch die Berichterstattung von Effektstärken gefordert
Wie definiert Daniel Lakens die Bedeutung von Effektstärken?
“the most important outcome of empirical studies”
Was quantifiziert eine Effektstärke?
Eine Effektstärke quantifiziert
- die Stärke eines Zusammenhangs zwischen Variablen
oder
- den Unterschied zwischen Mittelwerten
Was ist das Besondere an standardisierten Effektstärkemaßen?
Ermöglichen den Vergleich von Effekten zwischen verschiedenen Skalen, da sie unabhängig von der Maßeinheit sind
Wie wird die Effektstärke δ definiert?
Die Effektstärke δ beschreibt den Unterschied der Mittelwerte in der Einheit von Standardabweichung
Was bedeutet es, wenn δ = 2 ist?
Wenn δ = 2 ist, bedeutet das, dass sich die Mittelwerte um zwei Standardabweichungseinheiten unterscheiden
Allgemein
lässt sich die Effektstärke für einen Vergleich von zwei Mittelwerten definieren als:
Die Effektstärke ist ein …
… standardisiertes Maß
> d. h., es ist unabhängig
von der Maßeinheit des untersuchten Merkmals (z. B. Meter oder Kilogramm)
Die Effektstärken nach Choehns d: Zur Einordnung werden häufig folgende Konventionen verwendet
d = 0.2 (kleiner Effekt)
d = 0.5 (mittlerer Effekt)
d = 0.8 (großer Effekt)
Worin besteht die Annahme des Einstichproben-z-Tests?
dass die wahre Standardabweichung des Merkmals in der Population bekannt ist
Warum ist die Annahme des Einstichproben-z-Tests in der Realität oft nicht erfüllt?
In der Realität ist die wahre Standardabweichung des Merkmals in der Population oft unbekannt
Was ist das Hauptmerkmal des Einstichproben-t-Tests?
Die Schätzung der Standardabweichung aus den Stichprobendaten
Wofür wird der Einstichproben-t-Test verwendet?
um einen empirischen Mittelwert mit einem festen Wert zu vergleichen
> wenn die Standardabweichung des Merkmals in der Population unbekannt ist und aus den Stichprobendaten geschätzt werden muss
Was muss geschätzt werden, wenn die Standardabweichung in der Population unbekannt ist?
Wenn die Standardabweichung in der Population unbekannt ist, muss sie aus den Stichprobendaten geschätzt werden
Warum kann der Einstichproben-z-Test nicht verwendet werden, wenn die Standardabweichung in der Population unbekannt ist?
- weil er die Kenntnis der wahren Standardabweichung in der Population erfordert
> die in solchen Fällen nicht gegeben ist
Wer hat die t-Verteilung entwickelt und unter welchem Pseudonym wurde seine Forschung veröffentlicht?
William Sealy Gosset
> veröffentlicht unter dem Pseudonym “Student”
Was ist charakteristisch für die Form der t-Verteilung?
Die Form der t-Verteilung hängt von den Freiheitsgraden ab
Wie ähnelt die t-Verteilung der Standardnormalverteilung?
Die t-Verteilung ähnelt der Standardnormalverteilung
> sie hat jedoch mehr Wahrscheinlichkeitsdichte in den Enden der Verteilung
Was passiert mit der t-Verteilung bei großen Freiheitsgraden?
Bei großen Freiheitsgraden geht die t-Verteilung in die Standardnormalverteilung über
Warum geht die t-Verteilung bei großen Freiheitsgraden in die Standardnormalverteilung über?
weil bei großen Stichproben die Schätzung der wahren Populationsstandardabweichung der t-Verteilung nahezu perfekt wird
Wie wird mathematisch ausgedrückt, dass sich die geschätzte Standardabweichung für eine unendlich große Stichprobe der wahren Populationsstandardabweichung annähert?
Mathematisch wird dies mit dem Grenzwert (Limes) ausgedrückt
Was sind die beiden Voraussetzungen für den Einstichproben-t-Test?
- Unabhängigkeit der Daten
- Normalverteilung des untersuchten Merkmals in der Population
Warum ist es wichtig, dass die Daten mindestens Intervallskalenniveau haben, um die Voraussetzung der Normalverteilung zu erfüllen?
Die Normalverteilung der Daten setzt voraus, dass sie mindestens Intervallskalenniveau haben, da ordinalskalierte Daten automatisch die Voraussetzung der Normalverteilung verletzen würden
Wie wird die Unabhängigkeit der erhobenen Daten sichergestellt?
Die Unabhängigkeit der Daten wird durch das experimentelle Design sichergestellt
Welche potenziellen Probleme könnten auftreten, die die Unabhängigkeit der Daten beeinträchtigen?
- wenn Gruppen von Teilnehmern in der Stichprobe existieren, deren Leistung untereinander ähnlicher ist als zwischen den Gruppen
Wie kann überprüft werden, ob die Daten einer Normalverteilung folgen?
Mit dem Shapiro-Wilk-Test
Was bedeutet ein signifikantes Ergebnis beim Shapiro-Wilk-Test?
Ein signifikantes Ergebnis beim Shapiro-Wilk-Test deutet darauf hin, dass die Daten nicht normalverteilt sind
Was passiert, wenn die Voraussetzungen für einen Test verletzt werden?
- Es können die festgelegten Langzeitfehlerraten nicht mehr garantiert werden
> das Testergebnis könnte unzuverlässig sein
Welche Alternativen gibt es, wenn die Voraussetzungen für einen Test nicht erfüllt sind?
- auf andere Testverfahren ausweichen
- robuste Testverfahren nutzen
Inwiefern ist der Einstichproben-t-Test robust gegenüber der Verletzung der Normalverteilungsannahme?
ist er, wenn die Stichprobe hinreichend groß ist
Welche Heuristik wird oft verwendet, um eine “große” Stichprobe zu bestimmen?
Oft wird eine Stichprobengröße von N > 30 als ausreichend betrachtet
> um die Robustheit des t-Tests gegenüber Verletzungen der Normalverteilungsannahme sicherzustellen
Was ist das Ziel des Zweistichproben-t-Tests für unabhängige Stichproben?
Das Ziel ist es, die Stichprobenmittelwerte von zwei unabhängigen Stichproben zu vergleichen
In welchen Arten von Situationen wird der Zweistichproben-t-Test normalerweise angewendet?
Normalerweise in den folgenden Situationen:
- Experimentelle Bedingungen
- Patientengruppen
- Kontrollgruppen
- natürliche Gruppen
Welche Hypothese wird mit dem Zweistichproben-t-Test getestet?
Die Hypothese, die getestet wird, ist, ob es einen Unterschied zwischen den wahren Populationsmittelwerten der beiden Gruppen gibt
Was besagt die ungerichtete Nullhypothese?
- dass es keinen Unterschied zwischen den wahren Populationsmittelwerten der beiden Gruppen gibt
oder
- dass die Differenz der beiden Mittelwerte gleich 0 ist
Wie wird die ungerichtete Alternativhypothese formuliert?
- dass es einen Unterschied zwischen den wahren Populationsmittelwerten der beiden Gruppen gibt
oder
- dass die Differenz der Mittelwerte ungleich 0 ist
Was sagen die gerichteten Hypothesen voraus?
dass der Populationsmittelwert einer Gruppe größer oder kleiner ist als der Populationsmittelwert der anderen Gruppe
Welche drei Voraussetzungen liegen dem Zweistichproben-t-Test für unabhängige Stichproben zugrunde?
- Unabhängigkeit der Beobachtungen innerhalb jeder Gruppe und zwischen den Gruppen
- Normalverteilung der Daten in beiden Gruppen
- Varianzhomogenität der beiden Gruppen
Wie wird die Unabhängigkeit der Beobachtungen innerhalb jeder Gruppe und zwischen den Gruppen sichergestellt?
Durch das Forschungsdesign, das sicherstellt, dass:
- die Beobachtungen unabhängig voneinander sind
- die Gruppen selbst unabhängig sind
Was wird unter Varianzhomogenität verstanden, und warum ist sie für den Zweistichproben-t-Test wichtig?
bezieht sich auf die Annahme, dass die Varianzen der beiden Gruppen gleich sind
> wichtig, um sicherzustellen, dass die Stichproben vergleichbar sind
Welche Möglichkeiten gibt es, die Varianzhomogenität zu überprüfen?
Der Levene-Test testet die Gleichheit der Varianzen der beiden Populationen
Wie kann der Zweistichproben-t-Test trotz einer Verletzung der Varianzhomogenitätsannahme robust gemacht werden?
Wenn die Stichproben beider Gruppen gleich groß sind, ist der Test robust gegen die Verletzung der Varianzhomogenitätsannahme
Was ist der Levene-Test und was testet er?
Der Levene-Test testet die Gleichheit der Varianzen der Populationen, um die Varianzhomogenität zu überprüfen
Welche Alternativen gibt es, wenn die Varianzhomogenitätsannahme verletzt ist?
Eine Möglichkeit ist die Verwendung des Welch-Tests
> der keine Annahmen über die Varianzhomogenität macht und eine robuste Alternative darstellt
Was sind nichtparametrische Tests, und warum werden sie verwendet?
- Machen keine Annahmen über die Verteilungsform der Daten
- Werden verwendet, wenn die Voraussetzungen parametrischer Tests nicht erfüllt sind
Welcher nichtparametrische Test wird verwendet, wenn die Normalverteilungsannahme des Zweistichproben-t-Tests verletzt ist?
Der Mann-Whitney-U-Test wird verwendet
Was ist das Besondere am Mann-Whitney-U-Test in Bezug auf die Verteilungsannahmen?
Er macht keine Annahmen über die Verteilungsform der Daten
Wie funktioniert die Berechnung der Rangsummen im Mann-Whitney-U-Test?
- Die Daten werden in eine Rangreihe gebracht
- Die Rangsummen werden miteinander verglichen
Welchen Vorteil bietet der Mann-Whitney-U-Test im Vergleich zum t-Test?
- Er berücksichtigt nur die Reihenfolge der Messwerte
- Es werden nicht die tatsächlichen Abstände berücksichtigt
> wodurch keine Annahmen über die Verteilung der Daten notwendig sind
Warum haben nichtparametrische Tests eine geringere Teststärke?
Weil sie weniger Informationen aus den Daten nutzen
Wieso ist es wichtig, die Berechnung der Rangsummen im Mann-Whitney-U-Test zu verstehen, obwohl sie normalerweise vom Computer durchgeführt wird?
Es hilft dabei, das Konzept des Tests zu verstehen und zu interpretieren
> auch wenn die Berechnungen vom Computer durchgeführt werden
Was sind Messwiederholungs-Experimente, und wie unterscheiden sie sich von Experimenten mit unabhängigen Gruppen?
beinhalten die mehrmalige Messung desselben Merkmals an denselben Teilnehmern über einen Zeitraum hinweg
> Im Gegensatz dazu vergleicht man in Experimenten mit unabhängigen Gruppen verschiedene Gruppen miteinander, die nicht miteinander verbunden sind
Warum sind die Gruppen in Messwiederholungs-Experimenten nicht unabhängig voneinander?
Weil dieselben Teilnehmer in jeder Gruppe vertreten sind und ihre Messungen miteinander verbunden sind
Welche Art von Daten wird in Messwiederholungs-Experimenten gemessen?
- Messungen erfolgen über einen Zeitverlauf oder über verschiedene Bedingungen hinweg
- um so die Veränderung innerhalb derselben Gruppe im Laufe der Zeit / unter bestimmten Bedingungen zu untersuchen
Was ist das nichtparametrische Testäquivalent zum Zweistichproben-t-Test für abhängige Stichproben?
Das nichtparametrische Testäquivalent ist der Wilcoxon-Vorzeichen-Test oder Wilcoxon-Test für abhängige Stichproben
Was prüft der Wilcoxon-Vorzeichen-Test?
ob sich zwei abhängige Stichproben hinsichtlich ihrer zentralen Tendenz unterscheiden
> ohne dabei Annahmen über die Verteilungsform der Daten zu machen
Was ist der Unterschied zwischen frequentistischen und bayesianischen t-Tests?
- Der Begriff t-Test wird in der Regel für frequentistische Testprozeduren verwendet
> ist aber auch möglich, Unterschiedshypothesen bayesianisch zu testen
Welche Voraussetzungen gelten für bayesianische t-Tests?
haben ähnliche Voraussetzungen:
- Intervallskalierter und normalverteilter Daten
- Unabhängigkeit
- Varianzhomogenität
Was repräsentiert der Parameter δ in bayesianischen t-Tests?
In allen bayesianischen t-Tests, unabhängig von der Art der Stichprobe, ist der Parameter δ zentral
> repräsentiert die standardisierte Effektgröße d bei frequentistischen Tests
Wie wird die Cauchy-Verteilung definiert und welche Parameter steuern sie?
Wird durch zwei Parameter definiert:
- den Lageparameter t
- den Breiteparameter r
Welche Bedeutung haben der Lageparameter t und der Breiteparameter r in der Cauchy-Verteilung?
Lageparameter t = Definiert den Median der Verteilung
Breiteparameter r = Steuert die Verteilung
Was sind die Eigenschaften der Prior-Verteilung von
δ in einem bayesianischen t-Test?
Die Prior-Verteilung von δ ist häufig eine Cauchy-Verteilung um 0 mit verschiedenen Breiten
Warum wird der Lageparameter 𝑡 häufig gleich 0 gesetzt?
Der Lageparameter
𝑡 wird häufig auf 0 gesetzt, um die Verteilung um 0 zu zentrieren
Was bedeutet es, dass die Cauchy-Verteilung zu einer konservativen Schätzung der Effektstärke δ führt?
Die Cauchy-Verteilung weist die meiste Wahrscheinlichkeit auf kleinen Werten von 𝛿 auf
> was zu einer konservativen Schätzung der Effektstärke führt
Warum wird die Cauchy-Verteilung im bayesianischen t-Test oft der Normalverteilung vorgezogen?
- da sie auch Wahrscheinlichkeitsdichte in den Rändern der Verteilung besitzt
> daher auch extreme Effektstärken berücksichtigt
Warum ist der bayesianische t-Test konsistent, und was bedeutet das für den Bayes-Faktor BF10?
Der bayesianische t-Test ist konsistent, was bedeutet, dass der Bayes-Faktor BF10 Evidenz für die wahre Hypothese liefert
> wenn die Stichprobengröße gegen unendlich geht
Welche Art von Tests werden benötigt, um Gruppenunterschiede in Variablen zu untersuchen, die nicht einmal ordinalskaliert sind?
Tests, die auf nominalskalierte Daten angewendet werden können, werden benötigt
Warum sind herkömmliche t-Tests oder nichtparametrische Tests nicht geeignet für nominalskalierte Daten?
da sie spezifische Skalenniveaus erfordern, die nominalskalierte Daten nicht erfüllen
Was sind Beispiele für Fragestellungen, bei denen Tests für nominalskalierte Daten erforderlich sind?
Zum Beispiel, um zu untersuchen:
- ob verschiedene Geschlechtergruppen unterschiedlich häufig in einer Stichprobe vertreten sind
- ob Versuchspersonen in der Experimentalbedingung häufiger mit “Ja” auf eine Frage antworten als die Personen in der Kontrollgruppe
Warum ist es wichtig, spezifische Tests für nominalskalierte Daten zu verwenden?
um gültige und aussagekräftige Ergebnisse zu erhalten, die den Charakter der Daten angemessen widerspiegeln
Was sind einige mögliche Anwendungen für Tests von nominalskalierten Daten in der Forschung?
- Bevölkerungsstatistiken
- politische Umfragen
- Marktforschung
- Studien zu sozialen Phänomenen
Was ist die Effektstärke für den χ2-Test ?
Die Effektstärke für den χ2-Test ist ϕ (gesprochen „Phi“)
Wie wird die Effektstärke für den χ2-Test berechnet?
Welche Voraussetzungen müssen erfüllt sein, um den χ2-Test anwenden zu können?
Die Voraussetzungen sind:
Unabhängigkeit: Jede Beobachtung ist unabhängig von den anderen Beobachtungen
Stichprobengröße: Es sollten mindestens fünf erwartete Häufigkeiten in jeder Zelle vorliegen
Was passiert, wenn die Voraussetzungen für den χ2-Test nicht erfüllt sind?
Wenn die Voraussetzungen nicht erfüllt sind:
- Bei Abhängigkeit zwischen den Gruppen wird der McNemar-χ2-Test angewendet
- Wenn die erwarteten Häufigkeiten in einer Zelle kleiner als 5 sind, sollte stattdessen der Fisher-Yates-Test verwendet werden
Welche Testverfahren werden verwendet, um Mittelwertsunterschiede zwischen Gruppen in der Psychologie zu untersuchen?
t-Tests = intervallskalierte und normalverteilte Daten
χ2-Test = nominalskalierte Daten
nichtparametrische Tests = nicht normalverteilte Daten
Unter welchen Bedingungen wird ein t-Test eingesetzt, und welche Arten von t-Tests gibt es?
Bei intervallskalierten und normalverteilten Daten
- Einstichproben-t-Tests
- Zweistichproben-t-Tests für unabhängige oder abhängige Stichproben
Was wird getan, wenn die Annahme der Varianzenhomogenität im t-Test verletzt ist?
Der Welch-Test wird angewendet, der keine Annahme der Varianzenhomogenität macht
Wie funktionieren bayesianische Entsprechungen zu den frequentistischen Testverfahren?
- Sie beruhen auf den gleichen Annahmen
- verwenden den Bayes-Faktor zum Vergleich von Null- und Alternativhypothese
Wann werden nichtparametrische Tests zur Überprüfung von Unterschiedshypothesen verwendet?
Wenn die Annahmen parametrischer Tests verletzt sind
> insbesondere bei nicht normalverteilten Daten
Was sind die Unterschiede zwischen parametrischen und nichtparametrischen Testverfahren?
Parametrische Tests:
- machen Annahmen über die Verteilung der Daten
- nutzen mehr Informationen
Nichtparametrische Tests:
- machen weniger Annahmen
- nutzen weniger Informationen
Welche nichtparametrischen Tests werden für unabhängige und abhängige Stichproben angewendet?
Mann-Whitney-U-Test -> unabhängige Stichproben
Wilcoxon-Vorzeichen-Test -> abhängige Stichproben
Welches Testverfahren wird verwendet, wenn die Daten nur nominalskaliert sind?
Der χ2-Test wird verwendet, um Unterschiedshypothesen zu überprüfen, wenn die Daten nur nominalskaliert sind
Skalenniveaus
Nominalskala:
- Einteilung in Kategorien ohne spezifische Reihenfolge
> z.B. Geschlecht, Farben
Ordinalskala:
- Einteilung in Kategorien mit einer bestimmten Reihenfolge
- ohne genauen Abstand
> z.B. Schulnoten, Ränge im Wettbewerb
Intervallskaliert:
- Reihenfolge mit gleichen Abständen zwischen den Werten, aber kein absoluter Nullpunkt
> z.B. Temperatur in Grad Celsius, Kalenderjahre
Welche Tests bei nominalskalierten Daten?
- Chi-Quadrat-Test
Welche Tests bei ordinalskalierten Daten?
- Mann-Whitney-U-Test,
- Wilcoxon-Vorzeichen-Rang-Test,
- Kruskal-Wallis-Test
Welche Tests bei intervallskalierten Daten?
- t-Test
- ANOVA (Varianzanalyse)
Bedingungen für parametrische Tests
- Normalverteilung: Daten sind normalverteilt
- Homogenität der Varianzen: Die Varianzen sind in den verschiedenen Gruppen gleich (Varianzhomogenität)
- Messniveau: Parametrische Tests werden in der Regel für Daten auf Intervall- oder Ratioskala verwendet, da diese Skalen gleichen Abstände zwischen den Messwerten haben
Was sind metrische Daten?
- sind Daten, die numerisch gemessen werden und die Eigenschaft haben, sowohl Abstände als auch Verhältnisse zwischen den Werten zu beschreiben
Zwei Kategorien:
- Intervallskala
- Verhältnisskala (Ratioskala)
Was ist eine Teststatistik und was können wir zu ihrer Verteilung sagen?
- ist eine numerische Zusammenfassung der Daten, die verwendet wird, um eine Hypothese zu testen
- wird durch eine spezifische Berechnung aus den Stichprobendaten gewonnen
> Dass entscheidende Kriterium für eine geeignete Teststatistik ist, dass ihre Verteilung unter der Nullhypothese bekannt ist
> Beispiele: t-Wert im t-Test, F-Wert in der ANOVA, Chi-Quadrat-Wert im Chi-Quadrat-Test, Z-Wert im Z-Test
- Cauchyverteilung
- Breiteparameter groß wählen
- Nur positive Werte der Cauchyverteilung
- Lageparameter der Cauchyverteilung auf 1 setzen
Zweistichproben t test n=42, welche df?
Zweichstichproben n1 + n2
df= n1 + n2 – 2
df= 21 + 21 – 2 = 40
Die Schritte beim Zweistichproben-t-Test für unabhängige Stichproben
- Hypothesen formulieren
- Daten sammeln
- Deskriptive Statistik berechnen
- Varianzhomogenität überprüfen
- Teststatistik berechnen
- Kritischen Wert und p-Wert bestimmen
- Entscheidung treffen
Wie viele Freiheitsgrade hat der Chi-Quadrat-Test?
Welcher Test wird bei N=25 in einer Studie zur Racial Bias mit vorher-nachher Messungen verwendet? Erkläre die Schritte.
t-Test für abhängige Stichproben:
Formel Cohens d bei Einstichproben z-Test / t-Test
Formel t für Einstichproben t-Test
Formel für die Berechnung der Rangsumme bei Wilcoxon-Vorzeichen-Test, wenn nur N gegeben ist (Achtung, Werte ohne Änderung zählen nicht mit!)
Welche Parameter definieren die Cauchy-Verteilung und was bedeuten sie?
Was sagt die Prior-Verteilung über
𝛿 aus? (Cauchy)
- Symmetrie: Negative und positive Werte sind gleich wahrscheinlich
- Konzentration: Meiste Wahrscheinlichkeit auf kleinen Werten, konservative Schätzung
- Einfluss von 𝑟: Kleinere r-Werte stärkerer Einfluss auf kleine Werte von 𝛿
Warum wird die Cauchy-Verteilung oft der Normalverteilung vorgezogen?
- Wahrscheinlichkeitsdichte in den Rändern: Gewicht auch auf extreme Effektstärken
- Mathematische Vorteile: Konsistenz im bayesianischen t-Test bei unendlicher Stichprobengröße
- Vergleich: Beide Verteilungen teilen ähnliche Eigenschaften, Cauchy ist jedoch robuster für extreme Werte
Was bedeutet Konsistenz im Kontext des bayesianischen t-Tests?
Formel(n) Chi-Quadrat-Test
Formel für Effektstärke von Chi-Quadrat-Test (hier kein Cohnes d!)