Statistik 2 Flashcards
Wie hängt der p-Wert bei statistischen Tests mit einem Stichprobenkennwert und der H0 zusammen?
Der p-Wert sagt vorraus, wie wahrscheinlich das Zustandekommen des vorliegenden Stichprobenkenntwerts unter Annahme der H0 ist. Ist diese WK gering, kann die H0 abgelehnt werden (fällt in den Ablehnungsbereich von 5 oder 1% der unwahrscheinlichsten Ereignisse).
Grenzen Sie absolute und relative Effektgröße voneinenader ab. Geben Sie je ein konkretes Beispiel, in dem eher absolute bzw. relative Effektgrößen verwendet werden.
Absolut: z.B. eine Differenz in Rohwerten (z.B. Größe, gewicht)
Relativ: z.B. in Standardabweichungen (Absolutwerte nicht aussagekräftig) - r, d, t, F, chi2 (IQ)
Beschreibung “Unbiasedness” von Populationsschätzern und zwei Beispiele
Unbiasedness = Erwartungstreue. Erwartungstreue ist eine Eigenschaft eines Schätzers. Er ist erwartungstreu, wenn sein Erwartungswert gleich dem wahren Wert des zu schätzenden Parameters ist.
Beispiel:
gut erfüllt: Mittelwert eines Merkmals bei sehr großer Stichprobe erwartungstreu
nicht gut erfüllt: Mittelwert eines Merkmals bei kleiner Stichprobe
Beschreibung “Resistence” von Populationsschätzern und zwei Beispiele
Resistence = Resistenz. Anfälligkeit gegenüber Ausreißern.
Beispiel:
mittlere Abweichung besser bzgl. Resistenz als Standardabweichung, da bei S die Abweichungen quadriert werden, Modalwert besser als Mittelwert
Beschreibung “Efficiency” von Populationsschätzern und zwei Beispiele
Efficiency = Präzision einer Schätzung, d.h. wie eng sich Kennwerte über viele Ziehungen hinweg um den Populationsparameter clustern (z.B. Mittelwert clustert enger als Median)
Beschreibung “Sufficiency” von Populationsschätzern und zwei Beispiele
Sufficiency = Erschöpfendheit. Wie gut der Parameter alle ihm zur Verfügung stehenden Informationen nutzt.
Beispiel:
gut erfüllt: Mittelwert
nicht gut erfüllt: Modelwert (hier “stecken nicht alle Werte drin”)
Warum benötigt man die t-Veteilung und nimmt nicht stattdessen die z-Verteilung für die entsprechnden Tests zu Mittelwertsvergleichen?
σ = sigma
Sigma (Streuung in der Population) ist meist unbekannt, s ist zwar ein erwartungstreuer Schätzer für sigma, s nährt sich sigma aber nur über unendlich viele Ziehungen an. Die Stichprobenkenntwertverteilung für s ist asymmetrisch, d.h. es liegen mehr Werte links der Mitte. Bei einer einzigen Ziehung würde der Mittelwert also unterschätzt werden. Die t-Verteilung gleicht diesen systematischen Fehler aus!
Was charakterisiert die Theorie von Neyman & Pearson gegenüber der von Fisher zum Signifikanztest?
Fischer: Ausgangspunkt ist die H0 - Berücksichtigung der Wahrscheinlichkeit, ob das vorliegende Ergebnis unter Annahme der H0 zustande gekommen sein könnte. Nicht signifikante Ergebnisse sollen nicht interpretiert werden. Es werden keine Aussagen darüber gemacht, wie groß die Chancen sind, einen vorhandenen Effekt zu entdecken. Wenn H0 nicht abgelehnt werden kann, weiß man nicht mehr als vorher (v.A. weiß man nicht, ob die H0 wahr ist!)
Neyman & Pearson: Fehler 1. und 2. Art werden unterschieden und der H0 wird die H1 entgegengesetzt.
Was besagt der zentrale Grenzwertsatz?
Die Summe (und der Mittelwert) zweier oder mehrerer unabhängiger Zufallsvariablen ist über viele (unendlich viele) Ziehungen normalverteilt.
Erläutern Sie das Prinzip des Boostrappings bzw. Resamplings anhand eines Mittelwertvergleichs zwischen zwei Stichproben. Verwenden Sie dabei den Begriff “Stichprobenkennwerteverteilung”.
Bootstrapping = Schaffung einer künstlichen Stichprobenkennwerteverteilung. Die Werte der vorliegenden Stichprobe werden immer wieder in einen Topf geworfen und neue, zufällige Sitchproben daraus gezogen.
SInd Standardfehler und Standardabweichung das gleiche? Wenn ja, warum? Wenn nein, warum nicht?
Nein, denn:
Standardfehler = Streuung der Kennwerte in der Stichprobenkennwertverteilung Standardabweichung = Merkmalsmessung in der Stichprobe
Besagt der p-Wert beim statistischen Test, wie wahrscheinlich die H0 ist? Wenn ja, warum? Wenn nein, was besagt der p-Wert dann?
Nein, der p-Wert sagt nur aus, wie wahrscheinlich das Auftreten der vorliegenden Statistik unter Annahme der H0 ist. Fällt diese WK unter 5%, kann die H0 abgelehnt werden.
Nennen Sie jeweils ein Beispiel für eine Wahrscheinlichkeitsverteilung und eine Wahrscheinlichkeitsdichteverteilung. Worin besteht der Unterschied?
Wahrscheinlichkeitsverteilung gibt an, wie sich die Wahrscheinlichkeiten aus die möglichen Werte einer Zufallsvariablen verteilen, z.B.: Binomialverteilung. Es handelt sich um abzählbare Ereignismengen.
Wahrscheinlichkeitsdichteverteilung: gibt die Wahrscheinlichkeit an, mit der eine Zufallsvariable einen Wert zwischen a und b annimmt, antspricht dem Inhalt der Fläche s unter dem Graph der Wahrscheinlichkeitsdichtefunktion f. Die Wahrscheinlichkeit für ein Ereignis ist “überabzählbar” (z.B. IQ_Wert 103,54) - also praktisch null, deswegen gibt man hier Warscheinlichkeitsdichten an (quasi die WK, dass ein IQ zwischen 103 und 104 auftritt - Normalveteilung)
Nennen Sie die Definition des Begriffs “Stichprobenkennwerteverteilung”
Stichprobenkennwerteverteilung = (auch: Testverteilung) WK-Verteilung für einen Stichprobenkennwert unter Annahme der H0
Nennen Sie die Definition des Begriffs “Ablehnungsbereich”
Bereich der unwahrscheinlichsten (extremsten) Stichprobenkennwerte unter Zufallsannahme: liegt ein Stichprobenkennwert in diesem Bereich, kann die Zufallsannahme abgelehnt werden - Annahme eines systematischen Effekts - H0 abgelehnt.
Nennen Sie die Definition des Begriffs “Zufallsannahme”
Zufallsannahme = Nullhypothese/H0 - Annahme, dass ein vorliegender Stichprobenkennwert durch einen unsystematischen Zufall zustande gekommen ist, es besteht kein signifikanter Unterschied (z.B. mehr als 5%).
Nennen Sie die Definition des Begriffs “Stichprobenkennwert”
Stichprobenkennwert = quantitative Größe, die charakteristische Merkmaler einer Stichprobenverteilung beschreibt. Kennwerte der zentralen Tendenz und der Dispersion werden unterschieden.
Nennen Sie die Definition des Begriffs “Zufallsstichprobe”
randomisierte Ziehung v. Individuen aus einer Gesamtpopulation
Inwiefern unterscheidet sich das gerichtete von dem ungerrichteten Testen?
Gerichteter Test = Abweichungen in nur eine Richtung sind von Interesse
Ungerichteter Test = Abweichungen des Mittelwerts sind in beide Richtungen bedeutsam
Je nach Fragestellung ergibt sich ein anderer Ablehnungsbereich bei gleichem Signifikanzniveau!
Welche Art von Verteilung wird benötigt, um Häufigkeiten eines Ereignisses mit zwei Ergebnisalternativen abzutragen? Welches Skalenniveau ist die Veraussetzung zur Verwendung dieser Verteilung?
Die Binomialverteilung, mindestens die Nominalskala
Erklären Sie die Logik statistischen Testens!
- Aufstellen einer Forschungshypothese
- Erhebnung einer Zufallsstichprobe
- (statistisch Testbare) Nullhypothese aufstellen
- Stichprobenkennwerteverteilung unter Annahme der H0 erstellen (Bootstrapping/Resampling)
- Vergleich, ob der Zufallsstichprobenwert in den Bereich der unwahrscheinlichsten/extremsten Bereiche fällt
- Entscheidung: wenn ja, wird H0 abgelehnt und die Forschungshypothese (H1) bestätigt
Beschreiben Sie kurz (1-2 Sätze), womit sich die Inferenzstatistik im Allgemeinen befasst.
Die Inferenzstatistik (schließende Statistik) zieht Rückschlüsse von der Stichprobe auf die Population und ermöglicht das Testen von Hypothesen.
Was besagt der p-Wert?
Wie wahrscheinlich das Zustandekommend der vorliegenden Statistik unter annahme der H0 ist.
Was sind alpha und beta-Fehler? Welche ist der “schlimmere” und warum?
Alpha-Fehler = H1 wird für wahr befunden, obwohl in Wirklichkeit die H0 gilt
Beta-Fehler = H0 wird fälschlicherweise für falsch befunden
Der Alpha-ehler ist der “schlimmere”; da er für die Wirklichkeit gravierendere Konsequenzen haben kann als eine Beibehaltung der H0 pbwohl die H1 gelten würde - siehe Medikamententests. Ist aber im Endeffekt auch individuell vom Forschungsgegenstand abhängig.
Was bedeutet Signifikanzniveau und welche konventionell festgelegten Grenzen werden in der Psychologie verwendet?
Signifikanzniveau = Irrtumswahrscheinlichkeit - die vorab festgelegte Wahrscheinlichkeit, einen alpha-Fehler zu begehen. Konventionell: 5% oder 1% Signifikanzniveau.
Was bedeutet interne Validität und wie wird sie noch genannt?
Auch CT/ceteris paribus = “alles andere vergleichbar”
Nur die UV verändert sich, alles andere bleibt gleich, Annahme dass Störvariablen kontrolliert werden. Wird erreicht durch “random assignment”
Was ist eine Standardnormalverteilung und wodurch unterscheidet sie sich von der Normalverteilung?
Standardnormalverteilung hat als Mittelwert immer = 0 und als Standardabweichung = 1, Normalverteilung nicht.
Warum ist es sinnvoll, die Standardnormalverteilung in der Inferenzstatistik zu verwenden?
Man muss dann nicht für alle möglichen Mittelwertsstandardabweichungs-Kombinationen separate Tabellen anlegen, Messwerte werden besser vergleichbar.
Was muss bei der z-Transformation einer Stichprobe in eine Standardnormalverteilung beachtet werden?
Eine z-Transformation „irgendeiner“ Stichprobe führt nicht zu einer Normalverteilung, es sei denn, sie wäre schon vorher normalverteilt.
Welche Kritik gibt es an Pearsons Chi-Quadrat?
- ) kein Testen gerichteter Hypothesen möglich
- ) Größere Kontingenztafeln sind schwer interpretierbar (Signifikanz schon erreicht, wenn eine Zelle aus der Reihe tanzt)
- ) Chi-Quadrat ist eine kontinuierliche Funktion, Häufigkeiten sind aber diskret verteilt – Chi-Quadrat ist für kleine Stichproben ungeeignet, da in diesem Fall stetige und kontinuierliche Verteilungen sehr unterschiedlich aussehen – bei kleinen Stichproben (E < 5) lieber Fischers exakter Test für 2x2 Tafeln!
Welcher Test ist für eine 2x2 Tafel mit gerichteter Hypothese zu verwenden?
Fischers exakter Test / Chi-Quadrat Test
Welche Voraussetzungen müssen gegeben sein, um Pearsons Chi-Quadrat-Test durchführen zu dürfen?
- ) E > 5
- ) ungerichtete Hypothese
- ) Unabhängigkeit der Beobachtungen (nicht der Variablen!)
- ) Inklusion von „nonocurrences“ beachten: kein Test mit nur einer Variable, da ich Gegen-/Vergleichsvariable benötige!
Geben Sie eine Definition für Wahrscheinlichkeit nach der analytischen Sichtweise (z.B. La Place).
Die Wahrscheinlichkeit eines Ereignisses einer Menge gleich wahrscheinlicher Fälle: Anzahl der für das Ereignis günstigen Ereignisse geteilt durch die Anzahl aller möglichen Ereignisse.
Geben Sie Beispiele für unabhängige, abhängige und sich wechselseitig ausschließende Ereignisse.
Abhängig: zwei Wähler, die in Wahlkabine die Wahl des anderen sehen können
Unabhängig: zwei Münzen, die nacheinander geworfen werden
Ausschließend: zwei Münzen, die aneinandergeklebt sind
Was besagen Kolmogorows drei Axiome?
1.) 0
Was besagen das Additions- und Multiplikationsgesetz?
Die Wahrscheinlichkeit für das gemeinsame Auftreten zweier unabhängiger Ereignisse erhält man durch Multiplikation der Einzelwahrscheinlichkeiten:
z.B. beim Würfeln 2 mal die 3: 1/6 * 1/6 = 1/36
Beschreiben Sie den Unterschied zwischen Wahrscheinlichkeit und Wahrscheinlichkeitsdichte.
Wahrscheinlichkeit gilt für diskrete Zufallsvariablen,
Wahrscheinlichkeitsdichte (Dichtefunktion) gilt für stetige Zufallsvariablen. Die Fläche unter der Dichtefunktion gibt dabei die Wahrscheinlichkeit an. Integral des ges. Definitionsbereichs muss immer 1 sein.
Grenzen Sie Permutationen, Kombinationen und Variationen voneinander ab und geben Sie für jeden Begriff ein Beispiel.
- Permutation: Mögliche Anordnungen einer bestimmten Zahl von Elementen, wobei die Reihenfolge eine Rolle spielt, z.B. die Anordnung von 20 Kindern in einer Reihe
- Variation: Mögliche Anordnungen von k Elementen aus n Gesamtelementen, wobei die Reihenfolge eine Rolle spielt, z.B. aus einem Kartenspiel nacheinander 5 Karten ziehen
- Kombination: Mögliche Auswahl von k Elementen aus n Gesamtelementen, wobei die Reihenfolge egal ist, z.B. Lottozahlen
Was besagt das Gesetz der großen Zahl?
Die relative Häufigkeit eines Zufallsergebnisses pendelt sich auf die theoretische Wahrscheinlichkeit eines Zufallsergebnisses ein, wenn man das Zufallsexperiment nur oft genug wiederholt.
Welche Voraussetzungen gelten für die Anwendung eines Chi-Quadrat-Tests?
- Mindestens nominal- oder ordinalskalierte Variablen
- erwartete Häufigkeit in jeder Kategorie muss mindestens 1 betragen
- Bei höchstens 20% der Kategorien darf die erwartete Häufigkeit unter 5 liegen, damit die Teststatistik näherungsweise der Chi-Quadrat-Verteilung folgt.
- Die Messungen müssen unabhängig voneinander sein.
- Die Stichprobe muss zufällig entnommen worden sein, und der Test darf nur auf Häufigkeiten angewendet werden, nie auf relative Werte (z.B. %-Angaben)
Welche Idee steckt hinter der Chi-Quadrat-Formel?
Der Chi Quadrat Wert wird aus der Summe der beobachteten Häufigkeiten minus der erwarteten Häufigkeiten berechnet (quadriert) und durch die erwartete Häufigkeit geteilt.
Was testet man mit einem Chi-Quadrat-Test?
Beim Chi Quadrat-Test werden Häufigkeiten verglichen. Man testet, ob die beobachtete Häufigkeitsverteilung sich von der erwarteten Häufigkeitsverteilung (unter Annahme der unter Nullhypothese angenommenen Gleichverteilung) unterscheidet, und: Unterscheidet sich die beobachtete Verteilung einer Variable von einer Normalverteilung?
Erläutern Sie die Probleme, die mit dem Chi-Quadrat-Test in Verbindung stehen.
- je größer die Stichprobe ist, desto eher werden auch kleine Unterschiede signifikant (sig. Ergebnis =/= Effekt)
- Test sagt nur aus, ob es Unterschiede gibt, nicht aber über die Richtung des Effekts (keine Aussage, ob die beobachteten Werte größer o. kleiner sind als die erwarteten)
- keine Aussage über die Stärke des Effekts (dafür bräuchte man Cramers V o. Kontingenzkoeffizienten C)
Wann verwendet man Fisher’s exakten Test und worin unterscheidet er sich vom Chi-Quadrat-Test?
Der Chi Quadrat Test ist nur ein näherungsweiser Test, weil die Prüfgröße nur näherungsweise der Chi Quadrat Verteilung entspricht. Den Fisher’s exakten Test verwendet man, wenn man herausfinden will, ob Zeilenvairable und Spaltenvariable unabhängig voneinander sind (was laut H0 stimmen würde). Bei kleinen Zellenhäufigkeiten kann der Chi Quadrat Test ungenau sein, Fisher’s exakter Test ist jedoch selbst dann genau.
Beschreiben Sie den Zusammenhang zwischen der Chi-Quadrat-Verteilung und der Normalverteilung.
Die Chi Quadrat Verteilung leitet sich aus der Summe von unabhängigen, quadrierten standardnormalverteilten Zufallsgrößen her.
Was bedeutet random sample und wie hängt es mit der externen Validität zusammen?
Bedeutet: „Zufallsstichprobe“ – externe Validität ist nur gegeben, wenn Untersuchungsergebnisse generalisierbar und repräsentativ sind. Durch ein random sample, oder die Zufallsziehung entsteht eine einfache Zufallsstichprobe, durch deren Untersuchung Rückschlüsse auf die Grundgesamtheit getroffen werden sollen. Durch die zufällige Zusammenstellung wird versucht, systematische Verzerrung (z.B. durch Geschlecht, Herkunft) auf die Ergebnisse zu vermeiden.
Was bedeutet random assignment und wie hängt es mit der internen Validität zusammen?
Bedeutet „zufällige Zuordnung“ und beschreibt die zufällige Zuweisung von Versuchspersonen zu verschiedenen Gruppen in einem Experiment (z.B. Versuchs- vs. Kontrollgruppe) mittels Randomisierung – z.B. mit einem Münzwurf oder einem random number generator. Diese zufällige Zuweisung stellt sicher, dass Unterschiede zwischen den Gruppen und innerhalb der Gruppen nicht systematisch zu Beginn des Experiments sind. Auf diese Weise können Unterschiede zwischen Gruppen zu Ende des Experiments sicherer den experimentellen Prozeduren zugeordnet werden. Random assignment dient also quasi der Sicherstellung interner Validität, um die Ergebnisse eines Experiments auf die Manipulation einer unabhängigen Variable zurückzuführen zu können und zu vermeiden, dass in Wirklichkeit die abhängigen Variablen der Grund für den Effekt sind könnten.
Was besagen Effektgrößen?
Effektgrößen machen Aussagen zum Ausmaß eines Behandlungseffekts oder die unterschiedliche Wirkung zweier Interventionen. Es ist ein standarisiertes Maß, das unterschiedliche Verfahren, Studien oder Interventionen miteinander vergleichbar machen soll.
Distanzmaß d = Abweichung der Mittelwerte normiert an der mittleren Standardabweichung (größeres d = Mittelwerte liegen weit auseinander). Wächst mit größerem Abstand der Mittelwerte und mit kleinerer Streuung, also auch größerem n, da dann kleinere Standardabweichung.