Statistik Flashcards
Welchen %-Wert hat der Bereich unter der Normalverteilung?
68,27%
Wie groß ist die Fläche unter der Normalverteilung?
1
Wie wird aus einer Normalverteilung eine Standardnormalverteilung
z-Transformation
Formel: 𝑧𝑖 = 𝑥𝑖 − 𝑥̅ / 𝑠𝑥
Merkmalsträger/
Statistische Einheiten
Objekte (meist Personen), an denen die interessierende Größe erfasst wird
Grundgesamtheit / Population
Menge aller für die Fragestellung relevanten Merkmalsträger
Stichprobe
untersuchte Teilmenge der Grundgesamtheit
Merkmal
hypothetisches/latentes Konstrukt
interessierende Größe
Variable
Operationalisierungen
manifeste Indikatoren
Fragebogen
Test
Interview
Merkmalsausprägung
konkreter Wert des Merkmals
Messen
Zuordnung von Zahlen zu Objekten auf Basis ihrer Merkmalsausprägungen
z.B. Körpergröße in cm;
Reaktionszeit in ms
Intelligenz in IQ
Skalentypen
Nominal
Ordinal
Intervall
Verhältnis
Absolut
-Skala
Formel für lineare Funktion
y = a*x+b
= Gerade im Koordinatensystem
wobei
y = vorhergesagter Wert
a= Steigung
b = y-Achsenabschnitt
Die Per-fiat Messung
fiat= lat = Es möge sein!
in psych. Forschungspraxis wird meist auf Überprüfung des Skalenniveaus verzichtet
es wird darauf vertraut, dass die geeignete Skala gewählt wurde
Rechtfertigungen: erfolgreiche Anwendung (IQ)
wenn Verteilungserwartung an die Daten erfüllt wird = all correct
wenn Verteilung abweicht - Skala ggf. falsch
Was versteht man unter einer Variablen?
Merkmale, die versch. Werte annehmen können (=Merkmalsausprägungen/Stufen)
Unabhängige Variable (UV)
vermutete Einflussgröße, die variiert/manipuliert wird um den Einfluss auf die abhängige Variable (AV) zu messen
auch: Treatment, Behandlung, Maßnahme
bsp. EG und KG - EG bekommt Kaffee; KG nicht -> Einfluss auf Konzentrationsleistung gemessen
Abhängige Variable (AV) auch Reaktionsvariable
Variable deren Veränderung infolge des Einflusses der UV gemessen wird
= Wirkung, die von der UV ABHÄNGT
(bsp. Konzentrationsleistung durch den Kaffee)
Das Summenzeichen
großes Sigma (griech. S)
der Index i heißt Summations/Laufindex
Der Wert über dem S zeigt die Anzahl der zu rechnenden Werte an
Häufigkeitsverteilungen
Arten von Häufigkeiten (6)
f = absolute Häufigkeit, mit der ein Wert auftritt
h = relative Häufigkeit (Anzahl Werte (f) geteilt durch Gesamtanzahl (n))
f% = prozentuale Häufigkeit - rel. Häufigkeit 100 (f/n100)
f kum= kumulierte absolute Häufigkeit = bis zum betrachteten Wert (einschließlich) aufsummierten absoluten Häufigkeiten
h kum= kumulierte relative Häufigkeit = bis zum betrachteten Wert (einschließlich) aufsummierten relative Häufigkeiten
f% kum = kumulierte prozentuale Häufigkeit = bis zum betrachteten Wert (einschließlich) aufsummierten prozentualen Häufigkeiten
100 * fkum/n = Prozentrang
Histogramm
Das Wesentliche ist, dass die Flächen
der Säulen den relativen Häufigkeiten entsprechen.
Statistische Kennwerte
Maßzahlen - kurz: Statistiken
Funktion: in zsmgefasster (aggregiert) Form Auskunft über Eigenschaften von Verteilungen geben
Was machen Lagemaße (auch Maße der zentralen Tendenz)?
repräsentieren die Lage einer Reihe von Messwerten
Streuungsmaße (auch Variabilitätsmaße)
geben Auskunft über die Verschiedenheit (einer Reihe) von Messwerten
Arten von Lagemaßen (3)
Modus (häufigster Wert)
Median (Wert genau in der Mitte; aufsteigend sortiert 50%)
arithmet. Mittel bzw. Mittelwert (Summe durch Anzahl aller Messwerte)
Arten von Streuungsmaßen (3)
Spannweite (auch Variationsbreite; Range)
= Differenz zw. Maximum & Minimum
Varianz (= Summe der quadrierten Abweichungen der Messwerte vom Mittelwert geteilt durch die Anzahl der Messwerte)
Bezeichnung: S²
Standardabweichung auch Streuung:
=Wurzel aus der Varianz = S
z-Transformationen
= lineare Transformation, mit der jede Verteilung in eine Verteilung mit MW 0 und Standardabweichung 1 überführt wird
ermöglicht relativen Vergleich von Variablenausprägungen, da Unterschiede im MW und Streuung “wegrelativiert” werden
(Bsp. von zwei Testergebnissen in zwei Fächern der PISA-Studie)
Korrelation
gibt die Richtung & Stärke eines linearen Zusammenhangs zweier Variablen an
Kovarianz
gibt nur Auskunft über die Richtung des Zusammenhangs (nicht der Stärke) von zwei Variablen (müssen dieselben Einheiten haben)
nicht-standardisierte Kennzahl - geringe Vergleichbarkeit
𝑐𝑜𝑣(𝑥,𝑦) = Σ(𝑥𝑖 − 𝑥̅) ∙ (𝑦𝑖 − 𝑦̅) / n
Bedeutung positives/negatives Vorzeichen der Kovarianz
positiv: wenn x steigt, steigt auch y und andersrum
negativ: wenn x steigt sinkt y
maximaler Wert ist Sx * Sy
(Bsp. Entfernung Arbeitsweg & Dauer)
Kovarianz in Korrelationskoeffizienten (= Korrelation)
𝑟(𝑥,𝑦) = 𝑐𝑜𝑣(𝑥,𝑦) / 𝑠𝑥 ∙ 𝑠𝑦
–> Bravais- Pearson oder Produkt-Moment-Korrelation
-zur Standardisierung der Kovarianz
-kann Werte zwischen -1 & +1 annehmen
Interpretation des Korrelationskoeffizienten (r-Wert)
-1 = perfekt negativer linearer Zusammenhang (oben links nach unten rechts)
+1 = perfekt positiver linearer Zusammenhang
(unten links nach oben rechts)
0 = kein Zusammenhang (Punktewolke)
Korrelation und Kausalität
eine Korrelation sagt nichts über die Ursache des Zusammenhangs aus, nur über Stärke (Wert) und Richtung (positives/negatives Vorzeichen)
Lineare Regression (= bivariate Regression zw. zwei intervallskalierten VAR)
- regressieren = von y auf x “zurückgehen”
durch Var X Var Y vorhersagen (wenn Zusammenhang besteht) - durch einfache lin. Reg keine Aussage über Kausalität möglich
-Vorhersagevariable = unabhängige Variable = Prädiktorvariable
vorherzusagende Variable = abhängige Variable = Kriteriumsvariable
Regressionsgleichung
𝑦̂𝑖 = 𝑎 + 𝑏 ∙ 𝑥𝑖
𝑦̂𝑖: vorhergesagter Wert
a: Schnittpunkt der Geraden mit der y-Achse
b: Steigung der Geraden
Ziel: Bestimmung einer Geraden, die den Gesamttrend aller Punkte am besten widergibt
Bei der linearen Regression wird die Gleichung
gesucht, für die die Summe der quadrierten Abweichungen
zwischen vorhergesagten und tatsächlichen Werten minimal
ist (Kriterium der kleinsten Quadrate):
Kriterium der kleinsten Quadrate
minimale Summe der quadrierten Abweichungen zw. vorhergesagten und tatschlichen Werten
zur Aufstellung der Geradengleichung
Regressionsresiduen
Abweichungen der beobachteten Werte von den vorhergesagten Werten
enthalten Anteile der AV, die durch die UV nicht erfasst wurden
Zerlegung der Kriteriumsvarianz
Varianz des Kriteriums (der AV)
Die Varianz der y-Werte setzt sich additiv aus der Varianz
der vorhergesagten 𝑦̂-Werte und der Varianz der Residuen
𝑦∗ zusammen also aus vorhersagbarem & unbekanntem:
𝑠𝑦² = 𝑠𝑦̂² + 𝑠𝑦∗²
Determinationskoeffizient
Varianzanteil der abhängigen Variablen, der mit der unabhängigen
vorhergesagt bzw. erklärt werden kann:
r² (x,y) = s²𝑦̂ / s²y
5 Grundgesamtheit / Population
bezeichnet die Menge aller
Elemente bzw. statistischen Einheiten (Personen, Objekte),
über die Aussagen getroffen werden sollen.
Stichprobe
bezeichnet eine nach einer bestimmten Auswahlmethode
gewonnene Teilmenge der Grundgesamtheit.
Inferenz
bedeutet, von einer Stichprobe mittels wahrscheinlichkeitstheoretisch
begründeter Methoden auf eine Grundgesamtheit
rückzuschließen.
Methoden sind: Schätzen & Testen von Parametern & Verteilungen
Bedingung: Daten aus Zufallsstichprobe
Zufallsstichproben
für Rückschluss von SP auf GG muss GG klar definiert sein
+ jedes Element hat die gleiche Auswahlwahrscheinlichkeit
Auswahltechniken für Zufallsstichproben
- Würfeln
- Direktes Auslosen (Losziehung)
- Indirektes Auslosen (Durchnummerierung, Zufallsziffern)
Gelegenheitsstichprobe
in der Psychologischen Praxis selten Zufallsstichproben (5%)
stattdessen Gelegenheitsstichprobe (z.B. über Aushänge)
damit ist Rückschluss auf GG ausgeschlossen
Rechtfertigung der klassischen Inferenz:
- psych. Var lassen sich auf individueller Ebene als Zufallsvariablen betrachten
- eine zufällige Zuteilung der Vpn in Experimenten erfolgt
geht nicht um stat. Rückschluss sondern Prüfung von Hypothesen
Repräsentativität
wenn SP Abbild der GG ist (möglich in erfassten Merkmalen wie Alter, Geschlecht, Einkommen etc.)
Kriterien:
Zufallsstichprobe
Genauigkeit der Schätzung (Varianz)
Was sind Kennwerte und Parameter?
Populationsparameter = unbekannte Kennwerte der Population, die mit Stichprobenkennwerten (Punktschätzern) geschätzt werden
Stichprobenkennwerte = Zufallsvariablen (Lateinischer Buchstabe)
Parameter = feste Werte von Populationsverteilungen (Griechischer Buchstabe)
Stichprobenkennwerte und dazugehörige Populationsparameter
Anteilswert
h / 𝜋 (pi)
Mittelwert
𝑥̅ / 𝜇 (my)
Varianz
s² / 𝜎² (Sigma)
Streuung
s / 𝜎 (Sigma)
Korrelation
r / 𝜌 (Rho)
Stichproben(kennwerte)verteilung
Verteilung aller möglichen Ausprägungen eines SP-Kennwerts
aus Pop. werden unendlich oft Zufalls SP gezogen und innerhalb jeder SP wird ein Kennwert berechnet
Verteilung dieser einzelnen Kennwerte = SP-Kennwerteverteilung
Wovon hängt die Verteilung eines Kennwerts ab?
- Verteilung der GG
- Typ des Kennwerts (MW, Varianz, Standardabweichung usw.)
- Stichprobenumfang
- Art der SP (Zufall ja / nein)
Diskrete Verteilungen
Kennwerteverteilung ist Voraussetzung für Inferenzstatistik
diskret: Binomial, hypergeometrische, Poisson - Verteilung
eine gewisse Menge, die man abzählen kann bsp. Kopf oder Zahl
Bernoulli-Variable
kann genau zwei Werte annehmen 0 & 1
Misserfolg vs. Erfolg
Wahrscheinlichekeit für 1 = 𝜋
Wahrscheinlichkeit für 0 = 1- 𝜋
z.B Münzwurf = 0,5
Bernoulli- Experiment
n-fache widerholte unabhängige Erfassung einer Bernoulli-Var
Anzahl x der Erfolge, die zwischen 0 und n liegen kann
(Bsp. Anzahl von Kopf )
Stetige Verteilung
wird mit Kurven symbolisiert
bsp. Normalverteilung
zwischen den Messwerten können unendlich viele weitere liegen bsp. Körpergröße
Fläche unter der Normalverteilung
Gesamtfläche unter der Kurve ist 1
= mit der Wahrscheinlichkeit von 1 tritt irgendein Ergebnis ein
innerhalb eines Intervalls (zwischen Wert a und b)
Eigenschaften der Normalverteilung
- glockenförmiger Verlauf
- Symmetrie (Modus, Median, MW sind gleich)
- zwischen den Wendepunkten befindet sich 2/3 der Gesamtfläche (68,3%)
- Verteilung nähert sich asymptotisch der x-Achse (= berührt die x-Achse nie)
Bedeutsamkeit der Normalverteilung
ist Grundlage zur Herleitung versch. Verteilungen (z.B., Chi², t-Verteilung, F’)
Binomial, Poisson nähern sich der Normalverteilung an (konvergieren)
Normalverteilung als theoretisches Modell für die Verteilung von…
Stichprobenkennwerten
Zufallsfehlern
empirischen Merkmalen
Standardnormalverteilung
durch z-Transformation kann jede Normalverteilung in eine Standardnormalverteilung überführt werden
dabei:
𝜇 = 0 und 𝜎 = 1 (MW & Streuung)
Tabelle zur Standardnormalverteilung
Spalte Fläche gibt die Fläche von - Unendlich bis z
Perzentile
ein Wert, der p% der Fläche einer Verteilung links abschneidet
50% Perzentil = Median z = 0
Wichtige Perzentile der Standardnormalverteilung
75% = 0,67
90% = 1,28
95% = 1,65
97,5% = 1,96
99% = 2,33
99,5% = 2,58
Erwartungswert & Erwartungtreue
Erwartungswert E = MW der SP-Verteilung eines Kennwertes 𝜃̂ (Theta Dach)
Dach = Kennzeichen für Schätzwert
Wann spricht man von einem erwartungstreuen Schätzer?
wenn der Erwartungswert dem Wert des Populationsparameters entspricht:
E(𝜃̂) = 𝜃,
Was sind (2) andere Begriffe für Erwartungs(un)treue?
Verzerrtheit
Bias
Wofür ist der MW ein erwartungstreuer Schätzer?
für 𝜇 (my)
E(𝑥̅) = 𝜇.
Wofür ist die Varianz (S²) ein erwartungstreuer Schätzer?
ist keiner:
E(𝑠²) ≠ 𝜎².
𝑠² unterschätzt 𝜎² systematisch um den Faktor (𝑛 − 1) ⁄ 𝑛.
muss korrigiert werden zu 𝜎̂² = 𝑠² ∙𝑛 /𝑛 − 1
E(𝜎̂²) = 𝜎².
Standardfehler des MW
= Streuung einer SP-Kennwerteverteilung
hängt von der Populationsvarianz (Streuung) und der SP-Größe ab 𝜎𝑥̅ = √𝜎² / 𝑛
oder 𝜎/ √𝑛
Je größer die Streuung, desto größer der SF
Je größer die SP, desto kleiner der SF
Schätzung des Standardfehlers des Mittelwertes
In der Regel ist die Varianz einer Population 𝜎² nicht bekannt.
Standardfehler aus den Stichprobendaten
geschätzt: 𝜎̂𝑥̅ = 𝜎̂ /√ 𝑛
Zentraler Grenzwertsatz
Verteilungen von Summen bzw. Mittelwerten aus Stichproben
des Umfangs n, die sämtlich derselben Grundgesamtheit
entnommen werden, gehen mit wachsendem
Stichprobenumfang in eine Normalverteilung über.
Konvention zum Zentralen Grenzwertsatz
𝑛 ≥ 30
für hinreichend, um die Stichprobenverteilung des
Mittelwertes als Normalverteilung zu behandeln, ungeachtet
der Verteilungsform der zugrunde liegenden Population.
Nur eine Konvention, NICHT Inhalt des Z GW-Satzes
6 Worauf zielen Schätzverfahren ab?
aus einer Zufallsstichprobe auf die Grundgesamtheit rückzuschließen
Welche zwei Formen von Schätzungen gibt es?
Punktschätzung (Angabe Wert)
Intervallschätzung (Angabe Wertebereich)
Punktschätzung
eine wesentliche Eigenschaft von Schätzern ist die Erwartungstreue (Unverzerrtheit)
Gleichung für Erwartungstreue
E(𝜃̂) = 𝜃.
Theta Dach = Schätzer für Theta (MW der Verteilung)
In der Psychologie häufig verwendete Schätzer
MW, Varianz, Korrelation, Anteilswert
Eigenschaften eines guten Schätzers
Effizienz = Variabilität eines Schätzers
Varianz sollte möglichst klein sein
Intervallschätzung
Genauigkeit einer Punktschätzung wird durchs Konfidenzintervall beurteilt
Definition Konfidenzintervall
Ein in Lage und Breite zufälliges Intervall, welches unbekannten Parameter mit einer Wahrscheinlichkeit von 1- 𝛼 umfasst
Konfidenzniveau
1 − 𝛼
Was ist der Ausgangspunkt zur Bestimmung des Konfidenzintervalls?
ein Punktschätzer für den unbekannten Parameter (MW, Varianz etc.)
Formel für das Konfidenzintervall
[𝑥̅ − 𝑧1−𝛼⁄2 ∙ 𝜎𝑥̅ ; 𝑥̅ + 𝑧1−𝛼⁄2 ∙ 𝜎𝑥̅]
Wenn Varianz der GG unbekannt
Schätzer der Varianz wird verwendet 𝜎̂𝑥̅ (Sigma Dach vom MW)
Formel dann mit t statt mit z-Werten:
[𝑥̅ − 𝑡1−𝛼⁄2 ∙ 𝜎̂𝑥̅ ; 𝑥̅ + 𝑡1−𝛼⁄2 ∙ 𝜎̂𝑥̅]
7
Welches ist das meiste verwendete inferenzstatistische Verfahren?
Signifikanztest
Was prüft der z-Test (Gauß-Test)?
ob eine SP zu einer GG mit
𝜇 = 𝜇0
gehört
Varianz dazu als bekannt vorausgesetzt
Was besagt die Nullhypothese (H0)?
Keine Veränderung, es bleibt wie es ist
Bsp. IQ:
Durchschnitts-IQ liegt wie bisher angenommen im Mittel bei 100
Was besagt die Alternativhypothese? (H1)
Veränderung, es bleibt nicht beim alten
Bsp. IQ:
Der IQ liegt im Durchschnitt über (oder unter) 100
kann gerichtet (rechts- oder linksseitig) oder ungerichtet formuliert sein & spezifisch oder unspezifisch
Was ist ein anderes Wort für Prüfgröße?
Teststatistik
Wie lautet die Formel zur Erfassung des empirischen z-Wertes, sofern die Varianz bekannt ist?
𝑧 𝑒𝑚𝑝 =
𝑥̅ − 𝜇0 /
𝜎𝑥
Wie ist die Bezeichnung fürs Signifikanzniveau?
= ist die Wahrscheinlichkeit für die
fälschliche Ablehnung der 𝐻0 .
α
Wie wird der Ablehungsbereich der H0 konstruiert?
1) Festlegung des Signifikanzniveaus (α)
2) Ablesen der z-krit aus der TAB
3) Errechnung des z-emp
Entscheidung für alpha 5% lautet dann:
𝑧 𝑒𝑚𝑝 > 1,65, Ablehnung der 𝐻0 und Annahme der 𝐻1.
Was ist der p-Wert?
= Überschreitungswahrscheinlichkeit
–> Fläche unter der H0 Verteilung, die der beobachtete Wert “in Richtung der H1 abschneidet”
Entscheidungsregel:
Falls p-Wert ≤α, Ablehnung der 𝐻0 .
Siehe Abb
Wahrscheinlichkeit eines Ergebnisses gegeben die H0
Wie sind die 5 Schritte eines Testablaufs?
1) Hypothesen festlegen
2) Testverfahren wählen
3) Stichprobengröße festlegen
4) Signifikanzniveau (α) festlegen
5) Ablehnungsbereich festlegen
Merksatz zum Signifikanzniveau
Das Signifikanzniveau α ist die Wahrscheinlichkeit für die
fälschliche Ablehnung der 𝐻0 .
Was ermittelt ein Signifikanztest?
die Wahrscheinlichkeit eines Ergebnisses bei Gültigkeit der H0
Was kann ein Signifikanztest nicht ermitteln?
die Wahrscheinlichkeit einer Hypothese
Merksatz zur H0 bzgl Formulierung
sie kann nur beibehalten oder verworfen werden, nicht angenommen
Tabelle zu Fehlerarten
Unter welchen “Kombinationen” wird eine richtige Entscheidung getroffen?
H0 - H0
H1 - H1
Tabelle zu Fehlerarten
Unter welchen “Kombinationen” wird eine falsche Entscheidung getroffen?
H0- H1 (β-Fehler
/Fehler 2. Art)
H1- H0 (α-Fehler / Fehler 1.Art)
Wodurch wird das Auftreten des alpha-Fehlers kontrolliert?
Auswahl alpha (Sign Niveau - je größer, desto größer Wahrscheinlichkeit für Auftreten)
Wodurch wird der beta-Fehler bestimmt?
Kann nur bestimmt werden, wenn H1 spezifisch formuliert wird
Worüber trifft statistische Signifikanz keine Aussage?
über die Größe und Relevanz eines Effekts,
da bei hinreichend großem n und entsprechend kleiner Varianz auch sehr kleine Unterschiede signifikant werden
Wann werden in der Population bestehende Unterschiede nicht signifikant?
wenn die SP zu klein ist, bleiben solche Unterschiede quasi unentdeckt
Welches Ziel wird mit der Teststärkeanalyse (power analysis) verfolgt?
die SPgröße an den erwarteten Unterschied/Effekt anpassen
Teststärke
-korrekte Entscheidung für H1
oder
-die Wahrscheinlichkeit, korrekterweise eine falsche Nullhypothese zurückzuweisen
1-ß
Effektgröße
-eine Möglichkeit, den Unterschied zwischen zwei Gruppen zu quantifizieren
-Während ein p-Wert uns sagen kann, ob es einen statistisch signifikanten Unterschied zwischen zwei Gruppen gibt oder nicht, kann eine Effektgröße uns sagen, wie groß dieser Unterschied tatsächlich ist.
Effektgrößen sind standardisierte Effeke nach dieser Formel:
Cohen’s d = (x1 – x2) / s
bzw. mit my und sigma auf Populationsebene
d =𝜇1−𝜇2 / 𝜎
= standardiesiertes Maß, welches den Abstand der Pop. MW in gemeinsamer Einheit angibt (der gemeinsamen Standardabweichung)
Was muss zur Erzielung einer geeigneten Teststärke festgelegt werden?
die Effektgröße und das n (g-power Tool)
Was gibt die Teststärke 1-ß an?
Die Wahrscheinlichkeit mit der ein Test einen best. vorhandenen Unterschied entdeckt
Unter welchen (4) Bedingungen wird die Teststärke größer?
Die Teststärke wird größer, wenn …
* alpha größer gewählt wird,
* n größer wird,
* der Effekt größer wird,
* die Merkmalsstreuung kleiner wird
und die jeweils anderen Determinanten konstant bleiben.
Welche Kritik am Signifikanztest gibt es?
Verbot am sog. Nullhypothesensignifikanztest, da H1 oft unspezifisch und H0 unplausibel formuliert wird
8
Spezielle Verteilungen, die sich von der Normalverteilung ableiten (3)
Chi² Verteilung (X²-Verteilung)
t-Verteilung
F-Verteilung
Was macht man in der Inferenzstatistik?
- anhand von Ergebnissen zufälliger Ereignisse auf GG schließen
- dadurch keine sicheren Aussagen, sondern Wahrscheinlichkeitsaussagen
- um diese treffen zu können muss die Verteilung des Kennwertes bekannt sein
- bsp. MW laut zentralem Grenzwertsatz bei zunehmender SP Göße normalverteilt
- bei anderen Kennwerten, die auf MW aufbauen wie z.B Varianz -> andere Verteilungen
Chi² Verteilung
eine theoretische Verteilung von Werten für eine Population (stetige Wahrscheinlichkeitsverteilung)
- definiert als die Verteilung der Summe der quadrierten Zufallsvariablen (unabhängig, standardnormalverteilt)
einziges Parameter: Freiheitsgrade (df- degrees of freedom)
- je mehr df desto eher ähnelt sie einer Normalverteilung
- gängige Tests auf Basis der Verteilung:
-Chi-Quadrat-Test auf Anpassungsgüte bzw. auf Unabhängigkeit.
Was sind Freiheitsgrade?
Gegeben einen Mittelwert, so lassen sich noch 𝑛 − 1 Werte
frei wählen (Freiheitsgrade), der 𝑛-te Wert ist dann durch
diese und den Mittelwert festgelegt.
t-Verteilung
verwendet um Sigma zu schätzen (Standardabweichung der Population)
- Verteilungsfunktion des T-Tests
- benötigte Parameter: Freiheitsgrade
- je mehr df, desto ähnlicher einer Standardnormalverteilung
-Varinaz ist >1
9
Unterschiedshypothesen t-Tests für Mittelwerte
Einstichproben-t-Test:
Test der Hypothese, dass ein Populationsmittel den Wert my0 hat
Unterschiedshypothesen: bsp. kogn. Leistung Test vor und nach einem Training
Voraussetzung ist eine normalverteilte SP (da sich die T-Verteilung aus dieser herleitet)
Varianz wird geschätzt
𝑡emp = 𝑥̅ − 𝜇0 / 𝜎̂𝑥̅ (mit df n-1)
Zur Prüfung ob eine SP zur Pop mit gegebenem Parameter gehört
Teststärkenanalyse mit G*Power
A priori-Analyse mit G*Power zur Festlegung der Stichprobengröße
in Abhängigkeit von alpha, beta und der Effektgröße d
am Beispiel des Einstichproben-t-Tests
Wann nimmt man den t-Test für unabhängige Stichproben?
Wenn man die Hypothese hat, dass die MW von zwei unabhängigen Populationen den gleichen Wert haben (Varianzen gleich)
Was testen t-Tests für abhängige Stichproben?
Die Hypothese, dass die MW von zwei abhängigen Pop gleich sind
Was bedeutet abhängige SP?
wenn die Werte paarweise einander zugeordnet sind d.h man davon ausgehen kann, dass sie korrelieren:
-AV wird bei denselben Pbn 2x erhoben (Messwiederholung)
-AV wird bei zueinander gehörigen Pbn erfasst (z.B. Zwillinge, WAS NOCH?)
-SP-Gruppen werden parallelisiert
Bsp. es soll getestet werden, ob ein motorisches Training dazu führt, dass Kinder früher laufen lernen - getestet an Zwillingen
Beim Signifikanztest wird nur die Wahrscheinlichkeit alpha des Fehlers 1. Art kontrolliert
Right or wrong?
right
Man entscheidet sich nicht FÜR die H0 sondern
nicht gegen sie
Die Beibehaltung der H0 ist nicht gleichzeitig die Ablehnung der H1
Wann ist beta besonders klein?
Je größer man alpha wählt
Was lässt sich zu extrem großen SP (>1000) sagen, wenn die H0 die Forschungshypothese ist?
Wenn man die Forschungshyothese als H0 formuliert hat und eine große SP wählt, werden die meisten Effekte signifikant
So kann man die Info von Nicht-Signifikanzen nutzen
Was besagt der zentrale Grenzwertsatz?
Dem zentralen Grenzwertsatz gemäß verteilen sich Mittelwerte
mit zunehmender Stichprobengröße normal.