Statistik Flashcards

1
Q

Welchen %-Wert hat der Bereich unter der Normalverteilung?

A

68,27%

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wie groß ist die Fläche unter der Normalverteilung?

A

1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wie wird aus einer Normalverteilung eine Standardnormalverteilung

A

z-Transformation

Formel: 𝑧𝑖 = 𝑥𝑖 − 𝑥̅ / 𝑠𝑥

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Merkmalsträger/
Statistische Einheiten

A

Objekte (meist Personen), an denen die interessierende Größe erfasst wird

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Grundgesamtheit / Population

A

Menge aller für die Fragestellung relevanten Merkmalsträger

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Stichprobe

A

untersuchte Teilmenge der Grundgesamtheit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Merkmal
hypothetisches/latentes Konstrukt

A

interessierende Größe
Variable

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Operationalisierungen
manifeste Indikatoren

A

Fragebogen
Test
Interview

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Merkmalsausprägung

A

konkreter Wert des Merkmals

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Messen

A

Zuordnung von Zahlen zu Objekten auf Basis ihrer Merkmalsausprägungen
z.B. Körpergröße in cm;
Reaktionszeit in ms
Intelligenz in IQ

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Skalentypen

A

Nominal
Ordinal
Intervall
Verhältnis
Absolut
-Skala

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Formel für lineare Funktion

A

y = a*x+b
= Gerade im Koordinatensystem
wobei
y = vorhergesagter Wert
a= Steigung
b = y-Achsenabschnitt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Die Per-fiat Messung

A

fiat= lat = Es möge sein!
in psych. Forschungspraxis wird meist auf Überprüfung des Skalenniveaus verzichtet
es wird darauf vertraut, dass die geeignete Skala gewählt wurde

Rechtfertigungen: erfolgreiche Anwendung (IQ)
wenn Verteilungserwartung an die Daten erfüllt wird = all correct
wenn Verteilung abweicht - Skala ggf. falsch

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was versteht man unter einer Variablen?

A

Merkmale, die versch. Werte annehmen können (=Merkmalsausprägungen/Stufen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Unabhängige Variable (UV)

A

vermutete Einflussgröße, die variiert/manipuliert wird um den Einfluss auf die abhängige Variable (AV) zu messen

auch: Treatment, Behandlung, Maßnahme
bsp. EG und KG - EG bekommt Kaffee; KG nicht -> Einfluss auf Konzentrationsleistung gemessen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Abhängige Variable (AV) auch Reaktionsvariable

A

Variable deren Veränderung infolge des Einflusses der UV gemessen wird
= Wirkung, die von der UV ABHÄNGT
(bsp. Konzentrationsleistung durch den Kaffee)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Das Summenzeichen

A

großes Sigma (griech. S)
der Index i heißt Summations/Laufindex

Der Wert über dem S zeigt die Anzahl der zu rechnenden Werte an

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Häufigkeitsverteilungen
Arten von Häufigkeiten (6)

A

f = absolute Häufigkeit, mit der ein Wert auftritt
h = relative Häufigkeit (Anzahl Werte (f) geteilt durch Gesamtanzahl (n))
f% = prozentuale Häufigkeit - rel. Häufigkeit 100 (f/n100)
f kum= kumulierte absolute Häufigkeit = bis zum betrachteten Wert (einschließlich) aufsummierten absoluten Häufigkeiten
h kum= kumulierte relative Häufigkeit = bis zum betrachteten Wert (einschließlich) aufsummierten relative Häufigkeiten
f% kum = kumulierte prozentuale Häufigkeit = bis zum betrachteten Wert (einschließlich) aufsummierten prozentualen Häufigkeiten
100 * fkum/n = Prozentrang

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Histogramm

A

Das Wesentliche ist, dass die Flächen
der Säulen den relativen Häufigkeiten entsprechen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Statistische Kennwerte

A

Maßzahlen - kurz: Statistiken
Funktion: in zsmgefasster (aggregiert) Form Auskunft über Eigenschaften von Verteilungen geben

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Was machen Lagemaße (auch Maße der zentralen Tendenz)?

A

repräsentieren die Lage einer Reihe von Messwerten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Streuungsmaße (auch Variabilitätsmaße)

A

geben Auskunft über die Verschiedenheit (einer Reihe) von Messwerten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Arten von Lagemaßen (3)

A

Modus (häufigster Wert)
Median (Wert genau in der Mitte; aufsteigend sortiert 50%)
arithmet. Mittel bzw. Mittelwert (Summe durch Anzahl aller Messwerte)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Arten von Streuungsmaßen (3)

A

Spannweite (auch Variationsbreite; Range)
= Differenz zw. Maximum & Minimum

Varianz (= Summe der quadrierten Abweichungen der Messwerte vom Mittelwert geteilt durch die Anzahl der Messwerte)
Bezeichnung: S²

Standardabweichung auch Streuung:
=Wurzel aus der Varianz = S

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
z-Transformationen
= lineare Transformation, mit der jede Verteilung in eine Verteilung mit MW 0 und Standardabweichung 1 überführt wird ermöglicht relativen Vergleich von Variablenausprägungen, da Unterschiede im MW und Streuung "wegrelativiert" werden (Bsp. von zwei Testergebnissen in zwei Fächern der PISA-Studie)
26
Korrelation
gibt die Richtung **& Stärke** eines linearen Zusammenhangs zweier Variablen an
27
Kovarianz
gibt nur Auskunft über die Richtung des Zusammenhangs (nicht der Stärke) von zwei Variablen (müssen dieselben Einheiten haben) nicht-standardisierte Kennzahl - geringe Vergleichbarkeit 𝑐𝑜𝑣(𝑥,𝑦) = Σ(𝑥𝑖 − 𝑥̅) ∙ (𝑦𝑖 − 𝑦̅) / n
28
Bedeutung positives/negatives Vorzeichen der Kovarianz
positiv: wenn x steigt, steigt auch y und andersrum negativ: wenn x steigt sinkt y maximaler Wert ist Sx * Sy (Bsp. Entfernung Arbeitsweg & Dauer)
29
Kovarianz in Korrelationskoeffizienten (= Korrelation)
𝑟(𝑥,𝑦) = 𝑐𝑜𝑣(𝑥,𝑦) / 𝑠𝑥 ∙ 𝑠𝑦 --> Bravais- Pearson oder Produkt-Moment-Korrelation -zur Standardisierung der Kovarianz -kann Werte zwischen -1 & +1 annehmen
30
Interpretation des Korrelationskoeffizienten (r-Wert)
-1 = perfekt negativer **linearer** Zusammenhang (oben links nach unten rechts) +1 = perfekt positiver **linearer** Zusammenhang (unten links nach oben rechts) 0 = kein Zusammenhang (Punktewolke)
31
Korrelation und Kausalität
eine Korrelation sagt nichts über die Ursache des Zusammenhangs aus, nur über Stärke (Wert) und Richtung (positives/negatives Vorzeichen)
32
Lineare Regression (= bivariate Regression zw. zwei intervallskalierten VAR)
- regressieren = von y auf x "zurückgehen" durch Var X Var Y vorhersagen (wenn Zusammenhang besteht) - durch einfache lin. Reg keine Aussage über Kausalität möglich -Vorhersagevariable = unabhängige Variable = Prädiktorvariable vorherzusagende Variable = abhängige Variable = Kriteriumsvariable
33
Regressionsgleichung
𝑦̂𝑖 = 𝑎 + 𝑏 ∙ 𝑥𝑖 𝑦̂𝑖: vorhergesagter Wert a: Schnittpunkt der Geraden mit der y-Achse b: Steigung der Geraden Ziel: Bestimmung einer Geraden, die den Gesamttrend aller Punkte am besten widergibt Bei der linearen Regression wird die Gleichung gesucht, für die die Summe der quadrierten Abweichungen zwischen vorhergesagten und tatsächlichen Werten minimal ist (Kriterium der kleinsten Quadrate):
34
Kriterium der kleinsten Quadrate
minimale Summe der quadrierten Abweichungen zw. vorhergesagten und tatschlichen Werten zur Aufstellung der Geradengleichung
35
Regressionsresiduen
Abweichungen der beobachteten Werte von den vorhergesagten Werten enthalten Anteile der AV, die durch die UV nicht erfasst wurden
36
Zerlegung der Kriteriumsvarianz
Varianz des Kriteriums (der AV) Die Varianz der y-Werte setzt sich additiv aus der Varianz der vorhergesagten 𝑦̂-Werte und der Varianz der Residuen 𝑦∗ zusammen also aus vorhersagbarem & unbekanntem: 𝑠𝑦² = 𝑠𝑦̂² + 𝑠𝑦∗²
37
Determinationskoeffizient
Varianzanteil der abhängigen Variablen, der mit der unabhängigen vorhergesagt bzw. erklärt werden kann: r² (x,y) = s²𝑦̂ / s²y
38
5 Grundgesamtheit / Population
bezeichnet die Menge aller Elemente bzw. statistischen Einheiten (Personen, Objekte), über die Aussagen getroffen werden sollen.
39
Stichprobe
bezeichnet eine nach einer bestimmten Auswahlmethode gewonnene **Teilmenge der Grundgesamtheit**.
40
Inferenz
bedeutet, von einer Stichprobe mittels wahrscheinlichkeitstheoretisch begründeter Methoden **auf eine Grundgesamtheit rückzuschließen.** Methoden sind: Schätzen & Testen von Parametern & Verteilungen Bedingung: Daten aus Zufallsstichprobe
41
Zufallsstichproben
für Rückschluss von SP auf GG muss GG klar definiert sein + jedes Element hat die gleiche Auswahlwahrscheinlichkeit
42
Auswahltechniken für Zufallsstichproben
* Würfeln * Direktes Auslosen (Losziehung) * Indirektes Auslosen (Durchnummerierung, Zufallsziffern)
43
Gelegenheitsstichprobe
in der Psychologischen Praxis selten Zufallsstichproben (5%) stattdessen Gelegenheitsstichprobe (z.B. über Aushänge) damit ist Rückschluss auf GG ausgeschlossen Rechtfertigung der klassischen Inferenz: - psych. Var lassen sich auf individueller Ebene als Zufallsvariablen betrachten - eine zufällige Zuteilung der Vpn in Experimenten erfolgt geht nicht um stat. Rückschluss sondern Prüfung von Hypothesen
44
Repräsentativität
wenn SP Abbild der GG ist (möglich in erfassten Merkmalen wie Alter, Geschlecht, Einkommen etc.) Kriterien: Zufallsstichprobe Genauigkeit der Schätzung (Varianz)
45
Was sind Kennwerte und Parameter?
Populationsparameter = unbekannte Kennwerte der Population, die mit Stichprobenkennwerten (Punktschätzern) geschätzt werden Stichprobenkennwerte = Zufallsvariablen (Lateinischer Buchstabe) Parameter = feste Werte von Populationsverteilungen (Griechischer Buchstabe)
46
Stichprobenkennwerte und dazugehörige Populationsparameter Anteilswert
h / 𝜋 (pi)
47
Mittelwert
𝑥̅ / 𝜇 (my)
48
Varianz
s² / 𝜎² (Sigma)
49
Streuung
s / 𝜎 (Sigma)
50
Korrelation
r / 𝜌 (Rho)
51
Stichproben(kennwerte)verteilung
Verteilung aller möglichen Ausprägungen eines SP-Kennwerts aus Pop. werden unendlich oft Zufalls SP gezogen und innerhalb jeder SP wird ein Kennwert berechnet Verteilung dieser einzelnen Kennwerte = SP-Kennwerteverteilung
52
Wovon hängt die Verteilung eines Kennwerts ab?
- Verteilung der GG - Typ des Kennwerts (MW, Varianz, Standardabweichung usw.) - Stichprobenumfang - Art der SP (Zufall ja / nein)
53
Diskrete Verteilungen
Kennwerteverteilung ist Voraussetzung für Inferenzstatistik diskret: Binomial, hypergeometrische, Poisson - Verteilung eine gewisse Menge, die man abzählen kann bsp. Kopf oder Zahl
54
Bernoulli-Variable
kann genau zwei Werte annehmen 0 & 1 Misserfolg vs. Erfolg Wahrscheinlichekeit für 1 = 𝜋 Wahrscheinlichkeit für 0 = 1- 𝜋 z.B Münzwurf = 0,5
55
Bernoulli- Experiment
n-fache widerholte unabhängige Erfassung einer Bernoulli-Var Anzahl x der Erfolge, die zwischen 0 und n liegen kann (Bsp. Anzahl von Kopf )
56
Stetige Verteilung
wird mit Kurven symbolisiert bsp. Normalverteilung zwischen den Messwerten können unendlich viele weitere liegen bsp. Körpergröße
57
Fläche unter der Normalverteilung
Gesamtfläche unter der Kurve ist 1 = mit der Wahrscheinlichkeit von 1 tritt irgendein Ergebnis ein innerhalb eines Intervalls (zwischen Wert a und b)
58
Eigenschaften der Normalverteilung
- glockenförmiger Verlauf - Symmetrie (Modus, Median, MW sind gleich) - zwischen den Wendepunkten befindet sich 2/3 der Gesamtfläche (68,3%) - Verteilung nähert sich asymptotisch der x-Achse (= berührt die x-Achse nie)
59
Bedeutsamkeit der Normalverteilung
ist Grundlage zur Herleitung versch. Verteilungen (z.B., Chi², t-Verteilung, F') Binomial, Poisson nähern sich der Normalverteilung an (konvergieren)
60
Normalverteilung als theoretisches Modell für die Verteilung von...
Stichprobenkennwerten Zufallsfehlern empirischen Merkmalen
61
Standardnormalverteilung
durch z-Transformation kann jede Normalverteilung in eine Standardnormalverteilung überführt werden dabei: 𝜇 = 0 und 𝜎 = 1 (MW & Streuung)
62
Tabelle zur Standardnormalverteilung
Spalte Fläche gibt die Fläche von - Unendlich bis z
63
Perzentile
ein Wert, der p% der Fläche einer Verteilung links abschneidet 50% Perzentil = Median z = 0
64
Wichtige Perzentile der Standardnormalverteilung
75% = 0,67 90% = 1,28 95% = 1,65 97,5% = 1,96 99% = 2,33 99,5% = 2,58
65
Erwartungswert & Erwartungtreue
Erwartungswert E = MW der SP-Verteilung eines Kennwertes 𝜃̂ (Theta Dach) Dach = Kennzeichen für Schätzwert
66
Wann spricht man von einem erwartungstreuen Schätzer?
wenn der Erwartungswert dem Wert des Populationsparameters entspricht: E(𝜃̂) = 𝜃,
67
Was sind (2) andere Begriffe für Erwartungs(un)treue?
Verzerrtheit Bias
68
Wofür ist der MW ein erwartungstreuer Schätzer?
für 𝜇 (my) E(𝑥̅) = 𝜇.
69
Wofür ist die Varianz (S²) ein erwartungstreuer Schätzer?
ist keiner: E(𝑠²) ≠ 𝜎². 𝑠² unterschätzt 𝜎² systematisch um den Faktor (𝑛 − 1) ⁄ 𝑛. muss korrigiert werden zu 𝜎̂² = 𝑠² ∙𝑛 /𝑛 − 1 E(𝜎̂²) = 𝜎².
70
Standardfehler des MW
= Streuung einer SP-Kennwerteverteilung hängt von der Populationsvarianz (Streuung) und der SP-Größe ab 𝜎𝑥̅ = √𝜎² / 𝑛 oder 𝜎/ √𝑛 Je größer die Streuung, desto größer der SF Je größer die SP, desto kleiner der SF
71
Schätzung des Standardfehlers des Mittelwertes
In der Regel ist die Varianz einer Population 𝜎² nicht bekannt. Standardfehler aus den Stichprobendaten geschätzt: 𝜎̂𝑥̅ = 𝜎̂ /√ 𝑛
72
Zentraler Grenzwertsatz
Verteilungen von Summen bzw. Mittelwerten aus Stichproben des Umfangs n, die sämtlich derselben Grundgesamtheit entnommen werden, gehen mit wachsendem Stichprobenumfang in eine Normalverteilung über.
73
Konvention zum Zentralen Grenzwertsatz
𝑛 ≥ 30 für hinreichend, um die Stichprobenverteilung des Mittelwertes **als Normalverteilung zu behandeln**, ungeachtet der Verteilungsform der zugrunde liegenden Population. Nur eine Konvention, NICHT Inhalt des Z GW-Satzes
74
6 Worauf zielen Schätzverfahren ab?
aus einer Zufallsstichprobe auf die Grundgesamtheit rückzuschließen
75
Welche zwei Formen von Schätzungen gibt es?
Punktschätzung (Angabe Wert) Intervallschätzung (Angabe Wertebereich)
76
Punktschätzung
eine wesentliche Eigenschaft von Schätzern ist die Erwartungstreue (Unverzerrtheit)
77
Gleichung für Erwartungstreue
E(𝜃̂) = 𝜃. Theta Dach = Schätzer für Theta (MW der Verteilung)
78
In der Psychologie häufig verwendete Schätzer
MW, Varianz, Korrelation, Anteilswert
79
Eigenschaften eines guten Schätzers
Effizienz = Variabilität eines Schätzers Varianz sollte möglichst klein sein
80
Intervallschätzung
Genauigkeit einer Punktschätzung wird durchs Konfidenzintervall beurteilt
81
Definition Konfidenzintervall
Ein in Lage und Breite zufälliges Intervall, welches unbekannten Parameter mit einer Wahrscheinlichkeit von 1- 𝛼 umfasst
82
Konfidenzniveau
1 − 𝛼
83
Was ist der Ausgangspunkt zur Bestimmung des Konfidenzintervalls?
ein Punktschätzer für den unbekannten Parameter (MW, Varianz etc.)
84
Formel für das Konfidenzintervall
[𝑥̅ − 𝑧1−𝛼⁄2 ∙ 𝜎𝑥̅ ; 𝑥̅ + 𝑧1−𝛼⁄2 ∙ 𝜎𝑥̅]
85
Wenn Varianz der GG unbekannt
Schätzer der Varianz wird verwendet 𝜎̂𝑥̅ (Sigma Dach vom MW) Formel dann mit t statt mit z-Werten: [𝑥̅ − 𝑡1−𝛼⁄2 ∙ 𝜎̂𝑥̅ ; 𝑥̅ + 𝑡1−𝛼⁄2 ∙ 𝜎̂𝑥̅]
86
7 Welches ist das meiste verwendete inferenzstatistische Verfahren?
Signifikanztest
87
Was prüft der z-Test (Gauß-Test)?
ob eine SP zu einer GG mit 𝜇 = 𝜇0 gehört Varianz dazu als bekannt vorausgesetzt
88
Was besagt die Nullhypothese (H0)?
Keine Veränderung, es bleibt wie es ist Bsp. IQ: Durchschnitts-IQ liegt wie bisher angenommen im Mittel bei 100
89
Was besagt die Alternativhypothese? (H1)
Veränderung, es bleibt nicht beim alten Bsp. IQ: Der IQ liegt im Durchschnitt über (oder unter) 100 kann gerichtet (rechts- oder linksseitig) oder ungerichtet formuliert sein & spezifisch oder unspezifisch
90
Was ist ein anderes Wort für Prüfgröße?
Teststatistik
91
Wie lautet die Formel zur Erfassung des empirischen z-Wertes, sofern die Varianz bekannt ist?
𝑧 𝑒𝑚𝑝 = 𝑥̅ − 𝜇0 / 𝜎𝑥
92
Wie ist die Bezeichnung fürs Signifikanzniveau?
= ist die Wahrscheinlichkeit für die fälschliche Ablehnung der 𝐻0 . α
93
Wie wird der Ablehungsbereich der H0 konstruiert?
1) Festlegung des Signifikanzniveaus (α) 2) Ablesen der z-krit aus der TAB 3) Errechnung des z-emp Entscheidung für alpha 5% lautet dann: 𝑧 𝑒𝑚𝑝 > 1,65, Ablehnung der 𝐻0 und Annahme der 𝐻1.
94
Was ist der p-Wert?
= Überschreitungswahrscheinlichkeit --> Fläche unter der H0 Verteilung, die der beobachtete Wert "in Richtung der H1 abschneidet" Entscheidungsregel: Falls p-Wert ≤α, Ablehnung der 𝐻0 . Siehe Abb Wahrscheinlichkeit eines Ergebnisses gegeben die H0
95
Wie sind die 5 Schritte eines Testablaufs?
1) Hypothesen festlegen 2) Testverfahren wählen 3) Stichprobengröße festlegen 4) Signifikanzniveau (α) festlegen 5) Ablehnungsbereich festlegen
96
Merksatz zum Signifikanzniveau
Das Signifikanzniveau α ist die Wahrscheinlichkeit für die fälschliche Ablehnung der 𝐻0 .
97
Was ermittelt ein Signifikanztest?
die Wahrscheinlichkeit eines Ergebnisses bei Gültigkeit der H0
98
Was kann ein Signifikanztest nicht ermitteln?
die Wahrscheinlichkeit einer Hypothese
99
Merksatz zur H0 bzgl Formulierung
sie kann nur **beibehalten** oder **verworfen** werden, **nicht angenommen**
100
Tabelle zu Fehlerarten Unter welchen "Kombinationen" wird eine richtige Entscheidung getroffen?
H0 - H0 H1 - H1
101
Tabelle zu Fehlerarten Unter welchen "Kombinationen" wird eine falsche Entscheidung getroffen?
H0- H1 (β-Fehler /Fehler 2. Art) H1- H0 (α-Fehler / Fehler 1.Art)
102
Wodurch wird das Auftreten des alpha-Fehlers kontrolliert?
Auswahl alpha (Sign Niveau - je größer, desto größer Wahrscheinlichkeit für Auftreten)
103
Wodurch wird der beta-Fehler bestimmt?
Kann nur bestimmt werden, wenn H1 spezifisch formuliert wird
104
Worüber trifft statistische Signifikanz keine Aussage?
über die **Größe und Relevanz eines Effekts**, da bei hinreichend großem n und entsprechend kleiner Varianz auch sehr kleine Unterschiede signifikant werden
105
Wann werden in der Population bestehende Unterschiede nicht signifikant?
wenn die SP zu klein ist, bleiben solche Unterschiede quasi unentdeckt
106
Welches Ziel wird mit der Teststärkeanalyse (power analysis) verfolgt?
die SPgröße an den erwarteten Unterschied/Effekt anpassen
107
Teststärke
-korrekte Entscheidung für H1 oder -die Wahrscheinlichkeit, korrekterweise eine falsche Nullhypothese zurückzuweisen 1-ß
108
Effektgröße
-eine Möglichkeit, den Unterschied zwischen zwei Gruppen zu quantifizieren -Während ein p-Wert uns sagen kann, ob es einen statistisch signifikanten Unterschied zwischen zwei Gruppen gibt oder nicht, kann eine Effektgröße uns sagen, **wie groß dieser Unterschied tatsächlich ist.** Effektgrößen sind standardisierte Effeke nach dieser Formel: Cohen’s d = (x1 – x2) / s bzw. mit my und sigma auf Populationsebene d =𝜇1−𝜇2 / 𝜎 = standardiesiertes Maß, welches den Abstand der Pop. MW in gemeinsamer Einheit angibt (der gemeinsamen Standardabweichung)
109
Was muss zur Erzielung einer geeigneten Teststärke festgelegt werden?
die Effektgröße und das n (g-power Tool)
110
Was gibt die Teststärke 1-ß an?
Die Wahrscheinlichkeit mit der ein Test einen best. vorhandenen Unterschied entdeckt
111
Unter welchen (4) Bedingungen wird die Teststärke größer?
Die Teststärke wird größer, wenn ... * alpha größer gewählt wird, * n größer wird, * der Effekt größer wird, * die Merkmalsstreuung kleiner wird und die jeweils anderen Determinanten konstant bleiben.
112
Welche Kritik am Signifikanztest gibt es?
Verbot am sog. Nullhypothesensignifikanztest, da H1 oft unspezifisch und H0 unplausibel formuliert wird
113
8 Spezielle Verteilungen, die sich von der Normalverteilung ableiten (3)
Chi² Verteilung (X²-Verteilung) t-Verteilung F-Verteilung
114
Was macht man in der Inferenzstatistik?
- anhand von Ergebnissen zufälliger Ereignisse auf GG schließen - dadurch keine sicheren Aussagen, sondern Wahrscheinlichkeitsaussagen - um diese treffen zu können muss die Verteilung des Kennwertes bekannt sein - bsp. MW laut zentralem Grenzwertsatz bei zunehmender SP Göße normalverteilt - bei anderen Kennwerten, die auf MW aufbauen wie z.B Varianz -> andere Verteilungen
115
Chi² Verteilung
eine theoretische Verteilung von Werten für eine Population (stetige Wahrscheinlichkeitsverteilung) - definiert als die Verteilung der Summe der quadrierten Zufallsvariablen (unabhängig, standardnormalverteilt) einziges Parameter: Freiheitsgrade (df- degrees of freedom) - je mehr df desto eher ähnelt sie einer Normalverteilung - gängige Tests auf Basis der Verteilung: -Chi-Quadrat-Test auf Anpassungsgüte bzw. auf Unabhängigkeit.
116
Was sind Freiheitsgrade?
Gegeben einen Mittelwert, so lassen sich noch 𝑛 − 1 Werte frei wählen (Freiheitsgrade), der 𝑛-te Wert ist dann durch diese und den Mittelwert festgelegt.
117
t-Verteilung
verwendet um Sigma zu schätzen (Standardabweichung der Population) - Verteilungsfunktion des T-Tests - benötigte Parameter: Freiheitsgrade - je mehr df, desto ähnlicher einer Standardnormalverteilung -Varinaz ist >1
118
**9** Unterschiedshypothesen t-Tests für Mittelwerte Einstichproben-t-Test: Test der Hypothese, dass ein Populationsmittel den Wert my0 hat
Unterschiedshypothesen: bsp. kogn. Leistung Test vor und nach einem Training Voraussetzung ist eine normalverteilte SP (da sich die T-Verteilung aus dieser herleitet) Varianz wird geschätzt 𝑡emp = 𝑥̅ − 𝜇0 / 𝜎̂𝑥̅ (mit df n-1) Zur Prüfung ob eine SP zur Pop mit gegebenem Parameter gehört
119
Teststärkenanalyse mit G*Power
A priori-Analyse mit G*Power zur Festlegung der Stichprobengröße in Abhängigkeit von alpha, beta und der Effektgröße d am Beispiel des Einstichproben-t-Tests
120
Wann nimmt man den t-Test für unabhängige Stichproben?
Wenn man die Hypothese hat, dass die MW von zwei unabhängigen Populationen den gleichen Wert haben (Varianzen gleich)
121
Was testen t-Tests für abhängige Stichproben?
Die Hypothese, dass die MW von zwei abhängigen Pop gleich sind
122
Was bedeutet abhängige SP?
wenn die Werte paarweise einander zugeordnet sind d.h man davon ausgehen kann, dass sie korrelieren: -AV wird bei denselben Pbn 2x erhoben (Messwiederholung) -AV wird bei zueinander gehörigen Pbn erfasst (z.B. Zwillinge, WAS NOCH?) -SP-Gruppen werden parallelisiert Bsp. es soll getestet werden, ob ein motorisches Training dazu führt, dass Kinder früher laufen lernen - getestet an Zwillingen
123
Beim Signifikanztest wird nur die Wahrscheinlichkeit alpha des Fehlers 1. Art kontrolliert Right or wrong?
right
124
Man entscheidet sich nicht FÜR die H0 sondern
nicht gegen sie Die Beibehaltung der H0 ist nicht gleichzeitig die Ablehnung der H1
125
Wann ist beta besonders klein?
Je größer man alpha wählt
126
Was lässt sich zu extrem großen SP (>1000) sagen, wenn die H0 die Forschungshypothese ist?
Wenn man die Forschungshyothese als H0 formuliert hat und eine große SP wählt, werden die meisten Effekte signifikant So kann man die Info von Nicht-Signifikanzen nutzen
127
Was besagt der zentrale Grenzwertsatz?
Dem zentralen Grenzwertsatz gemäß verteilen sich Mittelwerte mit zunehmender Stichprobengröße normal.