Statistik II Flashcards

1
Q

Wie entsteht der Beta-Fehler?

A
  • geringe Stichprobengröße -> dadurch großer Standardfehler

- zufällige Stichproben werden gezogen -> zwei ungünstige Stichproben werden gezogen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Erkläre den Beta-Fehler

A
  • Beibehaltung der Nullhypothese obwohl sie nicht richtig ist
  • Fehler 2. Art
  • Test zeigt keinen signifikanten Unterschied obwohl es einen gibt
  • kann bei Planung der Untersuchung beeinflusst werden
  • Eine Alarmanlage gibt Keinen Alarm trotz Einbruchs
  • Ein Test für Depressionen ist negativ obwohl Depression vorliegt
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Erkläre den Alpha-Fehler

A
  • Ablehnung der Nullhypothese obwohl diese richtig ist
  • Fehler 1. Art
  • Entsteht wenn die Nullhypothese in der Population gilt und diese fälschlicherweise abgelehnt wird
  • Test zeigt einen signifikanten Unterschied obwohl es keinen gibt
  • Eine Alarmanlage gibt einen Alarm ohne Einbruch
  • Test schlägt positiv auf Depression an obwohl keine vorliegt
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Welche Gefahr ergibt sich beim Hypothesentesten?

Nenne beide Fehlerarten

A
  • Gefahr einen falschen Schluss von Stichprobenparametern auf Populationsparameter zu ziehen
  • Alpha- und Beta-Fehler
  • beide Fehlerarten hängen zusammen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was versteht man unter einer zweiseitigen Testung?

A
  • ergibt sich aus einer ungerichteten Hypothese
  • keine Aussage über die Richtung möglich
  • Differenzen müssen groß genug sein um signifikant zu sein
  • Fläche von 5% wird an beiden Enden der Verteilung verteilt (jeweils 2,5%)
  • Vorteil: explorativ können Unterschiede getestet werden, auch ohne ausreichende Grundlage für gerichtete Hypothese
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was versteht man unter einer einseitigen Testung?

A
  • liegt einer gerichteten Hypothese zugrunde
  • Richtung des Mittelwertunterschieds wird aus z.B. Voruntersuchung abgeleitet
  • Annahmebereich liegt somit auf einer Seite (Richtung) der Verteilung
  • Vorteil: Unterschiede bei einseitiger Testung werden schon bei geringeren Differenzen signifikant als bei zweiseitiger
  • als wissenschaftlicher angesehen, gerichtete Hypothesen sind aus Literatur abgeleitet
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wann wird die H0 verworfen?

A
  • Differenz der beiden Stichprobenparameter liegen außerhalb des Beibehaltungsbereich der Nullhypothese -> H1 wird angenommen
  • a-Niveau legt Grenzwert fest, der quasi maximale Mittelwertdifferenz zur Aufrechterhaltung der Nullhypothese erlaubt
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wann wird die H0 beibehalten?

A
  • Stichproben unterscheiden sich nicht signifikant -> wenn Differenz der beiden Stichprobenmittelwerte so gering ist, dass sie innerhalb des Annahmebereichs liegt
  • Stammen aus identischen Populationen mit Mittelwert u
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wie wird das a-Niveau festgelegt?

A
  • Irrtumswahrscheinlichkeit liegt in der Regel bei 5% ( 1% oder .1% ebenfalls möglich)
  • Höhe des a-Niveaus wird immer beim Aufstellen der Hypothese festgelegt und darf nachträglich nicht mehr verändert werden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was ist das Nutzen des a-Niveaus?

A
  • wichtig für Beibehaltung / Ablehnung der Nullhypothese

- durch vorheriges Festlegen des a-Niveaus wird der Fehler 1. Art kontrolliert

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Definieren Sie das a-Niveau / Signifikanzniveau a

A
  • legt, in Abhängigkeit von Stichprobengröße und zu Grunde liegender theoretischer Verteilung, eine Fläche unter der Verteilungskurve (einen Grenzwert) für ein Konfidenzintervall fest
  • liegt der ermittelte Kennwert außerhalb dieses Konfidenzintervalls, so wird die H0 verworfen und die H1 angenommen
  • das a-Niveau ist die Wahrscheinlichkeit, die vom Forschenden festgelegt wird, mit der Ablehnung der H0 bei einem Signifikanztest zu einem Fehler 1. Art führt
  • > also die obere Grenze, für die von Forschenden tolerierten Fehler, mit dem H0 fälschlicherweise abgelehnt wird

-je kleiner das Signifikanzniveau alpha, desto kleiner die Teststärke

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Nennen Sie das Gerüst, wie man eine Hypothese formuliert

A

-Es sei μ1 die mittlere (…) in der Population der (…) und es sei μ2 die mittlere (…) in der Population der (…)

-Dann gilt:
->H0: μ1 = μ2
und
->H1: μ1 ≠ μ2 ( ungerichtet )
oder
->H1: μ1 > μ2 bzw. μ1 < μ2 ( gerichtet )
bei einem a-Niveau von 5%

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Erläutere die grundlegende Idee der Inferenzstatistik in 6 Schritten

A
  1. Es gibt für ein untersuchtes Merkmal einen bestimmten Populationsmittelwert ux
  2. Mittlerwerte zufällig aus der Population gezogener Stichproben streuen um Populationsmittelwert ux -> begründet mit zentralem Grenzwert. Hierdurch kann theoretische Verteilung der Kennwerte definiert werden sowie statistische Aussagen unter Voraussetzung von H0 möglich
  3. Wenn zwei Stichprobenmittelwerte sehr ähnlich:
    - sehr wahrscheinlich, dass sie aus identischen Populationen stammen
    - beide Stichprobenmittelwerte dann gute Schätzer für Populationsparameter ux
  4. Wenn beide Stichprobenmittelwerte sehr unterschiedlich: stammen möglicherweise nicht aus identischer Population.
    Je größer Differenz zwischen x1 und x2, desto unwahrscheinlicher, dass sie aus gleicher Population stammen
  5. Mit Wahrscheinlichkeitsverteilung wird die bedingte Wahrscheinlichkeit für die Differenz der Stichprobenmittelwerte bei Gültigkeit H0 berechnet -> Erwartungswert für Wahrscheinlichkeit liegt bei 0
  6. Liegt die berechnete Wahrscheinlichkeit der H0 unter gewissem Grenzwert (a-Niveau), so ist die beobachtete Differenz nicht mit der Nullhypothese zu vereinbaren
    - > somit stammen die Stichproben nicht aus identischen Population, sondern aus unterschiedlichen Populationen, die sich signifikant unterscheiden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Sollte besser eine gerichtete oder eine ungerichtete Alternativhypothese verwendet werden?

A

Sinne der beiden Hypothesen wird kontrovers diskutiert

  • Gerichtete: gelten wissenschaftlicher, weil theoretische Vorannahme notwendig ist
  • Ungerichtete: exploratives Vorgehen: unwissenschaftlicher, da mit geringerem theoretischen Hintergrund empirische Daten untersucht werden

-generell gilt: mit explorativem Vorgehen darf nie Mangel an Vorüberlegungen und theoretischer Fundierung kaschiert werden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Erläutern Sie eine gerichtete Alternativhypothese

A
  • theoriegeleitete Vorgehensweise (Auf Basis von vorherigen Untersuchungen bzw. theoretischen Vorüberlegungen)
  • gibt Richtung des Unterschieds zwischen Stichprobenkennwerten an
  • vor Datenerhebung wird bestimmt in welcher Stichprobe der höhere Wert erwartet wird
  • geht Differenz nachher in andere Richtung, MUSS Nullhypothese beibehalten werden
  • höherer Stellenwert als ungerichtete Alternativhypothese
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Erläutern Sie eine ungerichtete Alternativhypothese

A

-Exploratives Vorgehen: keine Aussage über Richtung des Unterschieds, nur, dass Unterschied zwischen zwei Stichprobenkennwerten vorhanden ist
(Nur Existenz des Unterschieds wird untersucht)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Erläutern Sie was eine Alternativhypothese ist

A
  • Eine Positivhypothese
  • besagt, dass ein Unterschied oder Zusammenhang in der Population existiert
  • sollte immer aus Theoriegebäude (Vorstudie & Literatur) abgeleitet
  • H1
  • wenn H0 nicht gültig, dann müssen H1 gültig sein
  • Unterscheidung zwischen gerichteter und ungerichteter Hypothese
  • Komplementär: Nullhypothese
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Erläutern Sie was eine Nullhypothese ist

A
  • eine Negativhypothese
  • H0
  • nimmt an: es gibt keine Zusammenhänge / Unterschiede in der Population
  • Annahme: Mittelwerte oder Zusammenhänge sind nur zufällig entstanden bei Stichprobenziehung
  • Komplementär: Alternativhypothese
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Hypothesen nennen und wie sie zueinander stehen

A
  • Nullhypothese und Alternativhypothese
  • schließen sich gegenseitig aus, decken zusammen alle möglichen Fälle ab
  • Grundlage immer Nullhypothese. Nur wenn Gültigkeit der Nullhypothese sehr unwahrscheinlich
  • > Alternativhypothese angenommen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Definieren Sie Hypothesenprüfung

A

-inferenzstatistische Hypothesenprüfung erlaubt Aussagen über Gültigkeit von Hypothesen in einer Population aus welcher die untersuchten Stichproben zur Hypothesenprüfung gezogen wurden.
Es werden über Stichprobenkennwerte die Populationskennwerte geschätzt und mit diesen Schätzungen dann Hypothesenprüfungen durchgeführt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Was ist die Aufgabe / das Ziel der Hypothesenprüfung?

A
  • induktives Schließen von einer Stichprobe auf die Population
  • beruht auf dem Prinzip der Hypothesentestung
  • mit Hilfe der Inferenzstatistik schätzen wir ab, wie wahrscheinlich ein gefundenes Ergebnis unter einer gegebenen Hypothese ist
  • in der Inferenzstatistik wird geprüft ob die beobachteten Daten mit den theoriegeleiteten Erwartungen vereinbar sind
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Wie können a- Fehler und ß-Fehler minimiert werden?

A

durch:

  • Erhöhung des Stichprobenumfangs
  • gerichtete Testung
  • ein teststarkes Verfahren
  • eine geringe Merkmalsstreuung
  • einen hohen Mittelwertunterschied
  • hohes a-Niveau kann der ß-Fehler verdrängt werden
  • der a-Fehler kann nach der Datenerhebung nicht mehr beeinflusst werden, da er vor der Untersuchung zu definieren ist
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Wie sollte das Verhältnis von a-Fehler und ß-Fehler sein?

A

Faustregel: 4:1
(a-Fehler: 5% / ß-Fehler: 20% oder
a-Fehler: 1 % / ß-Fehler 4%)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Was versteht man unter Teststärke?

A
  • ist über 1-ß definiert
  • stellt die Wahrscheinlichkeit dar, einen Effekt zu finden, wenn er existiert (1-Beta)
  • anders formuliert: stellt die Wahrscheinlichkeit dar, mit der ein Signifikanztest zugunsten der Alternativhypothese (H1) unterscheidet unter der Bedingung, dass der besagte Effekt wirklich in der Population vorliegt
  • auch als Trennschärfe oder power bezeichnet
  • sie verläuft gegenläufig zum ß-Fehler
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Welche Möglichkeiten gibt es eine höhere Teststärke zu erzielen?

A

-Differenz der Mittelwerte (u1-u2, je größer, desto größer die Teststärke)
-Stichprobenumfang (je größer N, desto größer Teststärke)
-Merkmalsstreuung (je kleiner, desto größer Teststärke)
Teststärke ist bei einseitiger Testung größer
-Höhe des a-Niveaus (je größer, desto größer Teststärke)
-Höhe des ß-Fehlers (gegenläufig zur Teststärke - je kleiner ß-Fehler)
-Stichprobe abhängig vs. unabhängig (bei abhängigen ist Teststärke größer)
-Auswahl des statistischen Testverfahrens
-Größe des statistischen Effekts

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Was versteht man unter einer unabhängigen Stichprobe?

A
  • Zuordnung eines Individuums zu einer Stichprobe ist nicht von Zuordnung eines Individuums zu anderer Stichprobe beeinflusst
  • Bsp: Ziehen der Stichprobe A hat keinen Einfluss auf Ziehung der Stichprobe B
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Was versteht man unter einer abhängigen Stichprobe?

A
  • Zusammenstellung einer Stichprobe hat Einfluss auf Zusammenstellung der zweiten Stichprobe
  • Bsp: Arbeitszufriedenheit vor und nach der Umstrukturierung -> es werden Messwertpaare gebildet. Daten der ersten Messung mit Daten der zweiten Messung werden bspw. verknüpft
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Was ist die Effektgröße + Formel?

A
  • Ist die Differenz zwischen 2 Messwerten, die an Streuung relativiert wird
  • Effektgröße ist gegeben mit: d = u1-u2 / ox
  • über die Effektgröße kann festgestellt werden ob ein statistischer Effekt auch eine praktische Relevanz hat
  • Einteilung der Effektgröße nach Cohen: kleiner Effekt (d >= 20), mittlerer Effekt (d >= 50), großer Effekt (d <= 80)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Nennen Sie die Faktoren, die den ß-Fehler beeinflussen (a-priori)

A

a-priori zu fällende statistische Entscheidungen über:

  • Höhe des a-Niveaus (je höher a-Niveau, desto geringer ß-Fehler)
  • ein- oder zweiseitige Testung: Wert für ß-Fehler bei zweiseitiger Testung Höher, da kritischer Testwert höher ausfällt
  • Teststärke (1-ß): je höher das Skalenniveau, desto höher die Teststärke -> ß-Fehler gegenläufig zur Teststärke.

Alle Faktoren, die ß-Fehler senken, erhöhen Teststärke

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Nennen Sie die Faktoren, die den ß-Fehler beeinflussen (Versuchsplanerische Entscheidung)

A

Versuchsplanerische Entscheidung:

  • Homogenität der Merkmalsverteilung (=Streuung des Merkmals ox): je geringer Merkmal streut, desto geringer fällt der ß-Fehler aus
  • Stichprobenumfang: je größer die Stichprobe, desto geringer ist der ß-Fehler (da Stichprobengröße den Standardfehler beeinflusst)
  • Größe des statistischen Effekts: je größer der statistische Effekt, desto geringer ist der ß-Fehler
  • abhängige vs. unabhängige Stichprobe: abhängig=geringere ß-Fehler, weil hier Unterschied zwischen 2 Stichprobenkennwerten nur auf Untersuchungsbedingungen rückführbar. Bei 2 unabhängigen können bspw. Mittelwertunterschiede durch nicht zufällige Ziehung der Gruppen rückführbar sein
  • > alle Faktoren, die den ß-Fehler senken, erhöhen automatisch die Teststärke
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

Erläutere die Höhe des Alpha-Niveaus im Bezug auf die Beeinflussung des Beta-Fehlers

A
  • a-Fehler und ß-Fehler verhalten sich gegenläufig zueinander -> deshalb a-Niveau nicht niedrig ansetzen (niedriges a-Niveau hat höheren kritischen Testwert und höhere Anforderung an Stichprobengröße)
  • niedriges a-Niveau -> höhere Werte für ß-Fehler
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

Erläutern Sie die Homogenität der Merkmalsverteilung in Bezug auf die Beeinflussung des Beta-Fehlers

+Beispiel Homogenität

A

=Streuung des untersuchten Merkmals 0x

  • je geringer Streuung, desto geringer ß-Fehler
  • Bsp: Versuchsperson mit geringstem Gewicht wurde aus Diätprogramm ausgeschlossen (Ausreißer) -> Einfluss auf Streuung (wird geringer -> Werte für ß-Fehler wird geringer)
  • Wenn Stichproben mit homogener Merkmalsverteilung untersucht werden, ist die Wahrscheinlichkeit für das Finden signifikanter Mittelwertsdifferenzen größer, als bei Stichproben mit heterogener Merkmalsverteilung
  • Standardschätzfehler wird geringer

Beispiel: Für Test Reaktionszeit nur Studenten nehmen, da diese etwa das gleiche Alter haben (Reaktionszeit nimmt im Alter zu)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

Erläutern Sie die Größe des statistischen Effekts (μ1-μ2) in Bezug auf die Beeinflussung des ß-Fehlers

A
  • je größer die Differenz zwischen den beiden Mittelwerten ist, desto geringer ist der ß-Fehler
  • Bspw: durch Verlängerung der Diät (Intervention) -> Mittelwertdifferenz erhöht sich bspw. um 5 KG
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

Erläutern Sie den Einfluss von abhängigen vs. unabhängigen Stichproben auf den ß-Fehler

A
  • ß-Fehler wird bei unabhängigen Stichproben größer als bei abhängigen
  • Mittelwertdifferenz bei unabhängigen deshalb konservativer interpretiert (weil andere Faktoren die Mittelwertfdifferenz verursachen konnten z.B. Stichprobenziehung)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

Erläutern Sie die Teststärke (1-ß) in Bezug auf die Beeinflussung des ß-Fehlers

A
  • verschiedene statistische Prüfverfahren haben unterschiedliche Effizienzen (abhängig vom Skalenniveau)
  • je höher Skalenniveau, desto geringer Wert für ß-Fehler
  • > immer möglichst hohes Skalenniveau wählen, weil Teststärkstes Verfahren
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q

Was versteht man unter optimalen Stichprobenumfang?

+Einflüsse

A
  • a-priori festlegen um praktische Durchführbarkeit in Bezug auf Stichprobe f Studie zu hinterfragen
  • gibt an, welche Stichprobengröße notwendig ist, um bei gegebenem a-Fehler und Teststärke sicherzustellen, dass ein Effekt gefunden werden kann und umgekehrt, sehr kleine Effekte, die keine praktische Bedeutung haben, nicht signifikant werden
  • bei Planung der Untersuchung schon sehr relevant
  • vor Datenerhebung muss immer optimaler Stichprobenumfang ermittelt werden
  • stellt Mindestgröße dar -> je größer Umfang, desto exakter Schätzung -> Kleinhalt der Stichprobe ökonomischer und ethischer
  • es sollte ein Dropout von 15% bei Messwiederholungen eingerechnet werden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
37
Q

Nenne Sie die drei Kenngrößen / Parameter, die den Stichprobenumfang beeinflussen und erklären Sie, wie diese ihn beeinflussen

A

Optimaler Stichprobenumfang kann a-priori festgelegt werden, in Abhängigkeit von a-Fehler und ß-Fehler und der Größe des zu erwartenden Effekt bestimmt werden

  1. Je kleiner das Signifikanzniveau (a), desto größer der benötigte Stichprobenumfang
  2. Reduzierung des ß-Fehlers erhöht die benötigte Stichprobengröße
  3. Je kleiner die Effektgröße, desto größer der benötigte Stichprobenumfang
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
38
Q

Nennen Sie die Anforderungen an die Datenqualität um ein geeignetes Prüfverfahren für Maße der zentralen Tendenz auszuwählen

A
  1. Skalenniveaus der abhängigen Variable
  2. Kennwerte aus wie vielen Stichproben sollen verglichen werden?
  3. Wurden Kennwerte in unabhängigen oder abhängigen Stichproben erhoben?
  4. Wie groß ist die Stichprobe?
  • > nonparametrische (verteilungsfreie) Testverfahren für Daten f-Nominalt / Ordinalskale
  • > parametrische Testverfahren (setzen bekannte theoretische Verteilung voraus) für Intervallskala
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
39
Q

Nenne das Vorgehen / die Schritte der Hypothesenprüfung

A
  1. Formulierung der Nullhypothese & der Alternativhypothese (dadurch wird auch festgelegt oder man gerichtet oder ungerichtet testet)
  2. Festlegung des Signifikanzniveaus Alpha (z.B. 5%)
  3. Bestimmung der Teststärke und Effektgröße (skalenniveau /abhängig/unabhängig)
  4. Festlegung des optimalen Stichprobenumfangs
  5. Stichprobenerhebung und Ermittlung des / der Kennwerte
  6. Ermittlung wie Wahrscheinlich die Kennwerte unter Annahme der H0 sind
    Ermittlung der Wahrscheinlichkeit der Kennwerte unter Annahme der Nullhypothese. Hierfür die Prüfgröße wählen, die die größte Teststärke für das Skalenniveau aufweist
    (Auswahl des Tests + statistische Kennwerte berechnen)
  7. Signifikanzprüfung: Entweder durch Vergleich kritischen und empirischen Wert (und der Entscheidung) und/oder durch den Vergleich von p & Alpha
  8. Bei nicht-signifikanten Ergebnissen ist die Ermittlung von ß-Fehler bzw. der Testpower relevant
    (Berechnung Effektgröße + Teststärke)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
40
Q

Was versteht man unter parametrischen Testverfahren?

A
  • sind alle inferenzstatistischen Tests, die eine Verteilung des untersuchten Merkmals voraussetzen
  • die Signifikanz der statistischen Kennwerte anhand der Verteilung prüfen
  • mindestens Intervallskala & Normalverteilung
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
41
Q

Was ist der Nutzen des z-Test?

A
  • zum Vergleich des Mittelwerts einer Stichprobe mit bekanntem Populationsmittelwert
  • überprüft, ob Stichprobe aus der Population entstammt (=keine signifikante Mittelwertdifferenz) oder eben nicht (=signifikante Mittelwertdifferenz)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
42
Q

Nennen Sie die Voraussetzung für den z-Test sowie ein Beispiel sowie die Nullhypothese

A

Voraussetzung:

  • eine Stichprobe
  • N >= 30
  • Versuchsperson aus Zufallsstichprobe gezogen
  • Merkmal: mindestens Intervallskala & Normalverteilt
  • vergleicht Stichprobenmittelwert mit bekanntem Populationsmittelwert

Beispiel:
Erbringt eine Schulklasse eine überdurchschnittliche Leistung oder liegen Ergebnisse im zu erwartenden Bereich?

Nullhypothese / (Alternativ):
Erwartungswert der AV in der Population, aus der die Stichprobe gezogen wurde, ist (nicht) gleich groß wie ein bekannter Populationsmittelwert

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
43
Q

Wie ist der z-Test zu interpretieren?

A

H0 verwerfen, wenn:

  • errechneter z-Wert größer als kritischer z-Wert der Standardnormalverteilung
  • liegt ermittelter z-Wert in Ablehnungsbereich der Nullhypothese -> Stichprobenmittelwert entspricht dann NICHT vorliegender Population

H0 behalten, wenn:

  • Betrag kleiner als kritischer z-Wert
  • z-Wert > kritischer z-Wert = H0 verwerfen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
44
Q

Nennen Sie die Voraussetzung für den t-Test für eine Stichprobe

A
  • mind. Interavallskala
  • Normalverteilung
  • Stichprobengröße: für kleine Stichproben (Klein: N < 30 oder N < 10)
  • Zufallsstichprobe
  • kann obwohl z-test signifikant ausfällt, nicht signifikant ausfallen

Nutzen:
-zum Vergleich des Mittelwertes einer Stichprobe mit bekanntem Populationsmittelwert

Effektgröße: d

Nullhypothese (Alternativ):
Erwartungswert in der Population, aus der die Stichprobe gezogen wurde, ist (nicht) gleich groß wie ein bekannter Populationsmittelwert

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
45
Q

Was sind Freiheitsgrade?

A

Freiheitsgrade (df)

  • Anzahl an “frei wählbaren” Werten, die in die Berechnung des statistischen Kennwerts eingehen
  • Bei t-Test: df = N-1 (definiert über Stichprobengröße N , den als bekannt vorausgesetzten Stichprobenmittelwert)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
46
Q

Nennen Sie die Voraussetzungen für den t-Test für abhängige Stichproben

A
  • AV ist intervallskaliert
  • liegt in Paaren vor
  • zwei verbundene Stichproben oder Gruppen vorhanden. Die verschiedenen Messwertpaare sind unabhängig voneinander
  • Unterschiede zwischen den verbundenen Testwerten in der Population sind normalverteilt (Bei Stichproben > 30 sind Verletzungen unproblematisch)
  • teststärker als t-test für unabhängige Stichproben

-Nullhypothese (Alternativ):
die mittlere Differenz der Messwertpaare ist auf Populationsebene (un-)gleich null

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
47
Q

Definieren Sie was unabhängige Stichproben sind.

Welche Voraussetzungen müssen überprüft werden?

A
  • liegt vor, wenn Zuordnung eines Merkmalsträgers zur ersten Stichprobe keinen Einfluss auf Zuordnung einer Merkmalträgers zur zweiten Stichprobe hat
  • vor Durchführung muss unter anderem auf Varianzhomogenität geprüft werden (F-Test)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
48
Q

Was versteht man unter Varianzhomogenität?

A
  • ist gegeben, wenn Varianzen beider unabhängiger Stichproben gleich oder zumindest ähnlich sind
  • zwei Varianzen sind ähnlich, wenn sie sich nur zufällig von einander unterscheiden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
49
Q

Mit welchem Test wird auf Varianzhomogenität geprüft?

A
  • F-Test nach Fischer

- F-Test nach Levene

50
Q

Nennen Sie die Voraussetzungen für den F-Test nach Fischer & die Nullhypothese

A

Voraussetzung:
-mindestens Intervallskala & 2 unabhängige Stichproben

Nullhypothese
-Varianzen in beiden Stichproben unterscheiden sich nicht -> Verhältnis der beiden Varianzen = 0

51
Q

Wann wird der t-Test für homogene Varianzen angewendet? (unabhängig)
Was sind die Voraussetzungen?
Wir lässt er sich interpretieren?

A

Anwendung:
-Prüfung von Mittelwertsdifferenzen zweier unabhängiger Stichproben

Voraussetzung:

  • mindestens Intervallskaliertes Merkmal in zwei unabhängigen Zufallsstichproben erhoben
  • Varianz = homogen

Interpretation:
-t-Wert > kritischer t-Wert -> H0 verwerfen

52
Q

Formulieren Sie die Nullhypothese

A
  • beide Stichproben sind aus einer Population
  • Differenz des Mittelwerts aus Stichproben = 0

Betrag > kritischer Wert -> H0 verwerfen

53
Q

Wann wird der t-Test für heterogene Varianzen angewendet? (unabhängig)
Was sind die Voraussetzungen?

A

Anwendung:

  • Prüfung der Mittelwertdifferenzen zweier unabhängiger Stichproben
  • Varianzhomogenität wird nicht vorausgesetzt

Voraussetzung:

  • mindestens Intervallskalenniveau in 2 unabhängigen Zufallsstichproben
  • Varianzen nicht homogen

Besonderheit:

  • Freiheitsgrade müssen hier korrigiert werden
  • durch Korrektur wird Heterogenität der Varianzen berücksichtigt -> Führt zur Erhöhung des kritischen t-Wertes

Nullhypothese (Alternativ):
-Erwartungswert ist in der Population, aus der die 1. Stichprobe gezogen wurde, (nicht) gleich groß wie der Erwartungswert in der Population, aus der die 2. Stichprobe gezogen wurde

54
Q

Definieren Sie Effektgröße

A
  • ist die standardisierte Form eines Mittelwertunterschieds / eines Zusammenhangsmaß / einer Häufigkeitsverteilung
  • über die Effektgröße kann festgestellt werden, ob ein statistischer Effekt auch eine praktische Relevanz hat
  • unterschiedliche Effektgrößenmaße je nach Testverfahren
  • sollte beim Bericht der Analyseergebnisse mit angegeben werden
  • ermöglicht Vergleich von Studien
  • Empfehlung für “kleine”, “mittlere”, und “große” Effekte nach Cohen
  • aber: Bedeutsamkeit hängt vom Inhalt ab (z.B. leichte Verbesserung des Therapieerfolgs bei sehr viel höheren Kosten)
55
Q

Welche Effektgröße verwendet man zur Berechnung von Mittelwertsdifferenzen?

A

Effektgröße Cohens d

  • als Effektgröße bei Berechnung von Mittelwertsdifferenzen
  • erlaubt Bewertung der Effekte beim Mittelwertsvergleich unabhängig vom verwendeten Messinstrument
  • Differenz zwischen zwei Mittelwerten wird ins Verhältnis zu Streuung gesetzt
  • Formel: d=u1-u2 / ox
  • Effektgröße Einteilung: klein (0,2), mittel (0,5) und großer Effekt (0,8) -> diese sollten nur als Vergleichswert herangezogen werden, wenn keine Kennwerte von vergleichbaren Studien bekannt sind
  • Probleme in praktischer Anwendung: Uneinigkeit, welche Standardabweichung verwendet werden soll -> Streuung hat starken Einfluss auf ermittelte Effektgröße
56
Q

Was versteht man unter nichtparametrischen Testverfahren?

+3 Beispiele

A
  • der untersuchte statistische Kennwert unterliegt keiner theoretischen Prüfverteilung
  • im allgemeinen sind diese Verfahren voraussetzungsärmer und testschwächer als parametrische Verfahren (-> man sollte Versuchen die Voraussetzung für parametrische Verfahren zu erfüllen)

Binomialtest: berechnet Werte, dass eine von 2 Merkmalsausprägungen häufiger auftritt

Mediantest: analysiert Unterschiede in der zentralen Tendenz zwischen 2 Stichproben

Vorzeichentest: zählt die Anzahl der positiven / negativen Ergebnisse aus

57
Q

Wann sind nichtparametrische Verfahren anzuwenden und warum?

A
  • Skalenniveau: Nominal- und Ordinalskala -> da diesen Merkmalen keine theoretische Normalverteilung zugrunde liegt
  • bei sehr kleinen Stichproben -> Normalverteilung meistens nicht gewährleistet
  • um mit nichtparametrischen Verfahren in geringerem Skalenniveau identischen Effekt wie bei parametrischen Verfahren zu erreichen, muss man einen größeren Stichprobenumfang anwenden
58
Q

Wann wird der Binomial-Test angewendet und was sind die Voraussetzungen dafür?

A

Anwendung:

  • für ein dichotomes Merkmal
  • um Werte zu errechnen, dass eine der beiden Merkmalsausprägungen x-mal häufiger / seltener auftritt
  • wird über Binomialkoeffizienten bestimmt

Voraussetzung:

  • Nominalskaliert
  • für Merkmal ist Populationsparameter n bekannt
  • Elementarereignisse sind in zwei sich ausschließende Klassen einteilbar
  • die Wahrscheinlichkeit n für eine Ereignisklasse ist konstant und Ereignisse sind unabhängig voneinander

Nullhypothese (Alternativ):
die mittlere Auftretenshäufigkeit in der Population, aus der die Stichprobe gezogen wurde, unterschiedet sich nicht von einem bekannten Populationsparameter
(Alternativ: unterscheidet sich)

Beispiel: Depression häufiger bei Männern oder Frauen?

59
Q

Wann wird der Chi²-Test angewendet?

Nennen Sie die Voraussetzungen

A

Anwendung:

  • ist eine Verfahrensklasse zur Auswertung von Nominaldaten
  • es werden erwartete & beobachtete Häufigkeiten miteinander verglichen
  • nur mit df=1 können gerichtete Alternativen aufgestellt werden
  • bei höheren df nur ungerichtete Hypothesen möglich
  • wenn Voraussetzung für Chi² nicht möglich -> Korrektur mit Fisher Yates erfolgen

Voraussetzungen:

  • nominalskaliertes Merkmal
  • unabhängige Zufallsstichproben
  • erwartende Häufigkeit in Zellen nicht zu klein

H0 / Alternativ:
die beiden nominalskalierten Variablen X und Y sind voneinander unabhängige Zufallsvariablen
(Alternativ: abhängige Zufallsvariablen)

60
Q

Was muss man machen, wenn die Voraussetzungen für den Chi²-Test nicht gegeben sind?

A

-eine Korrektur mit dem Test nach Fisher-Yates durchführen

61
Q

Wann wird der McNemar-Test angewendet?

Nennen Sie die Voraussetzungen dafür

A

Anwendung:

  • Sonderfall des Chi²-Tests
  • Anwendbar bei zweifacher Messung einer abhängigen Stichprobe

Voraussetzung:
-nominalskaliert
-in zwei abhängigen Zufallsstichproben wird ein dichotomes Merkmal erhoben
-erwartende Häufigkeit >= 5
-auch hier: Test mit df=1 können gerichtete Hypothesen definiert werden
(McNemar-Test ist ein Chi²-Test)

Nullhypothese / Alternativ:
Anzahl der Wechsler in beiden Richtungen gleich (bei zweiter Messung wechseln gleich viele Personen von A nach B wie von B nach A)
(Anzahl der Wechsler ist ungleich)

62
Q

Wann wird der Q-Test von Cochran verwendet?

Was sind die Voraussetzungen dafür?

A

Anwendung:

  • Erweiterung des McNemar-Test für Messwiederholung für beliebig viele Messzeitpunkte
  • Veränderung sind über beliebig viele Messzeitpunkte analysierbar

Voraussetzung:

  • nominalskaliert
  • abhängige Stichprobe -> dichotomes Merkmal
  • in der Regel sind es positive und negative Merkmalsausprägungen (+/-)

Nullhypothese (Alternativ):
die Wahrscheinlichkeit für die beiden Merkmalsausprägungen A und B eines dichotomen Merkmals ändert sich über die verschiedenen Messzeitpunkte nicht
(Alternativ: ändert sich)

Beispiel: Therapieverlauf bei 10 Versuchspersonen über 4 Messzeitpunkte untersuchen
->Veränderung der Symptomatik in beiden Kategorien werden über Erfolg/Misserfolg (+/-) registriert

63
Q

Wie wird der Kennwert des Q-Tests interpretiert?

A

-liegt Q-Wert über kritischem Chi²-Wert -> d.h. Therapie hat signifikanten Einfluss auf die Patienten.

Anzahl positiver Reaktionen hat sich über die Messzeitpunkte hinweg verändert

-q-Wert > kritischer Chi² > H0 verwerfen

64
Q

Wann wird der Mediantest angewandt?

Was sind die Voraussetzungen dafür?

A

Anwendung:

  • hiermit können Unterschiede in der zentralen Tendenz zwischen 2 Teilstichproben bei Ordinaldaten analysiert werden, indem ordinalskalierte Variable anhand des Medians dichotomisiert wird
  • gut bei größeren Gruppen mit Ausreißern
  • Allerdings: Mediantest weniger Teststark als Mann-Whitney-U-Test

Voraussetzung:

  • ordinalskalen-Niveau
  • zwei unabhängige Zufallsstichproben

Nullhypothese (Alternativ):
das Verhältnis von Personen, die einen Wert über dem Median haben, sowie Personen, die einen Wert unter dem Median haben, unterscheidet sich zwischen den untersuchten Populationen nicht
(Alternativ: unterscheidet sich)

65
Q

Wann wird der U-Test von Mann-Whitney angewandt?

Was sind die Voraussetzungen dafür?

A

Anwendung:
-dient dem Vergleich der zentralen Tendenz zweier Teilstichproben in einem ordinalskalierten Merkmal

Voraussetzung:

  • ordinalskalen-niveau
  • zwei unabhängige Zufallsstichproben, ähnliche Verteilung

Nullhypothese (Alternativ):
Die Summen der Rangplätze unterscheiden sich zwischen den untersuchten Populationen nicht
(Alternativ: unterscheiden sich)

In R: wilcox.test

66
Q

Was sind die Vorteile des U-Tests von Mann-Whitney gegenüber dem Mediantest?

A
  • U-Test ist stärker als Mediantest
  • > berücksichtigt sämtliche Informationen der Rangplätze

wichtig: bei Ausreißern sollte lieber Mediantest angewendet werden, um Verzerrungen zu vermeiden

67
Q

Wann wird der Vorzeichen Test angewendet?

Nennen Sie die Voraussetzungen dafür

A

Anwendung:

  • wird von Binomialverteilung mit n=.5 ausgegangen und die Anzahl der positiven & negativen Ergebnisse einer abhängigen Stichprobe ausgezählt
  • beide Untersuchungsausgänge sind gleich wahrscheinlich
  • bei abhängigen Stichproben: wird Veränderung zwischen 2 Messzeitpunkten verglichen

Voraussetzungen:

  • ordinalskalen-niveau
  • bei abhängiger Stichprobe = Messwertpaare, die dichotom als positiv oder negativ klassifiziert werden können

Nullhypothese (Alternativ):
Anzahl der positiven Klassifizierungen (X < Y) ist (un-)gleich der Anzahl der negativen Klassifizierungen (X > Y)

68
Q

Vergleichen Sie den Vorzeichentest mit dem Vorzeichenrangtest von Wilcoxon

A
  • Vorzeichentest ist einfacher, aber testschwächer als Vorzeichenrangtest von Wilcoxon
  • Wilcoxon ist teststärker, weil vollständige Ranginformationen in Analyse mit einbezogen werden
  • Vorzeichentest ist weniger Ausreißerempfindlich
69
Q

Wann wird der Vorzeichenrangtest von Wilcoxon angewendet?

Nennen Sie die Voraussetzungen dafür

A

Anwendung:

  • berücksichtigt neben der Richtung auch die Größe des Unterschiedes
  • überprüft, ob sich zwei abhängige Stichproben signifikant von zentraler Tendenz unterscheiden

Voraussetzungen:

  • eine abhängige Zufallsstichprobe
  • Messwerte einer Variable auf Ordinalskala
  • zwei abhängige Gruppen

Nullhypothese (Alternativ):
die Summe der Rangplätze mit positiven und negativen Veränderungen unterscheidet sich nicht
(Alternativ: unterscheiden sich doch)

70
Q

Interpretation des Vorzeichenrangtests von Wilcoxon

A

-berechneter Wert muss gleich oder kleiner als kritischer T-Wert sein, damit signifikanter Unterschied belegbar ist

71
Q

Wann wird der H-Test von Kruskal und Wallis angewendet?

Nennen Sie die Voraussetzungen dafür

A

Anwendung:

  • erweitert den Mediantest
  • für mehr als zwei unabhängige Stichproben -> erlaubt die Untersuchung des zentralen Tendenz dieser Stichproben (mehr als 2 unabhängige Stichproben)
  • entspricht weitgehend parametrischen Varianzanalyse (deshalb auch Rangvarianzanalyse genannt)

Voraussetzung:

  • mehr als 2 unabhängige Zufallsstichproben
  • ordinalskalen-niveau

Nullhypothese (Alternativ):
die Summen der Rangplätze in den untersuchten Populationen unterscheiden sich nicht
(Alternativ: unterscheiden sich doch)

72
Q

Interpretation des H-Tests von Kruskal und Wallis

A
  • kritischer Chi²-Wert bei df=3 und a-Niveau von 5%=9,348
  • > berechneter Wert ist höher als kritischer Chi²-Wert -> man kann von signifikantem Unterschied im Sozialverhalten aufgrund der 4 Erziehungsstile ausgehen
73
Q

Wie wird der Friedmann-Test angewendet?

Nennen Sie die Voraussetzungen dafür

A

Anwendung:

  • Erweiterung des Vorzeichentests: Mehr als 2 Gruppen
  • erlaubt Untersuchung von k abhängigen Gruppen im Bezug auf ihre Maße der zentralen Tendenz

Voraussetzung:

  • eine abhängige Stichprobe
  • ordinalskalen-niveau

Nullhypothese (Alternativ):
die Summen der Rangplätze zu den verschiedenen Messzeitpunkten unterscheiden sich auf Populationsebene nicht
(Alternativ: unterscheiden sich)

74
Q

Vergleichen Sie den Friedman-Test mit dem H-Test nach Kruskal und Wallis

A

-Friedman-Test bei abhängigen Stichproben weniger Teststark als H-Test für unabhängige Stichproben

75
Q

Interpretation des Friedmann-Tests

A
  • Chi²-Wert wird mit kritischem Chi²-Wert (df=3) verglichen
  • berechneter Wert liegt ÜBER dem kritischen Chi²-Wert
  • > dies belegt signifikanten Unterschied über die Messzeitpunkte hinweg -> H0 wird verworfen
76
Q

Wie wird der Kolmogorov-Smirnow-Test angewendet?

Was sind die Voraussetzungen dafür?

A

Anwendung:

  • vergleicht eine empirische beobachtete und eine bekannte theoretische Verteilung miteinander
  • meist wird untersucht, ob eine Stichprobenverteilung der Normalverteilung entspricht
  • Kolmogorov-Smirnow-Test prüft immer die Nullhypothese, dass empirische Verteilung bspw. einer Normalverteilung entspricht
  • wird Test signifikant, liegt signifikante Abweichung von der Normalverteilung vor und untersuchtes Merkmal kann nicht mehr als normalverteilt gelten

Voraussetzungen:
-Daten aus einer Zufallsstichprobe in Form von Rohwerten oder in Form einer Häufigkeitsverteilung

Nullhypothese (Alternativ):
Es gibt keinen Unterschied zwischen der Verteilung der untersuchten Population und einer theoretischen Verteilung (Normalverteilung)
(Alternativ: es gibt einen Unterschied)

77
Q

Was ist beim Kolmogorow-Smirnow-Test zu beachten?

A
  • bei großen Stichproben >300 Versuchspersonen besteht die Gefahr, dass der Test zu sensitiv ist -> bei unbedeutenden Abweichungen ein signifikantes Ergebnis produziert
  • bei Stichproben <30 wird der Test “eigentlich nie” signifikant
  • > muss bei Interpretation berücksichtigt werden
78
Q

Wie wird der Kolmogorow-Smirnow-Test berechnet?

A
  • Prinzipiell wird beim Kolmogorow-Smirnow-Test immer der Absolutbetrag der größten Differenz zwischen empirischer und theoretischer Verteilung gesucht.
  • Aufgrund der Größe dieser Differenz wird dann entschieden, ob die H0 beizubehalten oder zu verwerfen ist
  • Da diese Berechnung “von Hand” sehr mühsam ist, und der Test mittels vieler Statistik-Programme leicht auszuführen ist, wird kein Beispiel dargestellt und auf die Formel verzichtet
79
Q

Was ist das Resampling-Verfahren?

A
  • hiermit kann vorraussetzungsfrei eine inferenzstatistische Prüfung durchgeführt werden
  • bildet die theoretische Grundlage für viele nicht-parametrische Verfahren
  • durch Ermittlung aller Gruppenkombinationen o kann überprüft werden, ob ein Treatment Einfluss hat
  • es wird untersucht, ob sich bei zufälliger Zuordnung von Gruppen eine größere Mittelwertsdifferenz ergibt, als bei der durch den Versuchsleiter gegebenen Zuordnung von Treatment und Kontrollbedingung
80
Q

Nennen Sie Einflussfaktoren auf den Signifikanztest

A
  • alpha-Niveau (Irrtumswahrscheinlichkeit)
  • ein- oder zweiseitige Testung
  • Homogenität der Merkmalsverteilung
  • Stichprobenumfang
  • Größe des statistischen Effekts
  • Abhängige vs. unabhängige Stichproben (Messwiederholung)
  • Teststärke (1-Beta)
81
Q

Warum ist der t-Test für abhängige Stichproben aus statistischer Sicht vorteilhaft?

A

Ein Teil der Stichprobenvarianz wird durch individuelle Unterschiede erklärt
(individuelle Unterschiede werden errechnet)

Bei Test Fahrsimulator mit/ohne SMS: Differenz der Personen wird errechnet (schnell / langsam an sich ist nicht so relevant. Differenz ist relevant)

82
Q

Warum können nicht immer abhängige Stichproben untersucht werden, wenn diese vorteilhafter sind?

A

Bei manchen Versuchen wie zum Beispiel der Vergleich von verschiedenen Lernmethoden ergibt eine abhängige Stichprobe keinen Sinn/ ist schwierig / unmöglich, da der Vorgang des Lernens nicht wiederholt werden kann.
(Entgegen zu zum Beispiel Fahrsimulator Reaktionszeit mit/ohne SMS)

83
Q

Leitfragen Testauswahl

A
  1. Welches Skalenniveau?
  2. die Kennwerte aus wie vielen Stichproben sollen miteinander verglichen werden? Eine, Zwei oder mehrere?
  3. Kennwerte aus abhängigen oder unabhängigen Stichproben?
  4. Wie groß sind die einzelnen Stichproben?

-> bei mehreren möglichen wird das Teststärkste Verfahren ausgewählt

84
Q

Welche Faktoren haben Einfluss auf die Teststärke und wie beurteilen diese die Teststärke?

A
  1. alpha niveau (je höher, desto höher Teststärke)
  2. Stichprobenumfang (je höher, desto höher)
  3. beta Fehler (je niedriger, desto höher)
  4. ein oder zweiseitige Testung (einseitig höher)
  5. abhängig / unabhängig (abhängig höher)
  6. Voraussetzungen an Merkmalsverteilung, wie Normalverteilung & Varianzhomogenität (je mehr Voraussetzungen desto höher)
  7. Auswahl des statistischen Testverfahrens (je höher Informationsgehalt desto höher)
  8. Größe des statistischen Effekts (je höher, desto höher)
  9. Freiheitsgrade (je höher Nenner Freiheitsgrad df desto niedriger)
85
Q

Definieren sie Nullhypothese

A

-H0
-beschreibt, dass kein Zusammenhang / Unterschied in der Population vorliegt
(Unterschiede nur durch Zufall)
-Basis zur Bewertung der Mittelwertsdifferenzen oder Zusammenhänge
-H1 komplementär, also wird diese angenommen wenn man H0 ablehnt
-beide Hypothesen schließen sich gegenseitig aus

86
Q

Definieren sie Alternativhypothese

A
  • H1
  • beschreibt, dass ein Zusammenhang / Unterschied vorliegt
  • gerichtet oder ungerichtet
  • aus Theorie, Studien oder Literatur abgeleitet
87
Q

Definition Restriction of Range

A
  • künstliche Variationsbeschränkung
  • Selektionsfehler bei Stichprobenziehung (z.b ziehen vieler Extremwerte)
  • Stichprobenkorrelation zwischen x und y wird unterschätzt, so auch Populationskorrelation -> je kleiner Korrelation, desto größer Unterschätzung
  • Entstehung von Decken- / Bodeneffekten

-häufig bei Studie über Hochbegabte

88
Q

Definition Regressionseffekt

A
  • Tendenz zur Mitte -> wahrscheinlicher dem Durchschnitt zu entsprechen als Extremwerte zu erreichen
  • wenn 1. Messung extrem niedrige / Hohe werte, dann bei 2. Messung wahrscheinlich durchschnittliche Werte
  • in interpretation mit einbeziehen oder komplett vermeiden

-Beispiel:
Therapie von extrem Depressiven, denen es nach der Therapie besser geht.
Tendenz zur Mitte oder Wirkung der Therapie?

89
Q

Definition Standardabweichung

A
  • Wurzel aus der Varianz
  • Maß für Streuung der x-Werte um Durchschnitt
  • schätzt bei normalverteilten Variablen den Populationsparameter sigma, der die Breite der Verteilung steuert
90
Q

Definition Standardfehler

A
  • Maß für Verteilung der Stichprobenmittelwerte um den Populationsmittelpunkt
  • Berechnung von Konfidenzintervallen und statistischen Tests
  • je kleiner Konfidenzintervall, desto besser ist die Schätzung
  • Je größer N, desto kleiner Standardfehler
91
Q

Definition Standardschätzfehler

A
  • Streuung der wahren y-Werte um die Regressionsgerade, identisch mit Streuung der Regressionsresiduen
  • Maß für Güte der Regressionsgeraden
  • je kleiner, desto präziser Vorhersage
  • unabhängig von der Stichprobengröße
92
Q

Einflüsse auf den Standardschätzfehler

A
  1. je größer Streuung des Kriteriums (AV), desto höher syx
  2. je größer die korrelation zwischen AV und UV, desto niedriger s y,x
  3. je größer die Streuung des Prädiktors (UV) desto niedriger s y,x
93
Q

Nennen Sie die vier Elemente der Signifikanzprüfung

A
  1. Signifikanzniveau (alpha)
  2. Beta fehler (und Teststärke 1-ß)
  3. Effektgröße
  4. Stichprobenumfang
94
Q

lineare Regression und deren Voraussetzungen

A
  • Vorhersage einer Variable y (Kriterium) durch eine Variable x (Prädiktor)
  • geht von einem linearen Zusammenhang zwischen Prädiktor und Kriterium aus -> geschätzter Wert auf Gerade darstellbar
  • je größer Korrelation, desto sicherer ist die Vorhersage

Voraussetzungen:

  1. Linearität
  2. Residuen sind unabhängig und normalverteilt
  3. UV und AV sind intervallskalier und normalverteilt
  4. Homoskedastizität
  5. Abwesenheit von Einflussreichen Beobachtungen
95
Q

Kreuzvalidierung und deren Schritte

A
  • entweder Prüfung zwei natürlicher Stichproben oder zwei künstlicher Teilstichproben
  • Überprüfung der externen Validität einer empirisch ermittelten Regressionsgleichung durch Übertragung dieser von der ersten auf die zweite Stichprobe
  1. Berechnung der Regressionsgleichung anhand 1. Stichprobe
  2. Anwendung der Regressionsgleichung zur Vorhersage der 2. Stichprobe
  3. Vergleich von vorhergesagten mit wahren y-werten
  4. umgekehrte Wiederholung von Schritt 1-3
96
Q

einfaktorielle Varianzanalyse mit festen Effekten

A
  • AV: eine intervallskalierte Variable
  • UV: eine nominalskalierte Variable
  • Prinzip: t-Test für unabhängige Stichproben wird auf mehr als zwei Gruppen ausgeweitet -> analyse ob sich mittelwerte dieser Gruppen signifikant unterschieden

Nullhypothese (Alternativ):
Es besteht zwischen den untersuchten Mittelwerten keine Mittelwertsunterschiede
(Alternativ: es besteht mind. 1 Unterschied)

97
Q

(zwei-/)mehrfaktorielle Varianzanalyse mit festen Effekten

A
  • AV: eine intervallskalierte Variable
  • UV: mehrere (mind. 2) nominalskalierte Variablen mit jeweils mindestens 2 Stufen
  • Prinzip: Ausbau der einfaktoriellen Varianzanalyse mit festen Effekten -> Analyse ob sich Mittelwerte dieser Gruppen signifikant unterschieden
  • suche nach Unterschieden bzgl. des ersten (Haupteffekt 1) und zweiten Faktors (Haupteffekt 2)

-Zusätzlich: Möglichkeit, den Einfluss von Kombinationen beider unabhängiger Variablen zu untersuchen

Nullhypothese (Alternativ):

  • Haupteffekt des Faktors A (un-)gleich null
  • Haupteffekt des Faktors B (un-)gleich null
  • Interaktionseffekt (un-)gleich null
98
Q

Varianzanalyse mit für Messwiederholungen

A
  • AV: eine interavallskalierte Variable, welche bei den Probanden mehrmals (messwiederholt) erhoben wird
  • UV: eine nominalskalierte Variable mit mindestens 2 Stufen, welche die Messzeitpunkte beschreibt
  • Prinzip: Ausweitung des t-Tests für abhängige Stichproben auf mehr als zwei Messzeitpunkte -> AV muss mehrfach bei einem Probanden erhoben werden

-> besteht ein signifikanter Unterschied zwischen den abhängigen Gruppen im Bezug auf den Mittelwert?

Nullhypothese: es gibt keinen signifikanten Unterschied zwischen den abhängigen Gruppen

(Beispiel: Knie OP: Schmerzen nach gewisser Zeit (abhängige Gruppen bekommen Therapie))

99
Q

Voraussetzung der ein-/zweifaktoriellen Varianzanalyse

A
  1. mindestens intervallskalenniveau und normalverteilung innerhalb der Stichproben bei der AV
  2. mindestens 20 Elemente pro Stichprobe (Gruppe, Zelle)
  3. ähnlich stark besetzte Gruppen (Zellen) -> die größte Gruppe darf nicht größer als das 1,5-fache der kleinsten Gruppe sein
  4. Varianzhomogenität der AV zwischen den einzelnen Stichproben
100
Q

Quadratsumme

A

Summe der quadrierten Abweichungen von Werten von ihrem Mittelwert

101
Q

Schritte der Varianzanalyse

A
  1. Bestimmung von SS mod und SS res
  2. Berechnung von MS mod und MS res
  3. Durchführung F-Test ( F = MS mod / MS res)
  4. Signifikanzprüfung durch einen Vergleich des beobachteten F-Wertes mit dem kritischen F-Wert aus einer Tabelle

-bei mindestens zwei Gruppen sollte zur Erfassung des praktischen Relevanz eines Effekts der erklärbare Varianzanteil eta² berechnet werden
(SS mod / SS res)

102
Q

Voraussetzung für Kontraste und Beispiele

Was sind Kontraste?

A

-definieren Parameter des linearen Modells
erlauben Tests über spezifische Hypothesen über Mittelwertsunterschiede

  1. Die Summe aller Gewichte muss 0 ergeben
  2. Die Kontraste müssen unabhängig voneinander sein (wenn nicht, dann Korrektur des alpha-Fehler-Niveaus)

Faktor A: Reizart (Lärm, Licht, Geruch, Kontrollgruppe)
Faktor B: Darbietungszeit (30,45,60,75 Sekunden)

103
Q

Post-hoc Tests

A
  • Varianzanalyse für Messwiederholungen
  • führen Mittelwertsvergleiche durch
  • bei signifikanten F-Test mit mindestens 2 Gruppen
  • Anwendung nur bei ungerichteten Hypothesen
  • Durchführung immer a-posteriori
  • überprüfen zwischen welchen Messwerten der Unterschied ist

Beispiele:

  • Bonferroni-Korrektur
  • LSD-Test
  • Tukey-Test
  • Peritz-Test
  • Scheffé-Test
104
Q

Was besagt das 95% Konfidenzintervall für einen Regressionsparameter Beta?

A
  • es wird die H0 geprüft, dass die unbekannten, wahren Regressions-/Steigungsparameter ß1 sich nicht von null unterscheiden
  • Nullhypothese: H0: ß1 = 0 -> keine Steigung
  • Alternativhypothese: H1: ß1 ungleich 0 -> Steigung liegt vor
  • es liegt kein Einfluss in der Grundgesamtheit vor

-mit hilfe des Standardschätzfehlers kann um jeden geschätzten Wert ein Konfidenzintervall gelegt werden, in dem mit einer Wahrscheinlichkeit von 95% der wahre y-wert liegt

105
Q

Welchen Vorteil bietet die zweifaktorielle Varianzanalyse gegenüber von zwei einfaktoriellen Varianzanalysen aus dem selben Datensatz?

A
  • Berechnung des Interaktionseffekts
  • Anteil der nicht erklärten Varianz kann um die auf den zweiten Faktor und die Interaktion zurückgehende Varianz reduziert werden
  • > Somit kann ein Faktor signifikant werden, der in der einfaktoriellen ANOVA nicht signifikant werden würde
106
Q

Welche Effekte scheinen signifikant zu sein?

A
  1. Verlaufen alle Linien parallel zur x-Achse, so ist der Haupteffekt des Faktors, der auf der x-Achse abgetragen wird, statistisch nicht bedeutsam
  2. Liegen Linien übereinander, so in der Haupteffekt des Faktors, der auf der y-achse liegt, statistisch nicht signifikant
  3. Verlaufen die Linien parallel zueinander, so existieren keine bedeutsamen Interaktionseffekte
  4. Verlaufen die Linien unterschiedlicher Stufen nicht parallel zueinander, deutet dies auf eventuell signifikante Interaktionseffekte hin
107
Q

Was ist ein Prädiktor / Kriterium?

A
  • Prädiktor: UV, sagt AV (Kriterium) voraus
  • Kriterium: AV (wird von Prädiktor vorhergesagt)

-> es muss die Funktion gefunden werden, die den Zusammenhang zwischen x und y optimal beschreibt

108
Q

Warum ist eine Varianzanalyse besser als mehrere t-Tests?

A
  • bei jedem t-Test kann ein Fehler der 1. Art begangen werden (Wahrscheinlichkeit dafür z.b. 5%)
  • mehrere t-Tests erhöhen durch die alpha-Fehler-Inflation die Fehlerrate
  • > Fehlerrate wird also sehr hoch, wenn man viel testet.
  • bei ANOVA bleibt der Fehler aber bei 5% -> signifikantes Ergebnis ist auch aussagekräftig
109
Q

Definition Standardabweichung

A

ist die durchschnittliche Entfernung aller gemessenen Ausprägungen eines Merkmals zum Mittelwert

110
Q

Abgrenzung Standardabweichung und Standardschätzfehler

A

Standardabweichung: Abweichung einzelner Werte zu deren Mittelwert

Standardschätzfehler: Abweichung einzelner Werte zum Mittelwert der Population

111
Q

Bezeichnung eta², p wert, f-wert

A

eta²: Effektstärke der ANOVA (ähnlich wie R² aus der Regression) (eta² = SS between / SS tot)

p-wert: Wahrscheinlichkeit, dass ein in der Stichprobe beobachteter Unterschied zwischen 2 Gruppen unterschiedlich entstanden sein könnte
(Wahrscheinlichkeit, dass Nullhypothese stimmt)
-> wenn p-wert <0.05 ist, dann H0 verwerfen (H1 annehmen, es gibt also unterschiede)

f-wert: Prüfgröße des F-Tests (Verhältnis von zwei Varianzen (Maß der Streuung) 1,65 -> bei 5% Grenze bis signifikant)

112
Q

Prinzip der Quadratsummenzerlegung erklären

->Varianzaufklärung

A

-dadurch gehen Gruppenmittelwerte und somit Effekte in die Berechnung ein

SS tot = SS between + SS within

  • SS between -> Mittelwertsunterschiede (Variation der UV, erklärbar) (innerhalb der Gruppen)
  • SS within -> Fehlervarianz (nicht erklärbar) (zwischen den Gruppen)

R² = Anteil erklärter Varianz = SS between / SS tot

-> je näher tatsächliche Y-Werte an Regression, desto geringer Residuum und desto größer aufgeklärte Varianz

113
Q

was versteht man unter Alpha-Fehler-Inflation

A
  • a-Fehler: Wahrscheinlichkeit die Nullhypothese zu verwerfen obwohl sie gültig ist
  • Bei 100 Tests mit a = 5%, dann ist Erwartungswert für die Anzahl der Fehler = 5
  • die Gesamthypothese wird also fast immer verworfen wenn nur ausreichend viele Tests gemacht werden
  • alpha ist also so nicht mehr 5%, sondern hängt von der Anzahl der Tests ab
114
Q

df, MS, SS, R² und P in der Varianzanalyse

A

df: Anzahl der Freiheitsgrade: Anzahl der frei wählbaren Werte, die in die Berechnung eingehen
MS: Mittlere Quadratsumme: Ergebnis aus SS/df
SS: Quadratsumme: quadrierte Summe der Abweichungen der Variable zum Mittelwert
R²: Anteil erklärter Varianz
p: misst die Wahrscheinlichkeit, dass ein in einer Stichprobe beobachteter Unterschied zwischen 2 Gruppen unterschiedlich entstanden sein könnte (Wahrscheinlichkeit, dass Nullhypothese stimmt)

115
Q

Erläutern Sie das Prinzip der geplanten Kontraste + geben sie 2 Beispiele

A
  • nach Varianzanalyse verwendet
  • sind Kontraste, die vorab definiert werden
  • > benötigt eine Hypothese vor der Berechnung der ANOVA
  • prüfen wo die Unterschiede nach signifikanter ANOVA liegen

Beispiel:
Autofahren-Test mit verschiedenen “Aktionen”: SMS, Alkohol, Telefon ??

116
Q

Erkläre die maximum likelihood Methode,

nenne Vor- und Nachteile und ein Beispiel

A

-man betrachtet Ergebnisse eines Zufallsexperiments und überlegt, welche aus mehreren Ursachen am wahrscheinlichsten dazu geführt haben

Vorteil: es lässt sich gut ein Parameter für die Gesamtheit der Stichprobe schätzen

Nachteil: geschätzter Parameter kann auch immer falsch sein -> keine Garantie auf Richtigkeit / kann sehr viele mögliche Parameter geben

Beispiel: jemand kommt zur Tür rein und ist nass -> maximum likelihood: draußen regnet es (auch möglich: Person ist in Teich gefallen, etc.)
Regen ist am wahrscheinlichsten

117
Q

Bedeutung des Determinationskoeffizienten in der ANOVA

A
  • wie gut lässt sich die AV mit der UV vorhersagen
  • > Anteil der Varianz, der AV, der durch die UV erklärt wird (Anteil erklärter Varianz)
118
Q

Welche Werte sind signifikant?

A

-wenn p-wert < alpha Niveau -> Wert wird signifikant

  • wenn alle Linien parallel zur x-Achse: Haupteffekt der x-achse nicht signifikant
  • wenn Linien übereinander: Haupteffekt y-Achse nicht signifikant
  • wenn Linien parallel: kein bedeutender Interaktionseffekt
  • wenn nicht parallel: eventuell signifikanter Interaktionseffekt
119
Q

Was macht eine Varianzanalyse? Wo stößt sie an ihre Grenzen?

A
  • Setzt Variation die durch Gruppen erklärt wird in Verhältnis von Variation die in Gruppen entsteht (erklärte Variation / Gruppenvariation)
  • prüft Unterschiede von Gruppen (nominalskalierte UVs)
120
Q

Was ist ein Effekt?

A

-die Abweichung eines Mittelwerts zum Gesamtmittelwert

121
Q

Unterschied eta² und partielles eta² in bei einfaktoriellen ANOVA / mehrfaktoriellen ANOVA

A

-Einfaktoriell: gibt keinen, nur bei mehrfaktorieller ANOVA

  • mehrfaktoriell: eta² normierung anhand Gesamtvariation -> Varianzaufklärung der Gesamtvariant
  • partielles eta²: normierung anhand von Effekt und Fehler
122
Q

Was mache ich wenn die Varianzen der Gruppen bei der Varianzanalyse mit Messwiederholungen nicht gleich sind?

A

Friedmann-Test verwenden