Statistik II Flashcards
Wie entsteht der Beta-Fehler?
- geringe Stichprobengröße -> dadurch großer Standardfehler
- zufällige Stichproben werden gezogen -> zwei ungünstige Stichproben werden gezogen
Erkläre den Beta-Fehler
- Beibehaltung der Nullhypothese obwohl sie nicht richtig ist
- Fehler 2. Art
- Test zeigt keinen signifikanten Unterschied obwohl es einen gibt
- kann bei Planung der Untersuchung beeinflusst werden
- Eine Alarmanlage gibt Keinen Alarm trotz Einbruchs
- Ein Test für Depressionen ist negativ obwohl Depression vorliegt
Erkläre den Alpha-Fehler
- Ablehnung der Nullhypothese obwohl diese richtig ist
- Fehler 1. Art
- Entsteht wenn die Nullhypothese in der Population gilt und diese fälschlicherweise abgelehnt wird
- Test zeigt einen signifikanten Unterschied obwohl es keinen gibt
- Eine Alarmanlage gibt einen Alarm ohne Einbruch
- Test schlägt positiv auf Depression an obwohl keine vorliegt
Welche Gefahr ergibt sich beim Hypothesentesten?
Nenne beide Fehlerarten
- Gefahr einen falschen Schluss von Stichprobenparametern auf Populationsparameter zu ziehen
- Alpha- und Beta-Fehler
- beide Fehlerarten hängen zusammen
Was versteht man unter einer zweiseitigen Testung?
- ergibt sich aus einer ungerichteten Hypothese
- keine Aussage über die Richtung möglich
- Differenzen müssen groß genug sein um signifikant zu sein
- Fläche von 5% wird an beiden Enden der Verteilung verteilt (jeweils 2,5%)
- Vorteil: explorativ können Unterschiede getestet werden, auch ohne ausreichende Grundlage für gerichtete Hypothese
Was versteht man unter einer einseitigen Testung?
- liegt einer gerichteten Hypothese zugrunde
- Richtung des Mittelwertunterschieds wird aus z.B. Voruntersuchung abgeleitet
- Annahmebereich liegt somit auf einer Seite (Richtung) der Verteilung
- Vorteil: Unterschiede bei einseitiger Testung werden schon bei geringeren Differenzen signifikant als bei zweiseitiger
- als wissenschaftlicher angesehen, gerichtete Hypothesen sind aus Literatur abgeleitet
Wann wird die H0 verworfen?
- Differenz der beiden Stichprobenparameter liegen außerhalb des Beibehaltungsbereich der Nullhypothese -> H1 wird angenommen
- a-Niveau legt Grenzwert fest, der quasi maximale Mittelwertdifferenz zur Aufrechterhaltung der Nullhypothese erlaubt
Wann wird die H0 beibehalten?
- Stichproben unterscheiden sich nicht signifikant -> wenn Differenz der beiden Stichprobenmittelwerte so gering ist, dass sie innerhalb des Annahmebereichs liegt
- Stammen aus identischen Populationen mit Mittelwert u
Wie wird das a-Niveau festgelegt?
- Irrtumswahrscheinlichkeit liegt in der Regel bei 5% ( 1% oder .1% ebenfalls möglich)
- Höhe des a-Niveaus wird immer beim Aufstellen der Hypothese festgelegt und darf nachträglich nicht mehr verändert werden
Was ist das Nutzen des a-Niveaus?
- wichtig für Beibehaltung / Ablehnung der Nullhypothese
- durch vorheriges Festlegen des a-Niveaus wird der Fehler 1. Art kontrolliert
Definieren Sie das a-Niveau / Signifikanzniveau a
- legt, in Abhängigkeit von Stichprobengröße und zu Grunde liegender theoretischer Verteilung, eine Fläche unter der Verteilungskurve (einen Grenzwert) für ein Konfidenzintervall fest
- liegt der ermittelte Kennwert außerhalb dieses Konfidenzintervalls, so wird die H0 verworfen und die H1 angenommen
- das a-Niveau ist die Wahrscheinlichkeit, die vom Forschenden festgelegt wird, mit der Ablehnung der H0 bei einem Signifikanztest zu einem Fehler 1. Art führt
- > also die obere Grenze, für die von Forschenden tolerierten Fehler, mit dem H0 fälschlicherweise abgelehnt wird
-je kleiner das Signifikanzniveau alpha, desto kleiner die Teststärke
Nennen Sie das Gerüst, wie man eine Hypothese formuliert
-Es sei μ1 die mittlere (…) in der Population der (…) und es sei μ2 die mittlere (…) in der Population der (…)
-Dann gilt:
->H0: μ1 = μ2
und
->H1: μ1 ≠ μ2 ( ungerichtet )
oder
->H1: μ1 > μ2 bzw. μ1 < μ2 ( gerichtet )
bei einem a-Niveau von 5%
Erläutere die grundlegende Idee der Inferenzstatistik in 6 Schritten
- Es gibt für ein untersuchtes Merkmal einen bestimmten Populationsmittelwert ux
- Mittlerwerte zufällig aus der Population gezogener Stichproben streuen um Populationsmittelwert ux -> begründet mit zentralem Grenzwert. Hierdurch kann theoretische Verteilung der Kennwerte definiert werden sowie statistische Aussagen unter Voraussetzung von H0 möglich
- Wenn zwei Stichprobenmittelwerte sehr ähnlich:
- sehr wahrscheinlich, dass sie aus identischen Populationen stammen
- beide Stichprobenmittelwerte dann gute Schätzer für Populationsparameter ux - Wenn beide Stichprobenmittelwerte sehr unterschiedlich: stammen möglicherweise nicht aus identischer Population.
Je größer Differenz zwischen x1 und x2, desto unwahrscheinlicher, dass sie aus gleicher Population stammen - Mit Wahrscheinlichkeitsverteilung wird die bedingte Wahrscheinlichkeit für die Differenz der Stichprobenmittelwerte bei Gültigkeit H0 berechnet -> Erwartungswert für Wahrscheinlichkeit liegt bei 0
- Liegt die berechnete Wahrscheinlichkeit der H0 unter gewissem Grenzwert (a-Niveau), so ist die beobachtete Differenz nicht mit der Nullhypothese zu vereinbaren
- > somit stammen die Stichproben nicht aus identischen Population, sondern aus unterschiedlichen Populationen, die sich signifikant unterscheiden
Sollte besser eine gerichtete oder eine ungerichtete Alternativhypothese verwendet werden?
Sinne der beiden Hypothesen wird kontrovers diskutiert
- Gerichtete: gelten wissenschaftlicher, weil theoretische Vorannahme notwendig ist
- Ungerichtete: exploratives Vorgehen: unwissenschaftlicher, da mit geringerem theoretischen Hintergrund empirische Daten untersucht werden
-generell gilt: mit explorativem Vorgehen darf nie Mangel an Vorüberlegungen und theoretischer Fundierung kaschiert werden
Erläutern Sie eine gerichtete Alternativhypothese
- theoriegeleitete Vorgehensweise (Auf Basis von vorherigen Untersuchungen bzw. theoretischen Vorüberlegungen)
- gibt Richtung des Unterschieds zwischen Stichprobenkennwerten an
- vor Datenerhebung wird bestimmt in welcher Stichprobe der höhere Wert erwartet wird
- geht Differenz nachher in andere Richtung, MUSS Nullhypothese beibehalten werden
- höherer Stellenwert als ungerichtete Alternativhypothese
Erläutern Sie eine ungerichtete Alternativhypothese
-Exploratives Vorgehen: keine Aussage über Richtung des Unterschieds, nur, dass Unterschied zwischen zwei Stichprobenkennwerten vorhanden ist
(Nur Existenz des Unterschieds wird untersucht)
Erläutern Sie was eine Alternativhypothese ist
- Eine Positivhypothese
- besagt, dass ein Unterschied oder Zusammenhang in der Population existiert
- sollte immer aus Theoriegebäude (Vorstudie & Literatur) abgeleitet
- H1
- wenn H0 nicht gültig, dann müssen H1 gültig sein
- Unterscheidung zwischen gerichteter und ungerichteter Hypothese
- Komplementär: Nullhypothese
Erläutern Sie was eine Nullhypothese ist
- eine Negativhypothese
- H0
- nimmt an: es gibt keine Zusammenhänge / Unterschiede in der Population
- Annahme: Mittelwerte oder Zusammenhänge sind nur zufällig entstanden bei Stichprobenziehung
- Komplementär: Alternativhypothese
Hypothesen nennen und wie sie zueinander stehen
- Nullhypothese und Alternativhypothese
- schließen sich gegenseitig aus, decken zusammen alle möglichen Fälle ab
- Grundlage immer Nullhypothese. Nur wenn Gültigkeit der Nullhypothese sehr unwahrscheinlich
- > Alternativhypothese angenommen
Definieren Sie Hypothesenprüfung
-inferenzstatistische Hypothesenprüfung erlaubt Aussagen über Gültigkeit von Hypothesen in einer Population aus welcher die untersuchten Stichproben zur Hypothesenprüfung gezogen wurden.
Es werden über Stichprobenkennwerte die Populationskennwerte geschätzt und mit diesen Schätzungen dann Hypothesenprüfungen durchgeführt
Was ist die Aufgabe / das Ziel der Hypothesenprüfung?
- induktives Schließen von einer Stichprobe auf die Population
- beruht auf dem Prinzip der Hypothesentestung
- mit Hilfe der Inferenzstatistik schätzen wir ab, wie wahrscheinlich ein gefundenes Ergebnis unter einer gegebenen Hypothese ist
- in der Inferenzstatistik wird geprüft ob die beobachteten Daten mit den theoriegeleiteten Erwartungen vereinbar sind
Wie können a- Fehler und ß-Fehler minimiert werden?
durch:
- Erhöhung des Stichprobenumfangs
- gerichtete Testung
- ein teststarkes Verfahren
- eine geringe Merkmalsstreuung
- einen hohen Mittelwertunterschied
- hohes a-Niveau kann der ß-Fehler verdrängt werden
- der a-Fehler kann nach der Datenerhebung nicht mehr beeinflusst werden, da er vor der Untersuchung zu definieren ist
Wie sollte das Verhältnis von a-Fehler und ß-Fehler sein?
Faustregel: 4:1
(a-Fehler: 5% / ß-Fehler: 20% oder
a-Fehler: 1 % / ß-Fehler 4%)
Was versteht man unter Teststärke?
- ist über 1-ß definiert
- stellt die Wahrscheinlichkeit dar, einen Effekt zu finden, wenn er existiert (1-Beta)
- anders formuliert: stellt die Wahrscheinlichkeit dar, mit der ein Signifikanztest zugunsten der Alternativhypothese (H1) unterscheidet unter der Bedingung, dass der besagte Effekt wirklich in der Population vorliegt
- auch als Trennschärfe oder power bezeichnet
- sie verläuft gegenläufig zum ß-Fehler
Welche Möglichkeiten gibt es eine höhere Teststärke zu erzielen?
-Differenz der Mittelwerte (u1-u2, je größer, desto größer die Teststärke)
-Stichprobenumfang (je größer N, desto größer Teststärke)
-Merkmalsstreuung (je kleiner, desto größer Teststärke)
Teststärke ist bei einseitiger Testung größer
-Höhe des a-Niveaus (je größer, desto größer Teststärke)
-Höhe des ß-Fehlers (gegenläufig zur Teststärke - je kleiner ß-Fehler)
-Stichprobe abhängig vs. unabhängig (bei abhängigen ist Teststärke größer)
-Auswahl des statistischen Testverfahrens
-Größe des statistischen Effekts
Was versteht man unter einer unabhängigen Stichprobe?
- Zuordnung eines Individuums zu einer Stichprobe ist nicht von Zuordnung eines Individuums zu anderer Stichprobe beeinflusst
- Bsp: Ziehen der Stichprobe A hat keinen Einfluss auf Ziehung der Stichprobe B
Was versteht man unter einer abhängigen Stichprobe?
- Zusammenstellung einer Stichprobe hat Einfluss auf Zusammenstellung der zweiten Stichprobe
- Bsp: Arbeitszufriedenheit vor und nach der Umstrukturierung -> es werden Messwertpaare gebildet. Daten der ersten Messung mit Daten der zweiten Messung werden bspw. verknüpft
Was ist die Effektgröße + Formel?
- Ist die Differenz zwischen 2 Messwerten, die an Streuung relativiert wird
- Effektgröße ist gegeben mit: d = u1-u2 / ox
- über die Effektgröße kann festgestellt werden ob ein statistischer Effekt auch eine praktische Relevanz hat
- Einteilung der Effektgröße nach Cohen: kleiner Effekt (d >= 20), mittlerer Effekt (d >= 50), großer Effekt (d <= 80)
Nennen Sie die Faktoren, die den ß-Fehler beeinflussen (a-priori)
a-priori zu fällende statistische Entscheidungen über:
- Höhe des a-Niveaus (je höher a-Niveau, desto geringer ß-Fehler)
- ein- oder zweiseitige Testung: Wert für ß-Fehler bei zweiseitiger Testung Höher, da kritischer Testwert höher ausfällt
- Teststärke (1-ß): je höher das Skalenniveau, desto höher die Teststärke -> ß-Fehler gegenläufig zur Teststärke.
Alle Faktoren, die ß-Fehler senken, erhöhen Teststärke
Nennen Sie die Faktoren, die den ß-Fehler beeinflussen (Versuchsplanerische Entscheidung)
Versuchsplanerische Entscheidung:
- Homogenität der Merkmalsverteilung (=Streuung des Merkmals ox): je geringer Merkmal streut, desto geringer fällt der ß-Fehler aus
- Stichprobenumfang: je größer die Stichprobe, desto geringer ist der ß-Fehler (da Stichprobengröße den Standardfehler beeinflusst)
- Größe des statistischen Effekts: je größer der statistische Effekt, desto geringer ist der ß-Fehler
- abhängige vs. unabhängige Stichprobe: abhängig=geringere ß-Fehler, weil hier Unterschied zwischen 2 Stichprobenkennwerten nur auf Untersuchungsbedingungen rückführbar. Bei 2 unabhängigen können bspw. Mittelwertunterschiede durch nicht zufällige Ziehung der Gruppen rückführbar sein
- > alle Faktoren, die den ß-Fehler senken, erhöhen automatisch die Teststärke
Erläutere die Höhe des Alpha-Niveaus im Bezug auf die Beeinflussung des Beta-Fehlers
- a-Fehler und ß-Fehler verhalten sich gegenläufig zueinander -> deshalb a-Niveau nicht niedrig ansetzen (niedriges a-Niveau hat höheren kritischen Testwert und höhere Anforderung an Stichprobengröße)
- niedriges a-Niveau -> höhere Werte für ß-Fehler
Erläutern Sie die Homogenität der Merkmalsverteilung in Bezug auf die Beeinflussung des Beta-Fehlers
+Beispiel Homogenität
=Streuung des untersuchten Merkmals 0x
- je geringer Streuung, desto geringer ß-Fehler
- Bsp: Versuchsperson mit geringstem Gewicht wurde aus Diätprogramm ausgeschlossen (Ausreißer) -> Einfluss auf Streuung (wird geringer -> Werte für ß-Fehler wird geringer)
- Wenn Stichproben mit homogener Merkmalsverteilung untersucht werden, ist die Wahrscheinlichkeit für das Finden signifikanter Mittelwertsdifferenzen größer, als bei Stichproben mit heterogener Merkmalsverteilung
- Standardschätzfehler wird geringer
Beispiel: Für Test Reaktionszeit nur Studenten nehmen, da diese etwa das gleiche Alter haben (Reaktionszeit nimmt im Alter zu)
Erläutern Sie die Größe des statistischen Effekts (μ1-μ2) in Bezug auf die Beeinflussung des ß-Fehlers
- je größer die Differenz zwischen den beiden Mittelwerten ist, desto geringer ist der ß-Fehler
- Bspw: durch Verlängerung der Diät (Intervention) -> Mittelwertdifferenz erhöht sich bspw. um 5 KG
Erläutern Sie den Einfluss von abhängigen vs. unabhängigen Stichproben auf den ß-Fehler
- ß-Fehler wird bei unabhängigen Stichproben größer als bei abhängigen
- Mittelwertdifferenz bei unabhängigen deshalb konservativer interpretiert (weil andere Faktoren die Mittelwertfdifferenz verursachen konnten z.B. Stichprobenziehung)
Erläutern Sie die Teststärke (1-ß) in Bezug auf die Beeinflussung des ß-Fehlers
- verschiedene statistische Prüfverfahren haben unterschiedliche Effizienzen (abhängig vom Skalenniveau)
- je höher Skalenniveau, desto geringer Wert für ß-Fehler
- > immer möglichst hohes Skalenniveau wählen, weil Teststärkstes Verfahren
Was versteht man unter optimalen Stichprobenumfang?
+Einflüsse
- a-priori festlegen um praktische Durchführbarkeit in Bezug auf Stichprobe f Studie zu hinterfragen
- gibt an, welche Stichprobengröße notwendig ist, um bei gegebenem a-Fehler und Teststärke sicherzustellen, dass ein Effekt gefunden werden kann und umgekehrt, sehr kleine Effekte, die keine praktische Bedeutung haben, nicht signifikant werden
- bei Planung der Untersuchung schon sehr relevant
- vor Datenerhebung muss immer optimaler Stichprobenumfang ermittelt werden
- stellt Mindestgröße dar -> je größer Umfang, desto exakter Schätzung -> Kleinhalt der Stichprobe ökonomischer und ethischer
- es sollte ein Dropout von 15% bei Messwiederholungen eingerechnet werden
Nenne Sie die drei Kenngrößen / Parameter, die den Stichprobenumfang beeinflussen und erklären Sie, wie diese ihn beeinflussen
Optimaler Stichprobenumfang kann a-priori festgelegt werden, in Abhängigkeit von a-Fehler und ß-Fehler und der Größe des zu erwartenden Effekt bestimmt werden
- Je kleiner das Signifikanzniveau (a), desto größer der benötigte Stichprobenumfang
- Reduzierung des ß-Fehlers erhöht die benötigte Stichprobengröße
- Je kleiner die Effektgröße, desto größer der benötigte Stichprobenumfang
Nennen Sie die Anforderungen an die Datenqualität um ein geeignetes Prüfverfahren für Maße der zentralen Tendenz auszuwählen
- Skalenniveaus der abhängigen Variable
- Kennwerte aus wie vielen Stichproben sollen verglichen werden?
- Wurden Kennwerte in unabhängigen oder abhängigen Stichproben erhoben?
- Wie groß ist die Stichprobe?
- > nonparametrische (verteilungsfreie) Testverfahren für Daten f-Nominalt / Ordinalskale
- > parametrische Testverfahren (setzen bekannte theoretische Verteilung voraus) für Intervallskala
Nenne das Vorgehen / die Schritte der Hypothesenprüfung
- Formulierung der Nullhypothese & der Alternativhypothese (dadurch wird auch festgelegt oder man gerichtet oder ungerichtet testet)
- Festlegung des Signifikanzniveaus Alpha (z.B. 5%)
- Bestimmung der Teststärke und Effektgröße (skalenniveau /abhängig/unabhängig)
- Festlegung des optimalen Stichprobenumfangs
- Stichprobenerhebung und Ermittlung des / der Kennwerte
- Ermittlung wie Wahrscheinlich die Kennwerte unter Annahme der H0 sind
Ermittlung der Wahrscheinlichkeit der Kennwerte unter Annahme der Nullhypothese. Hierfür die Prüfgröße wählen, die die größte Teststärke für das Skalenniveau aufweist
(Auswahl des Tests + statistische Kennwerte berechnen) - Signifikanzprüfung: Entweder durch Vergleich kritischen und empirischen Wert (und der Entscheidung) und/oder durch den Vergleich von p & Alpha
- Bei nicht-signifikanten Ergebnissen ist die Ermittlung von ß-Fehler bzw. der Testpower relevant
(Berechnung Effektgröße + Teststärke)
Was versteht man unter parametrischen Testverfahren?
- sind alle inferenzstatistischen Tests, die eine Verteilung des untersuchten Merkmals voraussetzen
- die Signifikanz der statistischen Kennwerte anhand der Verteilung prüfen
- mindestens Intervallskala & Normalverteilung
Was ist der Nutzen des z-Test?
- zum Vergleich des Mittelwerts einer Stichprobe mit bekanntem Populationsmittelwert
- überprüft, ob Stichprobe aus der Population entstammt (=keine signifikante Mittelwertdifferenz) oder eben nicht (=signifikante Mittelwertdifferenz)
Nennen Sie die Voraussetzung für den z-Test sowie ein Beispiel sowie die Nullhypothese
Voraussetzung:
- eine Stichprobe
- N >= 30
- Versuchsperson aus Zufallsstichprobe gezogen
- Merkmal: mindestens Intervallskala & Normalverteilt
- vergleicht Stichprobenmittelwert mit bekanntem Populationsmittelwert
Beispiel:
Erbringt eine Schulklasse eine überdurchschnittliche Leistung oder liegen Ergebnisse im zu erwartenden Bereich?
Nullhypothese / (Alternativ):
Erwartungswert der AV in der Population, aus der die Stichprobe gezogen wurde, ist (nicht) gleich groß wie ein bekannter Populationsmittelwert
Wie ist der z-Test zu interpretieren?
H0 verwerfen, wenn:
- errechneter z-Wert größer als kritischer z-Wert der Standardnormalverteilung
- liegt ermittelter z-Wert in Ablehnungsbereich der Nullhypothese -> Stichprobenmittelwert entspricht dann NICHT vorliegender Population
H0 behalten, wenn:
- Betrag kleiner als kritischer z-Wert
- z-Wert > kritischer z-Wert = H0 verwerfen
Nennen Sie die Voraussetzung für den t-Test für eine Stichprobe
- mind. Interavallskala
- Normalverteilung
- Stichprobengröße: für kleine Stichproben (Klein: N < 30 oder N < 10)
- Zufallsstichprobe
- kann obwohl z-test signifikant ausfällt, nicht signifikant ausfallen
Nutzen:
-zum Vergleich des Mittelwertes einer Stichprobe mit bekanntem Populationsmittelwert
Effektgröße: d
Nullhypothese (Alternativ):
Erwartungswert in der Population, aus der die Stichprobe gezogen wurde, ist (nicht) gleich groß wie ein bekannter Populationsmittelwert
Was sind Freiheitsgrade?
Freiheitsgrade (df)
- Anzahl an “frei wählbaren” Werten, die in die Berechnung des statistischen Kennwerts eingehen
- Bei t-Test: df = N-1 (definiert über Stichprobengröße N , den als bekannt vorausgesetzten Stichprobenmittelwert)
Nennen Sie die Voraussetzungen für den t-Test für abhängige Stichproben
- AV ist intervallskaliert
- liegt in Paaren vor
- zwei verbundene Stichproben oder Gruppen vorhanden. Die verschiedenen Messwertpaare sind unabhängig voneinander
- Unterschiede zwischen den verbundenen Testwerten in der Population sind normalverteilt (Bei Stichproben > 30 sind Verletzungen unproblematisch)
- teststärker als t-test für unabhängige Stichproben
-Nullhypothese (Alternativ):
die mittlere Differenz der Messwertpaare ist auf Populationsebene (un-)gleich null
Definieren Sie was unabhängige Stichproben sind.
Welche Voraussetzungen müssen überprüft werden?
- liegt vor, wenn Zuordnung eines Merkmalsträgers zur ersten Stichprobe keinen Einfluss auf Zuordnung einer Merkmalträgers zur zweiten Stichprobe hat
- vor Durchführung muss unter anderem auf Varianzhomogenität geprüft werden (F-Test)
Was versteht man unter Varianzhomogenität?
- ist gegeben, wenn Varianzen beider unabhängiger Stichproben gleich oder zumindest ähnlich sind
- zwei Varianzen sind ähnlich, wenn sie sich nur zufällig von einander unterscheiden