Statistik Seminar Flashcards
Variablen:
kategorial: z.B. Geschlecht
diskret: ganze Zahlen, z.B. Geschwister
stetig: mit Komma
Was sind Hypothesen?
Hypothesen sind vorläufig vermutete Antworten, die Forscher auf ihre Fragen geben
Es kann unterschieden werden zwischen:
Zusammenhangshypothesen und Unterschiedshypothesen
Probabilistische Hypothesen und Deterministische Hypothesen
Nullhypothese und Forschungshypothese
Gerichtete und ungerichtete Hypothese
Moderatorhypothese
uvm.
Welche Voraussetzungen sollten Hypothesen erfüllen? (Teil 1)
- Testbarkeit (Falsifizierbarkeit): Hypothesen müssen empirisch überprüfbar und widerlegbar sein.
- Klarheit und Präzision: Hypothesen sollten eindeutig und spezifisch sein, damit die Variablen klar definiert und messbar sind.
Welche Voraussetzungen sollten Hypothesen erfüllen? (Teil 2)
- Widerspruchsfreiheit: Hypothesen sollten logisch konsistent und ohne interne Widersprüche sein.
- Allgemeingültigkeit: Hypothesen sollten auf eine breitere Population anwendbar sein, nicht nur auf Einzelfälle.
- Relevanz: Hypothesen sollten einen relevanten Beitrag zur Beantwortung der Forschungsfrage leisten.
Wie könnte eine gerichtete Hypothese formuliert werden?
„Die Einnahme von Vitamin D führt zu einer signifikanten Verbesserung der kognitiven Leistungsfähigkeit bei älteren Erwachsenen.“
Wie könnte eine ungerichtete Hypothese formuliert werden?
„Es besteht ein Zusammenhang zwischen der Einnahme von Vitamin D und der kognitiven Leistungsfähigkeit bei älteren Erwachsenen.“
Was sind Beispiele für eine abhängige und eine unabhängige Variable?
Unabhängige Variable: Die Einnahme von Vitamin D.
Abhängige Variable: Die kognitive Leistungsfähigkeit bei älteren Erwachsenen.
Was ist ein Beispiel für eine Zusammenhangshypothese?
„Es besteht ein Zusammenhang zwischen Schlafdauer und Konzentrationsfähigkeit.“ –> je, desto
Was ist ein Beispiel für eine Unterschiedshypothese?
„Männer und Frauen unterscheiden sich in ihrer durchschnittlichen körperlichen Fitness.“
Was ist ein Beispiel für eine probabilistische Hypothese?
„Je mehr Sport eine Person treibt, desto wahrscheinlicher ist es, dass sie gesund bleibt.“
Was ist ein Beispiel für eine deterministische Hypothese?
„Wasser kocht bei 100°C auf Meereshöhe.“
Was ist ein Beispiel für eine Nullhypothese?
„Die Einnahme von Vitamin D hat keinen Einfluss auf die kognitive Leistungsfähigkeit.“
Was ist ein Beispiel für eine Forschungshypothese?
„Die Einnahme von Vitamin D verbessert die kognitive Leistungsfähigkeit.“
Was ist ein Beispiel für eine Moderatorhypothese?
„Der Zusammenhang zwischen Stress und Leistungsfähigkeit hängt vom sozialen Support ab.“
Wissenschaftliche Hypothesen
Wissenschaftliche Hypothesen sind Annahmen über reale Sachverhalte (empirischer Gehalt, empirische Untersuchbarkeit) in Form von Konditionalsätzen.
Sie weisen über den Einzelfall hinaus (Generalisierbarkeit, Allgemeinheitsgrad) und sind durch Erfahrungsdaten widerlegbar (Falsifizierbarkeit).
Frustrierte Menschen reagieren aggressiv.
Bewertung: Diese Aussage kann als wissenschaftliche Hypothese gelten, da sie eine klare und überprüfbare Beziehung zwischen Frustration (unabhängige Variable) und Aggression (abhängige Variable) formuliert. Allerdings wäre eine präzisere Formulierung sinnvoll, etwa durch die Angabe der Bedingungen oder der Art der Aggression.
Es gibt Studierende, die niemals lernen.
Bewertung: Diese Aussage ist eher eine allgemeine Behauptung als eine wissenschaftliche Hypothese. Sie ist nicht spezifisch genug und lässt sich nur schwer empirisch überprüfen. Eine präzisere und messbare Formulierung wäre notwendig, um sie als Hypothese zu klassifizieren.
Bei sozialem Kontakt kann es zu einer Corona-Infektion kommen.
Bewertung: Diese Aussage könnte als wissenschaftliche Hypothese betrachtet werden, da sie eine überprüfbare Annahme über die Beziehung zwischen sozialem Kontakt (unabhängige Variable) und Corona-Infektion (abhängige Variable) darstellt. Allerdings wäre eine genauere Definition von „sozialem Kontakt“ und eine Wahrscheinlichkeitsaussage hilfreich.
Frauen sind gewissenhafter als Männer.
Bewertung: Diese Aussage kann als wissenschaftliche Hypothese gelten, da sie eine klare und überprüfbare Annahme über den Unterschied in der Gewissenhaftigkeit zwischen Frauen und Männern macht. Um wissenschaftlich relevant zu sein, müsste sie präzise definiert und operationalisiert werden, z.B. durch die Messung von Gewissenhaftigkeit anhand spezifischer Indikatoren.
Was will ich untersuchen?
Ein Merkmal bzw. eine Variable
An wem will ich etwas untersuchen?
Merkmalsträger, Untersuchungseinheit, Objekt, Proband, Versuchsperson
Welche Werte kann das Merkmal annehmen?
Merkmalsausprägung
Aber: Nur wenn eine Ausprägung auch durch einen Merkmalsträger „besetzt“ wird, spricht
man von einem Beobachtungswert oder einer Realisation.
Hypothese: „Studierende der Psychologie sind intelligenter als Studierende der BWL.
Unabhängige Variable (UV): Studienfach (Psychologie vs. BWL)
Abhängige Variable (AV): Intelligenz (z.B. gemessen durch einen Intelligenztest oder IQ-Wert)
–>Unterschiedshypothese
Hypothese: „Je höher die Bildung, desto höher das Einkommen.“
Unabhängige Variable (UV): Bildungsniveau (z.B. höchster Bildungsabschluss)
Abhängige Variable (AV): Einkommen (z.B. jährliches Bruttoeinkommen)
–>Zusammenhangshypothese
Quantitative Datenanalyse Grundbegriffe
Wonach lassen sich Variablen klassifizieren?
Nach der Art ihrer Ausprägungen: kategorial, diskret, stetig
Nach ihrer Beobachtbarkeit: latent, manifest
Nach ihrer Rolle im Forschungsprozess: intra-inter, AV-UV
Nominalskala:
Klassifikation von Objekten nach der Relation der Gleichheit oder Verschiedenheit.
Zulässig sind alle ein-eindeutigen Transformationen, bei denen die Kategorien voneinander
unterscheidbar bleiben.
Beispiele: Familienstand, Konfessionszugehörigkeit, Augenfarbe
Ordinalskala:
Objekte können nicht nur klassifiziert werden, sondern auch in eine Rangfolge gebracht werden.
Zulässig sind alle Transformationen, die die Rangfolge der Skalenwerte erhalten (Quadratwurzel,
Logarithmus).
Abstände zwischen den Skalenwerten sind bei einer Ordinalskala nicht sinnvoll interpretierbar.
Beispiele: Schulbildung, Ränge beim Militär, Nutri-Score
Intervallskala:
Objekte können nicht nur klassifiziert und in eine Rangfolge gebracht werden, zusätzlich
informieren die Skalenwerte auch über die Abstände (Intervalle) zwischen den einzelnen
Messwerten der Skala.
Zulässig sind alle positiv linearen Transformationen.
Der Nullpunkt ist willkürlich festgelegt und hat keine inhaltliche Bedeutung.
Beispiele: Temperatur in Grad Celsius, Geburtsjahr, IQ-Wert
Verhältnisskala:
Neben den Eigenschaften der Intervallskala findet man hier einen natürlichen Nullpunkt
Somit sind Aussagen über Verhältnisse möglich – Verhältnisskala.
Es sind nur positiv proportionale Transformationen zulässig.
Beispiele: Temperatur in Grad Kelvin, Einkommen, Gewicht
Skalenniveaus
Skalenniveaus
Nationalität
Merkmalsträger: Individuen (Personen)
Typische Merkmalsausprägungen: Deutsch, Französisch, Italienisch, Spanisch, usw.
Skalenniveau: Nominalskala (Es gibt keine natürliche Reihenfolge oder Rangfolge zwischen den Ausprägungen.)
Schulabschluss
Merkmalsträger: Individuen (Personen)
Typische Merkmalsausprägungen: Hauptschulabschluss, Realschulabschluss, Abitur, Fachhochschulreife, usw.
Skalenniveau: Ordinalskala (Die Ausprägungen haben eine natürliche Reihenfolge, aber die Abstände zwischen den Ausprägungen sind nicht gleich.)
Staatsform
Merkmalsträger: Staaten oder Länder
Typische Merkmalsausprägungen: Demokratie, Monarchie, Diktatur, Republik, usw.
Skalenniveau: Nominalskala (Es gibt keine natürliche Reihenfolge oder Rangfolge zwischen den Ausprägungen.)
Leistung im Modul 24 der MSB
Merkmalsträger: Studierende (Personen, die das Modul absolvieren)
Typische Merkmalsausprägungen: Note (z.B. 1.0 bis 5.0)
Note (1.0 bis 5.0): Ordinalskala (Die Ausprägungen haben eine natürliche Reihenfolge, aber die Abstände sind nicht gleich.)
Entscheiden Sie ob die folgenden Variablen kategorial, diskret oder stetig (kontinuierlich)
sind und bestimmen Sie das Skalenniveau!
a) Parteipräferenz
b) Nutri-Score
c) Chartplatzierung
d) Anzahl Kursteilnehmer
e) Lebenszufriedenheit
f) Inflationsrate
g) Herstellungsdauer eines Produkts
h) Benzinverbrauch
i) Musikrichtung
j) Intelligenzquotient
a) kategorial, nominal
b) kategorial (mit ordinalem Charakter), ordinal
c) diskret, ordinal
d) diskret, verhältnis
e) diskret oder stetig, ordinal (bei Bewertungsskala) oder intervall (bei kontinuierlicher Messung)
f) stetig, verhältnis
g) stetig, verhältnis
h) stetig, verhältnis
i) kategorial, nominal
j) diskret, intervall
Welche Möglichkeiten stehen zur Verfügung, um Erleben und Verhalten tatsächlich zu messen?
- Auf Konstrukte verzichten und tatsächliche Messungen vornehmen.
- Hochwertige Item-Entwicklung (Abstufungen quantifizierbar).
- Mehrere Items verwenden, die auf ein zugrunde liegendes kontinuierliches Merkmal hinweisen.
Forschungsdesign zur Überprüfung von Diskriminierung bei Bewerbungen
Forschungsfrage:
Hat der Name einer Bewerberin (z.B. türkischer Name vs. deutscher Name) einen Einfluss auf die Rückmeldung von Unternehmen auf Bewerbungen?
Hypothese:
Bewerbungen mit einem türkischen Namen erhalten weniger positive Rückmeldungen als Bewerbungen mit einem typisch deutschen Namen.
Untersuchungsdesign:
Stichprobe: Bewerbungen an Unternehmen senden.
Bewerbungsprofile: Zwei identische Lebensläufe, die sich nur im Namen unterscheiden (z.B. „Çiçek Yilmaz“ vs. „Anna Müller“).
Datenerhebung: Dokumentation der Rückmeldungen (Einladungen, Absagen, keine Rückmeldung).
Variablen:
Unabhängige Variable (UV): Name der Bewerberin (türkischer Name vs. deutscher Name).
Abhängige Variable (AV): Art der Rückmeldung (Einladung, Absage, keine Rückmeldung).
Datenanalyse:
Vergleich der positiven Rückmeldungen zwischen den beiden Gruppen mittels statistischer Tests.
Ethik:
Informieren der Unternehmen über den Studienzweck nach Abschluss der Datenerhebung.
Varianten der Stichprobenziehung mit Beispielen
- Zufallsstichprobe:
Jede Einheit hat gleiche Chance, ausgewählt zu werden.
Beispiel: Zufällige Auswahl von 100 Personen aus einer Wählerliste.
Problem: Hoher Aufwand, mögliche Verzerrungen. - Geschichtete Stichprobe:
Population wird in Schichten aufgeteilt, Zufallsauswahl pro Schicht.
Beispiel: Auswahl von 50 Männern und 50 Frauen aus verschiedenen Altersgruppen.
Problem: Komplexität, ungenaue Schichtung. - Klumpenstichprobe:
Population in Gruppen (Klumpen) geteilt, zufällige Auswahl von Klumpen.
Beispiel: Auswahl von Klassen aus Schulen, alle Schüler in diesen Klassen werden befragt.
Problem: Höhere Fehlerwahrscheinlichkeit, begrenzte Repräsentativität. - Systematische Stichprobe:
Jede k-te Einheit wird nach einer zufälligen Startpunktwahl ausgewählt.
Beispiel: Jeder 10. Passant auf der Straße wird angesprochen.
Problem: Periodizität kann zu Verzerrungen führen. - Quotenstichprobe:
Bestimmte Quoten für Gruppen festgelegt, gezielte Auswahl innerhalb der Quoten.
Beispiel: Befragung von 30% Jugendlichen, 50% Erwachsenen, 20% Senioren.
Problem: Subjektivität, weniger Zufälligkeit. - Gezielte Stichprobe:
Bewusste Auswahl bestimmter Einheiten für spezifische Merkmale.
Beispiel: Auswahl von Experten für eine spezielle Befragung.
Problem: Geringe Verallgemeinerbarkeit, Bias. - Bequemlichkeitsstichprobe:
Einfache, leicht zugängliche Einheiten werden ausgewählt.
Beispiel: Befragung von Studenten auf dem Campus.
Problem: Starke Verzerrung, geringe Verallgemeinerbarkeit. - Schneeballstichprobe:
Teilnehmer empfehlen weitere Teilnehmer.
Beispiel: Befragung von Mitgliedern einer bestimmten Subkultur durch Weiterempfehlung.
Problem: Homogenität, verzerrte Netzwerke.
Beispiel für ein 2x2x3 Design
Versuchsdesign:
Drei unabhängige Variablen:
Variable 1: Geschlecht
Stufe 1: Männlich
Stufe 2: Weiblich
Variable 2: Medikamentendosis
Stufe 1: Niedrig
Stufe 2: Hoch
Variable 3: Art der Therapie
Stufe 1: Kognitive Verhaltenstherapie
Stufe 2: Psychodynamische Therapie
Stufe 3: Keine Therapie (Kontrollgruppe)
Fragestellung:
Wie beeinflussen Geschlecht, Medikamentendosis und Art der Therapie den Behandlungserfolg bei Depression?
Anzahl der Bedingungen:
12 Bedingungen (2 x 2 x 3)
RCT-Studien (Randomized Controlled Trials)
Definition:
RCT-Studien (Randomized Controlled Trials) sind randomisierte kontrollierte Studien, die zur Überprüfung von Kausalzusammenhängen verwendet werden und als Goldstandard in der Forschung gelten.
Merkmale:
Randomisierung: Teilnehmer werden zufällig in Gruppen eingeteilt.
Kontrollgruppe: Eine Gruppe erhält ein Placebo oder Standardbehandlung, die andere die zu testende Intervention.
Verblindung: Studien können einfach oder doppelt verblindet sein, um Bias zu reduzieren.
Ziel:
Überprüfung der Wirksamkeit und Sicherheit von Behandlungen oder Interventionen durch den Vergleich von Gruppen.
Beispiel:
Test eines neuen Medikaments gegen Bluthochdruck im Vergleich zu einem Placebo.
Aufbau einer Häufigkeitstabelle:
Merkmalsausprägung
Kodierung
Absolute Häufigkeit
relative (gültige) Häufigkeit
kumulierte Häufigkeit
Arithmetisches Mittel (Mittelwert):
Definition: Summe aller Werte geteilt durch die Anzahl der Werte.
Information: Gibt den Durchschnitt einer Datenmenge an, empfindlich gegenüber Ausreißern.
Median:
Definition: Mittlerer Wert einer geordneten Datenreihe.
Information: Gibt den zentralen Wert an, robust gegenüber Ausreißern.
Modus (Modalwert):
Definition: Häufigster Wert in einer Datenreihe.
Information: Zeigt den am häufigsten auftretenden Wert an, kann mehrfach auftreten (bimodal, multimodal).
Z-Standardisierung
Z Standardisierung Aufgabe
Bivariate Statistik - Korrelation
Voraussetzung Pearson Korrelation
Mindestens Intervallskalenniveau
Linearer Zusammenhang
Keine deutlichen Ausreißer
Welchen Wertebereich hat der Korrelationskoeffizient?
Der Korrelationskoeffizient 𝑟 nach Pearson kann Werte im Bereich von -1 bis +1 annehmen.
-1: Perfekte negative Korrelation
0: Kein linearer Zusammenhang
+1: Perfekte positive Korrelation
Wann wird von einem schwachen, mittleren oder starken Zusammenhang gesprochen?
Schwacher Zusammenhang: ∣r∣ zwischen 0,1 und 0,3
Mittlerer Zusammenhang: ∣r∣ zwischen 0,3 und 0,5
Starker Zusammenhang: ∣r∣ größer als 0,5
Korrelation
Der Pearson-Korrelationskoeffizient 𝑟 wird verwendet, um den Zusammenhang zwischen zwei metrisch skalierten Variablen zu interpretieren. Dieser Koeffizient hat einen Wertebereich von -1 bis +1 und zeigt sowohl die Stärke als auch die Richtung des Zusammenhangs an.
Positiver Zusammenhang:
Beispiel: Je größer der Lernaufwand (in Stunden) für die Klausur, desto höher die erreichte Punktzahl in der Klausur.
Negativer Zusammenhang:
Beispiel: Je größer die Zahl der Personen im Haushalt, desto niedriger das Pro-Kopf-Einkommen.
Korrelation Berechnung
Kennwerte Berechnung Pearson Korrelation
Mittelwerte
Varianzen bzw. Standardabweichungen
Kovarianz
Alternative Koeffizienten, falls Voraussetzungen für Pearson nicht erfüllt
Kendalls tau
Spearmans Rho
Bezeichnungen der Variablen in der Regressionsanalyse
Lineare Regression
Regressionskoeffizient 𝑏:
Geometrisch: Steigung der Regressionsgeraden.
Inhaltlich: Gibt an, um welchen Betrag sich die abhängige Variable
𝑌 verändert, wenn sich die unabhängige Variable 𝑋 um eine Einheit erhöht.
Regressionskonstante (a oder b0):
Geometrisch: Schnittpunkt der Regressionsgeraden mit der Y-Achse.
Inhaltlich: Gibt den Vorhersagewert für 𝑌 an, wenn 𝑋 den Wert 0 hat.
Determinationskoeffizient R2
Bedeutung: Maß für die Güte des Regressionsmodells.
Wertebereich: 0 bis 1 (häufig als Prozentwert).
QS: Je kleiner die Quadratsumme der Residuen, desto besser die Anpassung.
Berechnung des Korrelationskoeffizienten
Die gemeinsame Streuung der Variablen wird durch das Produkt der jeweiligen standardisierten Streuungen dividiert.
Voraussetzungen für Pearson Korrelation
Mindestens Intervallskalenniveau
Linearer Zusammenhang
Keine deutlichen Ausreißer
Kennwerte für die Berechnung der Pearson Korrelation
Mittelwerte
Varianzen bzw. Standardabweichungen
Kovarianz
Alternative Koeffizienten zur Pearson Korrelation
Kendalls tau
Spearmans Rho
Einführung in die lineare Regression
Analyse von Beziehungen zwischen einer abhängigen Variable und einer oder mehreren unabhängigen Variablen.
Verwendung für Beschreibung, Erklärung und Prognose von Zusammenhängen.
Grundlegende Konzepte der linearen Regression
Regressionsgleichung
Interpretation des Determinationskoeffizienten
Verhältnis der durch das Modell erklärten Streuung zur Gesamtstreuung der abhängigen Variable.
Beispiel: R2=0,627 bedeutet, dass 62,7% der Varianz der abhängigen Variable durch das Modell erklärt wird.
Für welchen Fall wird die sogenannte logistische Regression angewendet?
Wenn die abhängige Variable dichotom ist (z.B. Ja/Nein, Erfolg/Misserfolg), wird die logistische Regression angewendet.
Voraussetzungen für die Durchführung der linearen Regression
Die abhängige Variable muss metrisch skaliert sein.
Linearer Zusammenhang zwischen den Variablen.
Normalverteilung der Residuen.
Homoskedastizität der Residuen.
Keine starke Multikollinearität zwischen den unabhängigen Variablen.
Kreuztabelle und Phi-Koeffizient
Vorzeichen kann weggelassen werden! 1 perfekter Zusammenhang
immer beides nennen, Phi Koeffizienten und anderen Wert zur Interpretation!
Vierfeldertafel und klinische Kennwerte
Effektstärke für Mittelwertdifferenz - Cohens d
Cohens d Zusammenhangsstärke
0,2 schwach
0.5 mittel
0,8 stark
Welcher Koeffizient bzw. welches Verfahren wird benötigt?
Im Rahmen einer Studie zur Verkehrssicherheit wird von 86 Versuchspersonen
verschiedener Jahrgänge das Seh- und Hörvermögen, die Beweglichkeit und die
Reaktionsgeschwindigkeit getestet. Für Letzteres wurden sogenannte
Entscheidungszeiten (Zeitintervall zwischen Signal und Loslassen einer
Ruhetaste) gemessen. Es soll unter anderem ermittelt werden, wie stark die
Reaktionszeiten durch das Alter beeinflusst werden.
Für die Analyse, wie stark die Reaktionszeiten durch das Alter beeinflusst werden, wäre die lineare Regression das geeignete Verfahren. In diesem Fall ist das Alter die unabhängige Variable (Prädiktor), und die Reaktionszeiten sind die abhängige Variable.
Der Regressionskoeffizient 𝑏 in der linearen Regression gibt an, wie stark die Reaktionszeiten (abhängige Variable) durch eine Veränderung des Alters (unabhängige Variable) beeinflusst werden.
Welcher Koeffizient bzw. welches Verfahren wird benötigt?
Bei 243 Bewerbern und Bewerberinnen für die Ausbildung zum
Flugverkehrslotsen wurden Geschlechtsunterschiede in den Leistungen bei
einem Reaktionstest untersucht. In Millisekunden wurden die sogenannten
Bewegungszeiten (Zeitintervall zwischen Loslassen der Ruhetaste und Drücken
der Zieltaste) gemessen. Es wird vermutet, dass die Reaktionszeiten der
Männer etwas schneller sind als bei den Frauen.
Verfahren: t-Test für unabhängige Stichproben (Zwei-Stichproben-t-Test)
Zweck: Vergleich der Mittelwerte der Bewegungszeiten (in Millisekunden) zwischen Männern und Frauen, um zu prüfen, ob die Reaktionszeiten der Männer signifikant schneller sind.
Zusätzliche Kennzahl: Cohen’s d zur Quantifizierung der Effektgröße, also des Unterschieds zwischen den beiden Gruppen.
Ziel einer Metaanalyse
Eine Metaanalyse zielt darauf ab, die Ergebnisse mehrerer Studien zu einem bestimmten Thema zu kombinieren und zu analysieren, um eine übergreifende Schlussfolgerung zu ziehen. Sie bietet eine präzisere Schätzung des Effekts oder Zusammenhangs, indem die statistische Power erhöht wird.
Probleme bei einer Metaanalyse
Publikationsbias: Studien mit signifikanten Ergebnissen werden häufiger veröffentlicht, was die Ergebnisse der Metaanalyse verzerren kann.
Heterogenität: Unterschiedliche Studien können stark variieren in Bezug auf Design, Population, Messmethoden usw., was die Vergleichbarkeit und die Interpretation der Ergebnisse erschwert.
Qualität der Studien: Variationen in der methodischen Qualität der eingeschlossenen Studien können die Zuverlässigkeit der Metaanalyse beeinträchtigen.
Aspekte der Vertrauenswürdigkeit und Bedeutsamkeit
Vertrauenswürdigkeit von Daten: Datenqualität, Studiendesign, Repräsentativität, Datenquelle, Messmethoden.
Bedeutsamkeit der Ergebnisse: Statistische Signifikanz, praktische Relevanz, Effektgröße, Kontextuelle Faktoren.
Generalisierbarkeit: Stichprobenrepräsentativität, externe Validität, Studiendesign, Replikationsstudien.
Ziel der Inferenzstatistik
Ziel: Schluss von der Stichprobe auf die Grundgesamtheit unter Verwendung von Wahrscheinlichkeiten.
Bedeutung: Verallgemeinerungen, die das Risiko eines Fehlschlusses bergen.
Schätzen und Testen in der Inferenzstatistik
Schätzen: Bestimmung des Unsicherheitsgrades bei Verallgemeinerungen, z.B. Konfidenzintervalle.
Testen: Wahrscheinlichkeit, dass das Stichprobenergebnis zufällig ist, z.B. Signifikanztests.
Exkurs – Normalverteilung
Die wichtigste stetige Wahrscheinlichkeitsverteilung
Bedeutung: Verteilungsmodell für statistische Kennwerte, Grundlage vieler statistischer Verfahren.
Eigenschaften: Glockenförmig, unimodal, symmetrisch, asymptotisch an die x-Achse, s-förmige Verteilungsfunktion.
Normalverteilung ist keine bestimmte Verteilung mit festen Werten, sondern
eine ganze Klasse von Verteilungen mit den Parametern Erwartungswert
MüX und Standardabweichung SigmaX
Wahrscheinlichkeitsbereiche in der Normalverteilung
± 1 Standardabweichung: Etwa 68,27% der Werte.
± 2 Standardabweichungen: Etwa 95,45% der Werte.
Standardfehler
Definition: Standardabweichung einer Stichprobenverteilung, quantifiziert Schwankungen von Stichprobenkennwerten. (Maß der Genauigkeit einer Schätzung)
Bedeutung: Je kleiner der Standardfehler, desto genauer die Schätzung des Populationsparameters.
Faktoren: Streuung in der Population und Stichprobenumfang.
Exkurs – t-Verteilung
Nutzung: Wird verwendet, wenn die Streuung in der Population unbekannt ist oder die Stichprobe klein ist.
Eigenschaften:
Unimodal und symmetrisch.
Form der Verteilung hängt von den Freiheitsgraden (df = n - 1) ab.
Nähert sich mit zunehmenden Freiheitsgraden der Standardnormalverteilung an.
Konfidenzintervall
Signifikanztest
Ziel: Überprüft, ob ein Effekt in einer Stichprobe zufällig oder repräsentativ für die Population ist.
Nullhypothese: Unterstellt, dass es in der Population keinen Effekt gibt.
Vorgehen: Der Signifikanztest prüft, ob das Stichprobenergebnis so unwahrscheinlich ist, dass die Nullhypothese abgelehnt werden sollte.
Signifikanztest – Allgemeine Erläuterung
Ziel: Beurteilen, ob ein Stichprobenergebnis zufällig zustande gekommen ist oder verallgemeinert werden könnte.
Nullhypothese: Unterstellt, dass es in der Population keinen Effekt gibt.
Testziel: Zeigen, dass das Stichprobenergebnis so unwahrscheinlich ist, dass die Nullhypothese abgelehnt wird.
T-Test für unabhängige Stichproben
Signifikanztest für den Korrelationskoeffizienten
Was wird an den beiden Achsen eines Funnel Plots abgetragen?
Stichprobengröße und Effektgröße
Was zeigt eine Häufigkeitsverteilung?
Die Werte einzelner Fälle (z.B. Personen) in einer Stichprobe