Statistik Seminar Flashcards

1
Q

Variablen:

A

kategorial: z.B. Geschlecht
diskret: ganze Zahlen, z.B. Geschwister
stetig: mit Komma

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was sind Hypothesen?

A

Hypothesen sind vorläufig vermutete Antworten, die Forscher auf ihre Fragen geben

Es kann unterschieden werden zwischen:

Zusammenhangshypothesen und Unterschiedshypothesen
Probabilistische Hypothesen und Deterministische Hypothesen
Nullhypothese und Forschungshypothese
Gerichtete und ungerichtete Hypothese
Moderatorhypothese
uvm.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Welche Voraussetzungen sollten Hypothesen erfüllen? (Teil 1)

A
  1. Testbarkeit (Falsifizierbarkeit): Hypothesen müssen empirisch überprüfbar und widerlegbar sein.
  2. Klarheit und Präzision: Hypothesen sollten eindeutig und spezifisch sein, damit die Variablen klar definiert und messbar sind.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Welche Voraussetzungen sollten Hypothesen erfüllen? (Teil 2)

A
  1. Widerspruchsfreiheit: Hypothesen sollten logisch konsistent und ohne interne Widersprüche sein.
  2. Allgemeingültigkeit: Hypothesen sollten auf eine breitere Population anwendbar sein, nicht nur auf Einzelfälle.
  3. Relevanz: Hypothesen sollten einen relevanten Beitrag zur Beantwortung der Forschungsfrage leisten.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wie könnte eine gerichtete Hypothese formuliert werden?

A

„Die Einnahme von Vitamin D führt zu einer signifikanten Verbesserung der kognitiven Leistungsfähigkeit bei älteren Erwachsenen.“

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wie könnte eine ungerichtete Hypothese formuliert werden?

A

„Es besteht ein Zusammenhang zwischen der Einnahme von Vitamin D und der kognitiven Leistungsfähigkeit bei älteren Erwachsenen.“

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was sind Beispiele für eine abhängige und eine unabhängige Variable?

A

Unabhängige Variable: Die Einnahme von Vitamin D.

Abhängige Variable: Die kognitive Leistungsfähigkeit bei älteren Erwachsenen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was ist ein Beispiel für eine Zusammenhangshypothese?

A

„Es besteht ein Zusammenhang zwischen Schlafdauer und Konzentrationsfähigkeit.“ –> je, desto

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist ein Beispiel für eine Unterschiedshypothese?

A

„Männer und Frauen unterscheiden sich in ihrer durchschnittlichen körperlichen Fitness.“

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was ist ein Beispiel für eine probabilistische Hypothese?

A

„Je mehr Sport eine Person treibt, desto wahrscheinlicher ist es, dass sie gesund bleibt.“

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was ist ein Beispiel für eine deterministische Hypothese?

A

„Wasser kocht bei 100°C auf Meereshöhe.“

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was ist ein Beispiel für eine Nullhypothese?

A

„Die Einnahme von Vitamin D hat keinen Einfluss auf die kognitive Leistungsfähigkeit.“

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was ist ein Beispiel für eine Forschungshypothese?

A

„Die Einnahme von Vitamin D verbessert die kognitive Leistungsfähigkeit.“

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was ist ein Beispiel für eine Moderatorhypothese?

A

„Der Zusammenhang zwischen Stress und Leistungsfähigkeit hängt vom sozialen Support ab.“

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wissenschaftliche Hypothesen

A

Wissenschaftliche Hypothesen sind Annahmen über reale Sachverhalte (empirischer Gehalt, empirische Untersuchbarkeit) in Form von Konditionalsätzen.
Sie weisen über den Einzelfall hinaus (Generalisierbarkeit, Allgemeinheitsgrad) und sind durch Erfahrungsdaten widerlegbar (Falsifizierbarkeit).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Frustrierte Menschen reagieren aggressiv.

A

Bewertung: Diese Aussage kann als wissenschaftliche Hypothese gelten, da sie eine klare und überprüfbare Beziehung zwischen Frustration (unabhängige Variable) und Aggression (abhängige Variable) formuliert. Allerdings wäre eine präzisere Formulierung sinnvoll, etwa durch die Angabe der Bedingungen oder der Art der Aggression.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Es gibt Studierende, die niemals lernen.

A

Bewertung: Diese Aussage ist eher eine allgemeine Behauptung als eine wissenschaftliche Hypothese. Sie ist nicht spezifisch genug und lässt sich nur schwer empirisch überprüfen. Eine präzisere und messbare Formulierung wäre notwendig, um sie als Hypothese zu klassifizieren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Bei sozialem Kontakt kann es zu einer Corona-Infektion kommen.

A

Bewertung: Diese Aussage könnte als wissenschaftliche Hypothese betrachtet werden, da sie eine überprüfbare Annahme über die Beziehung zwischen sozialem Kontakt (unabhängige Variable) und Corona-Infektion (abhängige Variable) darstellt. Allerdings wäre eine genauere Definition von „sozialem Kontakt“ und eine Wahrscheinlichkeitsaussage hilfreich.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Frauen sind gewissenhafter als Männer.

A

Bewertung: Diese Aussage kann als wissenschaftliche Hypothese gelten, da sie eine klare und überprüfbare Annahme über den Unterschied in der Gewissenhaftigkeit zwischen Frauen und Männern macht. Um wissenschaftlich relevant zu sein, müsste sie präzise definiert und operationalisiert werden, z.B. durch die Messung von Gewissenhaftigkeit anhand spezifischer Indikatoren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Was will ich untersuchen?

A

Ein Merkmal bzw. eine Variable

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

An wem will ich etwas untersuchen?

A

Merkmalsträger, Untersuchungseinheit, Objekt, Proband, Versuchsperson

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Welche Werte kann das Merkmal annehmen?

A

Merkmalsausprägung

Aber: Nur wenn eine Ausprägung auch durch einen Merkmalsträger „besetzt“ wird, spricht
man von einem Beobachtungswert oder einer Realisation.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Hypothese: „Studierende der Psychologie sind intelligenter als Studierende der BWL.

A

Unabhängige Variable (UV): Studienfach (Psychologie vs. BWL)
Abhängige Variable (AV): Intelligenz (z.B. gemessen durch einen Intelligenztest oder IQ-Wert)

–>Unterschiedshypothese

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Hypothese: „Je höher die Bildung, desto höher das Einkommen.“

A

Unabhängige Variable (UV): Bildungsniveau (z.B. höchster Bildungsabschluss)
Abhängige Variable (AV): Einkommen (z.B. jährliches Bruttoeinkommen)

–>Zusammenhangshypothese

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Quantitative Datenanalyse Grundbegriffe

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Wonach lassen sich Variablen klassifizieren?

A

Nach der Art ihrer Ausprägungen: kategorial, diskret, stetig
Nach ihrer Beobachtbarkeit: latent, manifest
Nach ihrer Rolle im Forschungsprozess: intra-inter, AV-UV

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Nominalskala:

A

Klassifikation von Objekten nach der Relation der Gleichheit oder Verschiedenheit.

Zulässig sind alle ein-eindeutigen Transformationen, bei denen die Kategorien voneinander
unterscheidbar bleiben.

Beispiele: Familienstand, Konfessionszugehörigkeit, Augenfarbe

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Ordinalskala:

A

Objekte können nicht nur klassifiziert werden, sondern auch in eine Rangfolge gebracht werden.

Zulässig sind alle Transformationen, die die Rangfolge der Skalenwerte erhalten (Quadratwurzel,
Logarithmus).

Abstände zwischen den Skalenwerten sind bei einer Ordinalskala nicht sinnvoll interpretierbar.

Beispiele: Schulbildung, Ränge beim Militär, Nutri-Score

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Intervallskala:

A

Objekte können nicht nur klassifiziert und in eine Rangfolge gebracht werden, zusätzlich
informieren die Skalenwerte auch über die Abstände (Intervalle) zwischen den einzelnen
Messwerten der Skala.

Zulässig sind alle positiv linearen Transformationen.

Der Nullpunkt ist willkürlich festgelegt und hat keine inhaltliche Bedeutung.

Beispiele: Temperatur in Grad Celsius, Geburtsjahr, IQ-Wert

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Verhältnisskala:

A

Neben den Eigenschaften der Intervallskala findet man hier einen natürlichen Nullpunkt

Somit sind Aussagen über Verhältnisse möglich – Verhältnisskala.

Es sind nur positiv proportionale Transformationen zulässig.

Beispiele: Temperatur in Grad Kelvin, Einkommen, Gewicht

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Skalenniveaus

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

Skalenniveaus

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

Nationalität

A

Merkmalsträger: Individuen (Personen)
Typische Merkmalsausprägungen: Deutsch, Französisch, Italienisch, Spanisch, usw.
Skalenniveau: Nominalskala (Es gibt keine natürliche Reihenfolge oder Rangfolge zwischen den Ausprägungen.)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

Schulabschluss

A

Merkmalsträger: Individuen (Personen)
Typische Merkmalsausprägungen: Hauptschulabschluss, Realschulabschluss, Abitur, Fachhochschulreife, usw.
Skalenniveau: Ordinalskala (Die Ausprägungen haben eine natürliche Reihenfolge, aber die Abstände zwischen den Ausprägungen sind nicht gleich.)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

Staatsform

A

Merkmalsträger: Staaten oder Länder
Typische Merkmalsausprägungen: Demokratie, Monarchie, Diktatur, Republik, usw.
Skalenniveau: Nominalskala (Es gibt keine natürliche Reihenfolge oder Rangfolge zwischen den Ausprägungen.)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

Leistung im Modul 24 der MSB

A

Merkmalsträger: Studierende (Personen, die das Modul absolvieren)
Typische Merkmalsausprägungen: Note (z.B. 1.0 bis 5.0)
Note (1.0 bis 5.0): Ordinalskala (Die Ausprägungen haben eine natürliche Reihenfolge, aber die Abstände sind nicht gleich.)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q

Entscheiden Sie ob die folgenden Variablen kategorial, diskret oder stetig (kontinuierlich)
sind und bestimmen Sie das Skalenniveau!
a) Parteipräferenz
b) Nutri-Score
c) Chartplatzierung
d) Anzahl Kursteilnehmer
e) Lebenszufriedenheit
f) Inflationsrate
g) Herstellungsdauer eines Produkts
h) Benzinverbrauch
i) Musikrichtung
j) Intelligenzquotient

A

a) kategorial, nominal
b) kategorial (mit ordinalem Charakter), ordinal
c) diskret, ordinal
d) diskret, verhältnis
e) diskret oder stetig, ordinal (bei Bewertungsskala) oder intervall (bei kontinuierlicher Messung)
f) stetig, verhältnis
g) stetig, verhältnis
h) stetig, verhältnis
i) kategorial, nominal
j) diskret, intervall

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
37
Q

Welche Möglichkeiten stehen zur Verfügung, um Erleben und Verhalten tatsächlich zu messen?

A
  1. Auf Konstrukte verzichten und tatsächliche Messungen vornehmen.
  2. Hochwertige Item-Entwicklung (Abstufungen quantifizierbar).
  3. Mehrere Items verwenden, die auf ein zugrunde liegendes kontinuierliches Merkmal hinweisen.
38
Q

Forschungsdesign zur Überprüfung von Diskriminierung bei Bewerbungen

A

Forschungsfrage:
Hat der Name einer Bewerberin (z.B. türkischer Name vs. deutscher Name) einen Einfluss auf die Rückmeldung von Unternehmen auf Bewerbungen?

Hypothese:
Bewerbungen mit einem türkischen Namen erhalten weniger positive Rückmeldungen als Bewerbungen mit einem typisch deutschen Namen.

Untersuchungsdesign:
Stichprobe: Bewerbungen an Unternehmen senden.
Bewerbungsprofile: Zwei identische Lebensläufe, die sich nur im Namen unterscheiden (z.B. „Çiçek Yilmaz“ vs. „Anna Müller“).
Datenerhebung: Dokumentation der Rückmeldungen (Einladungen, Absagen, keine Rückmeldung).

Variablen:
Unabhängige Variable (UV): Name der Bewerberin (türkischer Name vs. deutscher Name).
Abhängige Variable (AV): Art der Rückmeldung (Einladung, Absage, keine Rückmeldung).

Datenanalyse:
Vergleich der positiven Rückmeldungen zwischen den beiden Gruppen mittels statistischer Tests.

Ethik:
Informieren der Unternehmen über den Studienzweck nach Abschluss der Datenerhebung.

39
Q

Varianten der Stichprobenziehung mit Beispielen

A
  1. Zufallsstichprobe:
    Jede Einheit hat gleiche Chance, ausgewählt zu werden.
    Beispiel: Zufällige Auswahl von 100 Personen aus einer Wählerliste.
    Problem: Hoher Aufwand, mögliche Verzerrungen.
  2. Geschichtete Stichprobe:
    Population wird in Schichten aufgeteilt, Zufallsauswahl pro Schicht.
    Beispiel: Auswahl von 50 Männern und 50 Frauen aus verschiedenen Altersgruppen.
    Problem: Komplexität, ungenaue Schichtung.
  3. Klumpenstichprobe:
    Population in Gruppen (Klumpen) geteilt, zufällige Auswahl von Klumpen.
    Beispiel: Auswahl von Klassen aus Schulen, alle Schüler in diesen Klassen werden befragt.
    Problem: Höhere Fehlerwahrscheinlichkeit, begrenzte Repräsentativität.
  4. Systematische Stichprobe:
    Jede k-te Einheit wird nach einer zufälligen Startpunktwahl ausgewählt.
    Beispiel: Jeder 10. Passant auf der Straße wird angesprochen.
    Problem: Periodizität kann zu Verzerrungen führen.
  5. Quotenstichprobe:
    Bestimmte Quoten für Gruppen festgelegt, gezielte Auswahl innerhalb der Quoten.
    Beispiel: Befragung von 30% Jugendlichen, 50% Erwachsenen, 20% Senioren.
    Problem: Subjektivität, weniger Zufälligkeit.
  6. Gezielte Stichprobe:
    Bewusste Auswahl bestimmter Einheiten für spezifische Merkmale.
    Beispiel: Auswahl von Experten für eine spezielle Befragung.
    Problem: Geringe Verallgemeinerbarkeit, Bias.
  7. Bequemlichkeitsstichprobe:
    Einfache, leicht zugängliche Einheiten werden ausgewählt.
    Beispiel: Befragung von Studenten auf dem Campus.
    Problem: Starke Verzerrung, geringe Verallgemeinerbarkeit.
  8. Schneeballstichprobe:
    Teilnehmer empfehlen weitere Teilnehmer.
    Beispiel: Befragung von Mitgliedern einer bestimmten Subkultur durch Weiterempfehlung.
    Problem: Homogenität, verzerrte Netzwerke.
40
Q

Beispiel für ein 2x2x3 Design

A

Versuchsdesign:
Drei unabhängige Variablen:

Variable 1: Geschlecht
Stufe 1: Männlich
Stufe 2: Weiblich

Variable 2: Medikamentendosis
Stufe 1: Niedrig
Stufe 2: Hoch

Variable 3: Art der Therapie
Stufe 1: Kognitive Verhaltenstherapie
Stufe 2: Psychodynamische Therapie
Stufe 3: Keine Therapie (Kontrollgruppe)

Fragestellung:
Wie beeinflussen Geschlecht, Medikamentendosis und Art der Therapie den Behandlungserfolg bei Depression?

Anzahl der Bedingungen:
12 Bedingungen (2 x 2 x 3)

41
Q

RCT-Studien (Randomized Controlled Trials)

A

Definition:
RCT-Studien (Randomized Controlled Trials) sind randomisierte kontrollierte Studien, die zur Überprüfung von Kausalzusammenhängen verwendet werden und als Goldstandard in der Forschung gelten.

Merkmale:
Randomisierung: Teilnehmer werden zufällig in Gruppen eingeteilt.
Kontrollgruppe: Eine Gruppe erhält ein Placebo oder Standardbehandlung, die andere die zu testende Intervention.
Verblindung: Studien können einfach oder doppelt verblindet sein, um Bias zu reduzieren.

Ziel:
Überprüfung der Wirksamkeit und Sicherheit von Behandlungen oder Interventionen durch den Vergleich von Gruppen.

Beispiel:
Test eines neuen Medikaments gegen Bluthochdruck im Vergleich zu einem Placebo.

42
Q

Aufbau einer Häufigkeitstabelle:

A

Merkmalsausprägung
Kodierung
Absolute Häufigkeit
relative (gültige) Häufigkeit
kumulierte Häufigkeit

43
Q

Arithmetisches Mittel (Mittelwert):

A

Definition: Summe aller Werte geteilt durch die Anzahl der Werte.
Information: Gibt den Durchschnitt einer Datenmenge an, empfindlich gegenüber Ausreißern.

44
Q

Median:

A

Definition: Mittlerer Wert einer geordneten Datenreihe.
Information: Gibt den zentralen Wert an, robust gegenüber Ausreißern.

45
Q

Modus (Modalwert):

A

Definition: Häufigster Wert in einer Datenreihe.
Information: Zeigt den am häufigsten auftretenden Wert an, kann mehrfach auftreten (bimodal, multimodal).

46
Q

Z-Standardisierung

A
47
Q

Z Standardisierung Aufgabe

A
48
Q

Bivariate Statistik - Korrelation

A
49
Q

Voraussetzung Pearson Korrelation

A

Mindestens Intervallskalenniveau
Linearer Zusammenhang
Keine deutlichen Ausreißer

50
Q

Welchen Wertebereich hat der Korrelationskoeffizient?

A

Der Korrelationskoeffizient 𝑟 nach Pearson kann Werte im Bereich von -1 bis +1 annehmen.
-1: Perfekte negative Korrelation
0: Kein linearer Zusammenhang
+1: Perfekte positive Korrelation

51
Q

Wann wird von einem schwachen, mittleren oder starken Zusammenhang gesprochen?

A

Schwacher Zusammenhang: ∣r∣ zwischen 0,1 und 0,3
Mittlerer Zusammenhang: ∣r∣ zwischen 0,3 und 0,5
Starker Zusammenhang: ∣r∣ größer als 0,5

52
Q

Korrelation

A

Der Pearson-Korrelationskoeffizient 𝑟 wird verwendet, um den Zusammenhang zwischen zwei metrisch skalierten Variablen zu interpretieren. Dieser Koeffizient hat einen Wertebereich von -1 bis +1 und zeigt sowohl die Stärke als auch die Richtung des Zusammenhangs an.

Positiver Zusammenhang:
Beispiel: Je größer der Lernaufwand (in Stunden) für die Klausur, desto höher die erreichte Punktzahl in der Klausur.

Negativer Zusammenhang:
Beispiel: Je größer die Zahl der Personen im Haushalt, desto niedriger das Pro-Kopf-Einkommen.

53
Q

Korrelation Berechnung

A
54
Q

Kennwerte Berechnung Pearson Korrelation

A

Mittelwerte
Varianzen bzw. Standardabweichungen
Kovarianz

55
Q

Alternative Koeffizienten, falls Voraussetzungen für Pearson nicht erfüllt

A

Kendalls tau
Spearmans Rho

56
Q

Bezeichnungen der Variablen in der Regressionsanalyse

A
57
Q

Lineare Regression

A
58
Q

Regressionskoeffizient 𝑏:

A

Geometrisch: Steigung der Regressionsgeraden.
Inhaltlich: Gibt an, um welchen Betrag sich die abhängige Variable
𝑌 verändert, wenn sich die unabhängige Variable 𝑋 um eine Einheit erhöht.

59
Q

Regressionskonstante (a oder b0):

A

Geometrisch: Schnittpunkt der Regressionsgeraden mit der Y-Achse.
Inhaltlich: Gibt den Vorhersagewert für 𝑌 an, wenn 𝑋 den Wert 0 hat.

60
Q

Determinationskoeffizient R2

A

Bedeutung: Maß für die Güte des Regressionsmodells.
Wertebereich: 0 bis 1 (häufig als Prozentwert).
QS: Je kleiner die Quadratsumme der Residuen, desto besser die Anpassung.

61
Q

Berechnung des Korrelationskoeffizienten

A

Die gemeinsame Streuung der Variablen wird durch das Produkt der jeweiligen standardisierten Streuungen dividiert.

62
Q

Voraussetzungen für Pearson Korrelation

A

Mindestens Intervallskalenniveau
Linearer Zusammenhang
Keine deutlichen Ausreißer

63
Q

Kennwerte für die Berechnung der Pearson Korrelation

A

Mittelwerte
Varianzen bzw. Standardabweichungen
Kovarianz

64
Q

Alternative Koeffizienten zur Pearson Korrelation

A

Kendalls tau
Spearmans Rho

65
Q

Einführung in die lineare Regression

A

Analyse von Beziehungen zwischen einer abhängigen Variable und einer oder mehreren unabhängigen Variablen.
Verwendung für Beschreibung, Erklärung und Prognose von Zusammenhängen.

66
Q

Grundlegende Konzepte der linearen Regression

A
67
Q

Regressionsgleichung

A
68
Q

Interpretation des Determinationskoeffizienten

A

Verhältnis der durch das Modell erklärten Streuung zur Gesamtstreuung der abhängigen Variable.
Beispiel: R2=0,627 bedeutet, dass 62,7% der Varianz der abhängigen Variable durch das Modell erklärt wird.

69
Q

Für welchen Fall wird die sogenannte logistische Regression angewendet?

A

Wenn die abhängige Variable dichotom ist (z.B. Ja/Nein, Erfolg/Misserfolg), wird die logistische Regression angewendet.

70
Q

Voraussetzungen für die Durchführung der linearen Regression

A

Die abhängige Variable muss metrisch skaliert sein.
Linearer Zusammenhang zwischen den Variablen.
Normalverteilung der Residuen.
Homoskedastizität der Residuen.
Keine starke Multikollinearität zwischen den unabhängigen Variablen.

71
Q

Kreuztabelle und Phi-Koeffizient

A

Vorzeichen kann weggelassen werden! 1 perfekter Zusammenhang

immer beides nennen, Phi Koeffizienten und anderen Wert zur Interpretation!

72
Q

Vierfeldertafel und klinische Kennwerte

A
73
Q

Effektstärke für Mittelwertdifferenz - Cohens d

A
74
Q

Cohens d Zusammenhangsstärke

A

0,2 schwach
0.5 mittel
0,8 stark

75
Q

Welcher Koeffizient bzw. welches Verfahren wird benötigt?

Im Rahmen einer Studie zur Verkehrssicherheit wird von 86 Versuchspersonen
verschiedener Jahrgänge das Seh- und Hörvermögen, die Beweglichkeit und die
Reaktionsgeschwindigkeit getestet. Für Letzteres wurden sogenannte
Entscheidungszeiten (Zeitintervall zwischen Signal und Loslassen einer
Ruhetaste) gemessen. Es soll unter anderem ermittelt werden, wie stark die
Reaktionszeiten durch das Alter beeinflusst werden.

A

Für die Analyse, wie stark die Reaktionszeiten durch das Alter beeinflusst werden, wäre die lineare Regression das geeignete Verfahren. In diesem Fall ist das Alter die unabhängige Variable (Prädiktor), und die Reaktionszeiten sind die abhängige Variable.

Der Regressionskoeffizient 𝑏 in der linearen Regression gibt an, wie stark die Reaktionszeiten (abhängige Variable) durch eine Veränderung des Alters (unabhängige Variable) beeinflusst werden.

76
Q

Welcher Koeffizient bzw. welches Verfahren wird benötigt?

Bei 243 Bewerbern und Bewerberinnen für die Ausbildung zum
Flugverkehrslotsen wurden Geschlechtsunterschiede in den Leistungen bei
einem Reaktionstest untersucht. In Millisekunden wurden die sogenannten
Bewegungszeiten (Zeitintervall zwischen Loslassen der Ruhetaste und Drücken
der Zieltaste) gemessen. Es wird vermutet, dass die Reaktionszeiten der
Männer etwas schneller sind als bei den Frauen.

A

Verfahren: t-Test für unabhängige Stichproben (Zwei-Stichproben-t-Test)

Zweck: Vergleich der Mittelwerte der Bewegungszeiten (in Millisekunden) zwischen Männern und Frauen, um zu prüfen, ob die Reaktionszeiten der Männer signifikant schneller sind.

Zusätzliche Kennzahl: Cohen’s d zur Quantifizierung der Effektgröße, also des Unterschieds zwischen den beiden Gruppen.

77
Q

Ziel einer Metaanalyse

A

Eine Metaanalyse zielt darauf ab, die Ergebnisse mehrerer Studien zu einem bestimmten Thema zu kombinieren und zu analysieren, um eine übergreifende Schlussfolgerung zu ziehen. Sie bietet eine präzisere Schätzung des Effekts oder Zusammenhangs, indem die statistische Power erhöht wird.

78
Q

Probleme bei einer Metaanalyse

A

Publikationsbias: Studien mit signifikanten Ergebnissen werden häufiger veröffentlicht, was die Ergebnisse der Metaanalyse verzerren kann.

Heterogenität: Unterschiedliche Studien können stark variieren in Bezug auf Design, Population, Messmethoden usw., was die Vergleichbarkeit und die Interpretation der Ergebnisse erschwert.

Qualität der Studien: Variationen in der methodischen Qualität der eingeschlossenen Studien können die Zuverlässigkeit der Metaanalyse beeinträchtigen.

79
Q

Aspekte der Vertrauenswürdigkeit und Bedeutsamkeit

A

Vertrauenswürdigkeit von Daten: Datenqualität, Studiendesign, Repräsentativität, Datenquelle, Messmethoden.

Bedeutsamkeit der Ergebnisse: Statistische Signifikanz, praktische Relevanz, Effektgröße, Kontextuelle Faktoren.

Generalisierbarkeit: Stichprobenrepräsentativität, externe Validität, Studiendesign, Replikationsstudien.

80
Q

Ziel der Inferenzstatistik

A

Ziel: Schluss von der Stichprobe auf die Grundgesamtheit unter Verwendung von Wahrscheinlichkeiten.

Bedeutung: Verallgemeinerungen, die das Risiko eines Fehlschlusses bergen.

81
Q

Schätzen und Testen in der Inferenzstatistik

A

Schätzen: Bestimmung des Unsicherheitsgrades bei Verallgemeinerungen, z.B. Konfidenzintervalle.

Testen: Wahrscheinlichkeit, dass das Stichprobenergebnis zufällig ist, z.B. Signifikanztests.

82
Q

Exkurs – Normalverteilung

A

Die wichtigste stetige Wahrscheinlichkeitsverteilung

Bedeutung: Verteilungsmodell für statistische Kennwerte, Grundlage vieler statistischer Verfahren.

Eigenschaften: Glockenförmig, unimodal, symmetrisch, asymptotisch an die x-Achse, s-förmige Verteilungsfunktion.

Normalverteilung ist keine bestimmte Verteilung mit festen Werten, sondern
eine ganze Klasse von Verteilungen mit den Parametern Erwartungswert
MüX und Standardabweichung SigmaX

83
Q

Wahrscheinlichkeitsbereiche in der Normalverteilung

A

± 1 Standardabweichung: Etwa 68,27% der Werte.
± 2 Standardabweichungen: Etwa 95,45% der Werte.

84
Q

Standardfehler

A

Definition: Standardabweichung einer Stichprobenverteilung, quantifiziert Schwankungen von Stichprobenkennwerten. (Maß der Genauigkeit einer Schätzung)

Bedeutung: Je kleiner der Standardfehler, desto genauer die Schätzung des Populationsparameters.

Faktoren: Streuung in der Population und Stichprobenumfang.

85
Q

Exkurs – t-Verteilung

A

Nutzung: Wird verwendet, wenn die Streuung in der Population unbekannt ist oder die Stichprobe klein ist.

Eigenschaften:
Unimodal und symmetrisch.
Form der Verteilung hängt von den Freiheitsgraden (df = n - 1) ab.
Nähert sich mit zunehmenden Freiheitsgraden der Standardnormalverteilung an.

86
Q

Konfidenzintervall

A
87
Q

Signifikanztest

A

Ziel: Überprüft, ob ein Effekt in einer Stichprobe zufällig oder repräsentativ für die Population ist.

Nullhypothese: Unterstellt, dass es in der Population keinen Effekt gibt.

Vorgehen: Der Signifikanztest prüft, ob das Stichprobenergebnis so unwahrscheinlich ist, dass die Nullhypothese abgelehnt werden sollte.

88
Q

Signifikanztest – Allgemeine Erläuterung

A

Ziel: Beurteilen, ob ein Stichprobenergebnis zufällig zustande gekommen ist oder verallgemeinert werden könnte.
Nullhypothese: Unterstellt, dass es in der Population keinen Effekt gibt.
Testziel: Zeigen, dass das Stichprobenergebnis so unwahrscheinlich ist, dass die Nullhypothese abgelehnt wird.

89
Q

T-Test für unabhängige Stichproben

A
90
Q

Signifikanztest für den Korrelationskoeffizienten

A
91
Q

Was wird an den beiden Achsen eines Funnel Plots abgetragen?

A

Stichprobengröße und Effektgröße

92
Q

Was zeigt eine Häufigkeitsverteilung?

A

Die Werte einzelner Fälle (z.B. Personen) in einer Stichprobe

93
Q
A