03: Statistische Grundlagen der empirischen Forschung COPY Flashcards
Was ist Statistik?
Lehre von Methoden zur Gewinnung, Charakterisierung und Beurteilung von Informationen über die Wirklichkeit
Wann wird Statistik angewandt?
- bei Datengewinnungen und -analysen
- bei der Überprüfung von Hypothesen
- zur Bereitstellung von Entscheidungsgrundlagen
- zur Berechnung zusammenfassender Kennzahlen “Deskriptive Statistik”)
Definition Statistische Einheit (SE)
Träger von Informationen oder Eigenschaften, die im Rahmen einer empirischen Untersuchung interessieren (auch: Merkmalsträger)
Definition Merkmal (M)
Eigenschaft einer statistischen Einheit, die im Rahmen einer empirischen Untersuchung interessiert (auch: Variable)
Definition Merkmalsausprägung (MA)
Mögliche Realisationen eines Merkmals (endlich oder unendlich viele)
Welche beiden Arten von Merkmalen gibt es und wie werden die Ausprägungen jeweils dargestellt?
- Quantitatives Merkmal: Ausprägungen sind Zahlen - Qualitatives Merkmal: Ausprägungen sind Worte
Was ist die Häufigkeitsverteilung?
Die Zuordnung der absoluten oder relativen Häufigkeiten n_j bzw. h_j zu den Merkmalsausprägungen x_j
Was macht die Wahrscheinlichkeitsfunktion einer Zufallsvariablen?
Sie ordnet den Merkmalsausprägungen x_j Wahrscheinlichkeiten P(X=x_j) zu
Was erhält man durch die Integration der Dichtefunktion?
Die Verteilungsfunktion einer stetigen Zufallsvariablen
Was beschreibt der Erwartungswert E(X) bzw. µ?
Die ZENTRALE LAGE der Häufigkeitsverteilung einer Zufallsvariablen in Bezug auf die Messskala
Was ist der Modus x_D
Was ist der Median?
Modus: häufigste Merkmalsausprägung
Median: Teilt Werte in 2 gleichgroße Hälften!
Was beschreibt die Varianz Var(X) bzw. σ^2?
Formel für empirische Varianz?
Die Streuung der Verteilung einer Zufallsvariablen relativ zu deren Mittelwert
Was ist die Spannweite R?
Die Differenz aus dem größten und kleinsten Beobachtungswert
Was beschreibt die Korrelation und worauf gibt sie Hinweise?
Was sind Maße für die Korrelation?
- die gemeinsame Variation zweier Merkmale - gibt Hinweise auf die Stärke und die Form des Zusammenhangs zwischen den Merkmalen
Maße: Kovarianz und Korrelationskoeffizient
Wann steigt die Kovarianz?
Wofür ist die Kovarianz ein Maß?
Wenn beide Werte in die gleiche Richtung von ihren Mittelwerten abweichen
Kovarianz ist ein Maß für die Verbundstreuung!
Was ist der Signifikanztest?
Was ist Ziel des Testenden?
Entscheidungsvorschrift, wann sich für H0 zu entscheiden ist
Ziel: H0 mit kontrollierbarem Fehler abzulehnen
Allgemeine Vorgehensweise eines Hypothesentests
- Formulierung H_0
- Auswahl eines geeigneten Tests zur Überprüfung von H_0
- Testgröße bestimmen
- Ablehnungskriterium bei geg. Irrtumswahrscheinlichkeit überprüfen und Entscheidung treffen
Ziel, Anwendung und Grundidee einer Varianzanalyse
Ziel: Untersuchung der Wirkung von einer (oder mehreren) unabhängigen Variablen (=Faktoren) auf eine (oder mehrere abhängige) Variablen
Anwendung: Wichtigstes Verfahren zur Auswertung von Experimenten: Nachweis von kausalen Zusammenhängen
Grundidee: Ermittlung der Unterschiedlichkeiten von Varianzen innerhalb und zwischen verschiedenen Klassen zur Ermittlung von Gesetzmäßigkeiten
Was untersucht eine ANOVA?
Die Wirkung.. .. einer oder mehrerer unabhängiger Variablen (Faktoren mit Faktorstufen; nominal skaliert) .. auf eine oder mehrere abhängige Variablen (metrisch skaliert)
Was ist eine ANOVA?
Eine statistische Methode zum Vergleich von mehreren Stichproben (≥ 2)
Was bedeutet es, wenn zwei Linienzüge in einem Interaktionsdiagramm einer Varianzanalyse nicht parallel verlaufen?
Zwischen den Faktoren besteht eine Interaktion
Nennen Sie drei Modellarten und beschreiben Sie sie kurz
- mathematische: Beschreibung von Zusammenhängen in Formeln
- verbale: Beschreibung von Zusammenhängen in Worten
- ikonische: Beschreibung von Zusammenhängen in Bildern
Deskriptive vs Induktive Statistik
Schaubild!
Deskriptive: Ermittlung von wenigen charakteristischen Kennzahlen zur Beschreibung einer Grundgesamtheit oder Stichprobe
Induktive: Rückschluss von Daten der Stichprobe auf Daten der Grundgesamtheit!
ALPHA und BETA Fehler
ALPHA: fälschliche Entscheidung zu Gunsten von H1
BETA: fälschliche Entscheidung zu Gunsten von H0