Statistik Flashcards
Varianz
Mittelwert der Quadrate - Quadrat des Mittelwertes
Standardabweichung
Wurzel aus Varianz
Streuung
Aufteilung der Beobachtungen, je größer desto weitere Streuung
Metrischer Korrelationseffizient
Gibt an, wie gut die Punkte auf einer Linie liegen
- 1 = perfekte Gerade mit negativer Steigung
0 = keine Gerade
1 = perfekte Gerade mit positiver Steigung
Korrelation kann auf ursächliche Beziehung hinweisen, muss aber nicht!
Stetig
Mit Kommas,
Lückenlos
Diskret
Mit Lücken, endlich abzählbar
Gini-Koeffizient
Wie gleichmäßig oder ungleichmäßig ist Merkmal auf verschiedenen Merkmalsträgern ausgeprägt?
Gleichmäßig: 0
Ungleichmäßig: 1
Lorenzkurve
Kurve die Konzentrationsfläche mit Winkelhalbierender beim Gini Koeffizienten bildet
Standardisieren
(C-Erwartungswert/Standardabweichung)
X~N(200;15^2)
200= Erwartungswert 15^2 = Varianz
Vorgehensweise Anpassungstest
- Erwartungen aufstellen
- Prüfgröße ausrechnen
(Beobachtet-erwartet)^2/Erwartet + ….. - Kritischen Wert ausrechen
Chi^2 1-ALPHA (m-1)
M= Anzahl Kategorie
Genauigkeit
Messung von Messfehlern behaftet?
Objektivität
Ergebnisse sind unabhängig von Drittfaktoren
Reliabilität
Bei Wiederholung der Messung dasselbe Ergebnis
Validität
Es wird gemessen, was gemessen werden soll
Unabhängigkeitstest Vorgehensweise
- Erwartete Werte
- Prüfgröße
(Beobachtet-erwartet)^2/erwartet + ..
- Kritischer Wert
Chi2 1-ALPHA ((I-1)*(J-1)
I= Zeilen J= Spalten
Bootstrap
Mit zurücklegen
Resample
Mit zurücklegen
Permutation
Ohne zurücklegen
Fehler 1. Art
H0 wird abgelehnt obwohl sie wahr ist
Fehler 2. Art
H0 wird nicht abgelehnt, obwohl sie falsch ist
Lineare Regression:
Standardfehler berechnen:
Regressionskoeffizient (estimate) / t value
Lineare Regression:
T value berechnen
Regressionskoeffizient (Estimate)/ Standardfehler
Lineare Regression:
Regressionskoeffizient (Estimate)
Berechnen
Standardfehler x t value
Lineare Regression:
Was heißt signifikant zum 1% Niveau?
H0, dass Variable keinen Einfluss hat, kann mit Irrtumswahrscheinlichkeit von höchstens einem % abgelehnt werden
H0 F-Test
Alle Regressionskoeffizienten sind null -> haben keinen Einfluss auf abhängige Variable!!
Median
Wert, der von 50% der Beobachtungen nicht überschritten wird
Modus
Häufigste Ausprägung
Oberes Quartil
Wird von 75% der Stichproben nicht überschritten
Unteres Quartil
Wird von 25% der Beobachtungen nicht überschritten
Regressor
Erklärende Variable
Regressand
Abhängige Variable
Regressionsgerade
Gerade, die im Streudiagramm einen möglichen Linearen Zusammenhang der variablen am besten beschreibt
Empirische Korrelation
Stellt linearen Zusammenhang aus empirischer Sicht dar.
0= kein linearer Zusammenhang
1=perfekt positiver linearer Zusammenhang
-1= perfekt negativer Linearer Zusammenhang
Regressionskoeffizient
Stellen linearen Zusammenhang zwischen zwei Merkmalen dar
Bestimmtheitsmaß der Regression
Wert der Varianz der abhängigen Variablen lässt sich mithilfe der erklärenden Variablen erklären!
Güte der Regression
Zweiseitiger Test
Wenn Abweichung vom Mittelwert untersucht werden soll
Einseitiger Test
Wenn eine Abweichung des Mittelwerts nach oben ODER unten gewählt werden soll
T-Test
Untersucht signifikanz einzelner Regressionskoeffizienten.
Eine Variable = 0
Standardfehler der Regression
Erwarteter Prognosefehler des Regressionsmodells und steht für geschätzte Standardabweichung des nicht erklärbaren Teils
H0 beim Unabhängigkeitestes
Variablen sind unabhängig
H0 beim Abhängigkeitstest
Anteil gleich
Signifikant zum … Niveau
Wenn P- Wert kleiner als die Zahl