5 Nichtparametrische Statistik Flashcards
Parametrisches statistisches Modell
Ist eine Menge an Verteilungen derselben Verteilungsfamilie, indiziert durch eine Parametermenge
Nichtparametrisches statistisches Modell
Ist eine Menge an Verteilungen, die entweder diskret oder kontinuierlich sind
Eigenschaften der gesuchten Verteilung ohne parametrische Annahmen aus einer Stichprobe geschätzt.
keine Kenntnis der Verteilungsfamilie für unsere Zufallsstichprobe vorausgesetzt.
empirische Verteilungsfunktion
zählt einfach die Anzahl der Werte einer Stichprobe, die kleiner gleich einem vorgegebenen Wert sind
Histogramm
beschreibt die relative Häufigkeit der Werte einer Stichprobe in einem vorgegebenen Intervall
Kerndichteschätzer
Eine Funktion K der Distanz zwischen x und Xi (Stichprobe) betrachtet. Je größer die Distanz ist, desto kleiner ist der entsprechende Wert von K.
Ordnungsstatistik
Für eine Zufallsstichprobe (X1, . . . ,Xn) mit Verteilung F lassen sich die Werte ordnen, sodass X(1) =< X(2) =< . . . =< X(n)
X(k) bezeichnet hier die k-te Ordnungsstatistik.
Ränge
Für eine Zufallsstichprobe (X1, . . . ,Xn) bezeichnet Ri = R(Xi) den Rang der i-ten Beoabachtung, wobei der kleinste Wert der Zufallsstichprobe Rang 1, und der größte Wert Rang n hat
Verfahren für Bindungen
Randomization: Gebundenen Beobachtungen wird zufällig ein eindeutiger Rang zugewiesen. Nachteil: Ergebnisse schwer reproduzierbar.
Midranks: Gebundenen Beobachtungen wird der Durchschitt der entsprechenden Ränge zugewiesen. Hypothesentests müssen hier geeignet adaptiert werden.
Omission: Gebundene Beobachtungen werden aus der Stichprobe entfernt. Führt zu Informationsverlust.
Stichprobenquantil
Das Stichprobenquantil ist ein Schätzer für das entsprechende Quantil der zugrundeliegenden Verteilung xp
Boxplot
Stichprobenmedian Q0.5 sowie die Stichprobenquartile Q0.25 und Q0.75.
sind durch eine Box dargestellt, Linie in der Box markiert den Stichprobenmedian
Nichtparametrische Bivariate Abhängigkeitsmaße
Kendall’s Tau und Spearman’s Rho
quantifizieren die Ausprägung von monotonen Zusammenhängen
Kendall’s Tau
Kendall’s Tau misst monotone Beziehungen durch Konkordanz und Diskordanz
Spearman’s Rho
entspricht dem regulären Korrelationskoeffizienten der Zufallsvariablen FX (X) und FY (Y)
quantifiziert die Ausprägung von monotonen Zusammenhängen.
Robustheit
Resilienz statistischer Verfahren gegenüber Verletzungen der Annahmen und Ausreißern
Ausreißer
bezeichnen Beobachtungen einer Stichprobe die vermutlich nicht durch den unterliegenden Prozess verursacht wurden (z.B.: Messfehler) und stellen oft besonders große/kleine Beobachtungen dar
Aber Ausreißer =/= Extremwerte
Eigenschaften Nichtparametrische statistische Verfahren
verwenden weniger Annahmen als parametrische statistische Verfahren, werden im Allgemeinen weniger durch Ausreißer beeinflusst und sind somit robuster
Bootstrapping
nichtparametrisches Verfahren zur Schätzung der Verteilung eines Schätzers oder einer Teststatistik
Anwendung: Konstruktion von Konfidenzintervallen
Vorteile parametrische Statistik
Weniger Unsicherheit bei Schätzung, Kleinere Wahrscheinlichkeit für Typ II Fehler bei Hypothesentests
Vorteile nichtparametrische Statistik
Weniger Annahmen, Im Allgemeinen robuster
Wilcoxon-Vorzeichen-Rang-Test
überprüft ob der Median x0.5 statistisch signifikant von einem vorgegebenen Wert abweicht
Gepaarter Wilcoxon-Vorzeichen-Rang-Test
Überprüft die Gleichheit der Mediane x0.5 = y0.5 für eine gepaarte Zufallsstichprobe (X1, . . . ,Xn), (Y1, . . . ,Yn)