Nicht parametrische Statistik Flashcards
Nichtparametrisches Modell
… Menge an Verteilungen, die entweder diskret oder kontinuierlich sind.
- Es werden keine Annahmen getroffen
- Eigenschaften aus einer Stichprobe geschätzt
- Kein Kenntnis der Verteilungsfamilie der Zufallsstichprobe
empirische Verteilungsfunktion
Summer aller Indikatorfunktionen durch Anzahl
- Summenhäufigkeitsfunktion
- Treppenfunktion
- konvergiert für steigenden Stichprobenumfang gegen Verteilungsfunktion der Grundgesamtheit
- rechtsstetig
- Werte: 0 bis 1
Indikatorfunktion
1 für X <= x
0 für X > x
Histogramm
.. relative Häufigkeit der Werte einer Stichprobe in einem vorgegebenen Intervall
- Stückweise konstanter Schätzer für die Dichte
- Wahl der Klassen und Breiten ist wichtig für das Verhalten
- konvergiert gegen Dichte der Grundgesamtheit
Kerndichteschätzer
- verallgemeinert Idee Histogramm
- gibt Distanz zwischen Werten x und Xi wieder –> große Distanz: kleiner Wert von K
- konvergiert gegen Dichte der Grundgesamtheit
Ordnungsstatistik
- sind Zufallsvariablen: Haben Dichte und Verteilungsfunktion
Ränge
beschreibt den Rang der i-ten Beobachtung
Kleinste Wert: Rang 1, Größte n
Bindungen
(Ties)
kontinuierliche ZV: Punktstatistik = 0
Wahrscheinlichkeit, dass zwei ZV übereinstimmen = 0
diskrete ZV: Werte können öfters auftreten
Verfahren für Bindungen
Randomization
Midranks
Omission
Stichprobenquantile
Schätzer für das entsprechende Quantil der
zugrundeliegenden Verteilung
- als Funktion einer Zufallsstichprobe selbst Zufallsvariablen
(Schätzer!)
nichtparametrische bivariate Abhängigkeitsmaße
Kendall’s Tau
Spearman’s Rho
- -> monotone Zusammenhänge
- unabhängig von Randverteilung
- invariant unter monotonen Transformationen
Kendall’s Tau
.. misst monotone Beziehungen durch Konkordanz und Diskordanz
Spearman’s Rho
.. entspricht dem regulären Korrelationskoeffizient der ZV
- Spearman’s Rangkorrelationskoeffizient
- quantifiziert Ausprägung von monotonen Zusammenhängen
Robustheit
Resilienz statistischer Verfahren gegenüber Verletzungen der Annahmen und Ausreißer
Nichtparametrische Verfahren: Robuster
Bootstrapping
.. Verfahren zur Schätzung der Verteilung eines Schätzers oder einer Teststatistik
- Konstruktion von Konfidenzintervallen
Anfangswerte, Verteilung, Resampling, Verteilung,…
Gefahr: nicht repräsentative Stichproben