13 Goodness of fit (GOF) tests Flashcards
1
Q
(D) Chi-square GOF test: Teststatistik, Verteilung, Nullhypothese, R-Befehl (4)
A
- Teststatistik
Tn = ∑ (Nj - npj)^2 / npj - Verteilung
annähernd Chi-^2-verteilt mit n-1 Freiheitsgraden (sample size 5 => 4 degrees of freedom) - Nullhypothese
H0: F = G - R command
chisq. test(x (observed), p=p0 (expected))
2
Q
(A) Schritte bei Chi-square GOF-Test (4)
A
- Daten: angebliche Verteilung + Beobachtungen
- Ewartete Anzahl bestimmen
- Klassenbedingung überprüfen
- chisq.test(x,p=p0)
3
Q
(A) Steigung und Achsenabschnitt beim QQ-Plot
A
Die Verteilungen stimmen überein, wenn die Daten auf der Diagonale liegen. Die Diagonale ist die Gerade mit Steigung 1 und Achsenabschnitt 0.
4
Q
Shapiro-Wilk-Test (Beschreibung, Testentscheidung, Schwachstellen) (4)
A
- Beschreibung
- liegt Daten irgendeine Normalverteilung zugrunde? (= man testet gegen ganze Klasse von Verteilungen)
- QQ-Plot gegen die Standard-Normalverteilung
- Ausgleichsgerade hat Steigung \sigma und Achsenabschnitt µ - Test: quadrierte Steigung durch geschätzte Varianz muss Nahe an 1 liegen, damit Test erfolgreich.
- Schwachstellen: Nicht robust gegen unsaubere Daten (Ausreißer, etc.)
5
Q
(A) Verteilung simulieren
A
Wir wollen die Verteilung einer Teststatistik simulieren. Wie gehen wir vor?
- for-Schleife mit vielen Wiederholungen (≥1000)
- jedes Mal aufs Neue den Wert der Teststatistik bestimmen
- verschiedenen Werte der Teststatistik haben Verteilung
- Verteilung mithilfe QQ-Plot ausfindig machen
6
Q
binned Chi^2-GOF
A
- Fall: stetige Zufallsvariable (z.B. X ~ N(0,1))
- dann müssen wir den Wertebereich von X in Intervalle unterteilen
- z.B.: I1 = (-∞,-2], I2 = (-2, -1], …, I6 = (2, ∞)
7
Q
(A) Verteilung normalverteilter Daten in einem Histogramm überprüfen
A
x=rnorm(1000)
hist(x,breaks=30,prob=TRUE)
curve(dnorm(x),add=TRUE)
8
Q
Chi^2-GOF,
=CIP12 (1-4)
A
- Chi^2-GOF-Test für Binomialverteilungen
- wir simulieren Verteilung der Teststatistik für Binomialverteilung
- Plug-in Schätzung für p reduziert df auf n-1 - binned Chi^2-GOF-Test
- falls einer der drei Fälle auftritt
- Aufgabe: mit binned Chi^2-GOF-Test überprüfen, ob Daten von Normalverteilung kommen (1. Wertebereich unterteilen(1), 2. Klassenbedingung überprüfen, 3. chisq(x,p=expected)) - Chi^2-Test auf Unabhängigkeit
- …
- wir überprüfen Verteilung von … mit Histogramm und qqPlot
- chisq.test(M) - Run-Test auf Unabhängigkeit
x=sample(c(0,1),replace=TRUE,20)
runs.test(as.factor(x))