13 Goodness of fit (GOF) tests Flashcards

1
Q

(D) Chi-square GOF test: Teststatistik, Verteilung, Nullhypothese, R-Befehl (4)

A
  1. Teststatistik
    Tn = ∑ (Nj - npj)^2 / npj
  2. Verteilung
    annähernd Chi-^2-verteilt mit n-1 Freiheitsgraden (sample size 5 => 4 degrees of freedom)
  3. Nullhypothese
    H0: F = G
  4. R command
    chisq. test(x (observed), p=p0 (expected))
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

(A) Schritte bei Chi-square GOF-Test (4)

A
  1. Daten: angebliche Verteilung + Beobachtungen
  2. Ewartete Anzahl bestimmen
  3. Klassenbedingung überprüfen
  4. chisq.test(x,p=p0)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

(A) Steigung und Achsenabschnitt beim QQ-Plot

A

Die Verteilungen stimmen überein, wenn die Daten auf der Diagonale liegen. Die Diagonale ist die Gerade mit Steigung 1 und Achsenabschnitt 0.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Shapiro-Wilk-Test (Beschreibung, Testentscheidung, Schwachstellen) (4)

A
  1. Beschreibung
    - liegt Daten irgendeine Normalverteilung zugrunde? (= man testet gegen ganze Klasse von Verteilungen)
    - QQ-Plot gegen die Standard-Normalverteilung
    - Ausgleichsgerade hat Steigung \sigma und Achsenabschnitt µ
  2. Test: quadrierte Steigung durch geschätzte Varianz muss Nahe an 1 liegen, damit Test erfolgreich.
  3. Schwachstellen: Nicht robust gegen unsaubere Daten (Ausreißer, etc.)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

(A) Verteilung simulieren

A

Wir wollen die Verteilung einer Teststatistik simulieren. Wie gehen wir vor?

  1. for-Schleife mit vielen Wiederholungen (≥1000)
  2. jedes Mal aufs Neue den Wert der Teststatistik bestimmen
  3. verschiedenen Werte der Teststatistik haben Verteilung
  4. Verteilung mithilfe QQ-Plot ausfindig machen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

binned Chi^2-GOF

A
  1. Fall: stetige Zufallsvariable (z.B. X ~ N(0,1))
    - dann müssen wir den Wertebereich von X in Intervalle unterteilen
    - z.B.: I1 = (-∞,-2], I2 = (-2, -1], …, I6 = (2, ∞)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

(A) Verteilung normalverteilter Daten in einem Histogramm überprüfen

A

x=rnorm(1000)
hist(x,breaks=30,prob=TRUE)
curve(dnorm(x),add=TRUE)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Chi^2-GOF,

=CIP12 (1-4)

A
  1. Chi^2-GOF-Test für Binomialverteilungen
    - wir simulieren Verteilung der Teststatistik für Binomialverteilung
    - Plug-in Schätzung für p reduziert df auf n-1
  2. binned Chi^2-GOF-Test
    - falls einer der drei Fälle auftritt
    - Aufgabe: mit binned Chi^2-GOF-Test überprüfen, ob Daten von Normalverteilung kommen (1. Wertebereich unterteilen(1), 2. Klassenbedingung überprüfen, 3. chisq(x,p=expected))
  3. Chi^2-Test auf Unabhängigkeit
    - …
    - wir überprüfen Verteilung von … mit Histogramm und qqPlot
    - chisq.test(M)
  4. Run-Test auf Unabhängigkeit
    x=sample(c(0,1),replace=TRUE,20)
    runs.test(as.factor(x))
How well did you know this?
1
Not at all
2
3
4
5
Perfectly