lektion 9 Flashcards
Hvad er χ2-fordeling?
En sandsynlighedsfordeling, der ofte bruges til at teste hypoteser om varians og fordelingen af kategoriske data
Hvad er egenskaber for en χ2-fordeling?
Er asymmetrisk men bliver gradvist mere
symmetrisk efterhånden som antallet af frihedsgrader stiger
(og rykker samtidig til højre)
Hvad bruger vi en χ2-fordeling til?
Hvis man gerne vil undersøge variansen af en variabel kan man bruge denne fordeling
Hvad bruges en F-fordeling til?
F-fordelingen bruges til at sammenligne variansen mellem to populationer
Hvad er ANOVA?
ANOVA: Analysis of variance
er en måde at teste hypoteser omkring flere end to grupper
Hvad er antagelser bag ANOVA?
ANOVA antager at
1. Variansen er ens i alle grupper
2. Alle grupper er normalfordelt
3. Uafhængighed
Hvad er Between-treatment variability?
Hvor meget variabilitet er der mellem grupper
Hvad er Within-treatment variability?
Hvor meget variabilitet er der inden for grupper
Hvad er SST?
For at kvantificere between-treatment variability udregner vi
treatment sum of squares (SST)
Hvad er SSE?
For at kvantificere within-treatment variability udregner vi error
sum of squares (SSE)
Hvordan opsætter man en hypotese test med ANOVA?
undersøge en hypotese omkring forskelle i gennemsnit mellem p grupper, opsætter vi hypoteserne
H0 : μ1 = μ2 = · · · = μp
Ha : Mindst to gennemsnit er forskellige
Man vælger et signifikansniveau
Vi vælger ikke, om vores alternativhypotese skal være et- eller flersidet, hvilken “side” alternativhypotesen vedrører, osv.
Hvad er goodness of fit?
Goodness-of-fit testen undersøger hvor godt en observeret datamængde passer til en forventet fordeling
bliver ofte brugt til at teste for normalitet
Hvad er observeret frekvens?
Observeret frekvens (fi ): Hvor mange observationer ligger i intervallet i
Hvad er forventet frekvens?
Forventet frekvens (Ei ): Hvor mange observationer vil man forvente ligger i intervallet i, givet population er normalfordelt
Hvad er “opskriften” for en hypotesetest for normalfordeling?
- Opsæt H0 og Ha
- Vælg signifikansniveau α
- Estimer gennemsnittet ¯x og s^2 ud fra data
- Inddel data i k intervaller og udregn fi og Ei for hvert interval
i = 1, 2, . . . , k - Udregn χ2 =Σ^k og for neden i=1
(fi−Ei )^2/Ei - Udreg p-værdien ud fra χ2
og afvis H0 hvis p < α
Bemærk:
Antallet af frihedsgrader for χ2 er k − 3