Lektion 6 Flashcards
Hvad er et konfidensinterval?
Er et interval, man lægger omkring et estimat af en parameter baseret p˚a et “niveau” af sikkerhed
→ “Vores estimat ¯x ligger med 95% sikkerhed inden for a og b”
Hvad er en normalfordeling (symmetrisk)?
Den er kendetegnet ved sin symmetriske klokkeformede kurve, hvor størstedelen af observationerne ligger tæt på middelværdien, og sandsynligheden falder gradvist, når man bevæger sig længere væk fra middelværdien
Hvordan finder man frem til en konfidensinterval for en normalfordeling (symmetrisk)?
For en normalfordeling (symmetrisk) og en sandsynlighed p, hvor stor skal k være, for at
p = P(x ≤ μ − k) + P(x ≥ μ + k)?
Udregner vi det, får vi et interval [μ− k, μ + k] som vi ved, X ligger indenfor med sandsynlighed p
Hvad er en Standardnormalfordeling?
Standardnormalfordelingen er en specialtilfælde af normalfordelingen, hvor middelværdien er 0 og standardafvigelsen er 1
Hvad er “opskriften” for at finde konfidensintervallet når man har en kendt varians?
Skriver vi en “opskrift”, f˚ar vi
1. Vælg “konfidensniveau” p og udregn
α = 1 −p
2. Estimer ¯x ud fra data
3. Udregn variansen af ¯x: σ2¯x = σ2/n (nu kender vi σ)
4. Udregn zα/2
5. Udregn konfidensintervallet [¯x − zα/2σ¯x , ¯x + zα/2σ¯x ]
Kender man i virkligheden ofte variansen og standardafvigelse?
Nej, i virkeligheden kender vi (oftest) ikke σ
I stedet estimerer vi variansen / standardafvigelsen
Hvad er en t-fordeling?
En t-fordeling er en generalisering af en
standardnormalfordeling der tager højde for½ at man nu har estimeret variansen
Hvordan ser en t-fordeling ud?
Ligesom en standardnormalfordeling er den symmetrisk omkring 0 med cirka samme form, men dens “haler” er nu bredere – særligt i tilfælde, hvor vi har få frihedsgrader
Hvad er vigtigt at huske ved t-fordelingen?
Antallet af frihedsgrader er lig antallet af observationer minus en (pga. den estimerede varians)
I tilfælde hvor antallet af frihedsgrader er højt, er der reelt ingen forskel imellem en standardnormalfordeling og en t-fordeling
Hvad er frihedsgrader?
Repræsenterer det antal uafhængige stykker information, der er tilgængelige til at estimere en parameter eller variabel i en statistisk model
Hvad er “opskriften” for konfidensinterval omkring et estimeret gennemsnit?
- Vælg “konfidensniveau” p og udregn
α = 1 − p - Estimer ¯x ud fra data
- Estimer σ^2 ud fra data (udregn s^2)
- Udregn variansen af
¯x: s2/¯x = s^2/n - Udregn tα/2
- Udregn konfidensintervallet
[¯x − tα/2s¯x , ¯x + tα/2s¯x ]
Hvad er en andel?
proportion eller en procentdel af en population eller et udfald i en stikprøve, der har en bestemt egenskab eller karakteristik. Det er en måling, der angiver forholdet mellem en del og helheden, udtrykt enten som en brøkdel, decimal eller procent
Hvad er “opskriften” for en konfidensinterval omkring en estimeret andel?
- Vælg “konfidensniveau” p og udregn
α = 1 − p - Estimer â ud fra data
- Udregn variansen af â: â(1−â)/n
- Udregn zα/2
- Udregn konfidensintervallet
[â − zα/2kvadratrod(â(1−â)/n) , zα/2kvadratrod(â(1−â)/n)]
Hvor stor en stikprøve er nødvendig?
Det handler om at finde en balance imellem faktisk at kunne estimere det