Kap 8 Flashcards
Punkt og interval estimation
Punkt estimation
Ved punktestimation estimeres parameteren ved ét tal - et punkt på talaksen - og estimatet
indeholder ingen oplysning om den dertil knyttede usikkerhed.
Intervalestimation
estimeres parameteren ved to tal - en nedre og en øvre grænse – inden for hvilket den sande parameter ligger med en sandsynlighed på typisk 0,95.
Et intervalestimat kaldes også for et konfidensinterval.
Hvad gælder der for en normalfordelt stikprøvefordeling for p^ om standard error?
For normalfordelingen gælder det at 95% ligger indenfor +/- 1,96 standard error fra middelværdien
Med andre ord vil det gælde at med 95% sandsynlighed vil stikprøveandelen falde indenfor intervallet +/- 1,96 standard-error fra populationsandelen
Konfidensniveauer og deres tilhørende Z-værdi
Kan findes via normalfordelingens fraktiler
90% svarer til en Z-værdi = 1,64
95% svarer til en Z-værdi = 1,96
99% svarer til en Z-værdi = 2,58
Hvordan beregnes standard error ved stikprøvefordeling for middelværdien X-streg?
SE ( x-streg ) = sigma / kvadratrod(n)
I praksis kender vi kun yderst sjældent σ. Så derfor estimerer vi standardfejlen ved at erstatte sigma med stikprøvestandardafvigelsen s.
Hvad sker der når vi erstatter sigma med s?
Når vi erstatter σ med stikprøvestandardafvigelsen s øges usikkerheden i estimatet. For at tage højde for dette erstatter vi Z-scoren med den såkaldte t-score
Fortæl om t-fordelingen
Z-scoren kommer fra standardnormalfordelingen,
mens t-scoren stammer fra t-fordelingen standardnormalfordelingens ”bror”
t-fordelingen er symmetrisk omkring 0
t-fordelingen er kendetegnet ved at have tykkere haler end normalfordelingen.
Sandsynlighederne i t-fordelingen afhænger af antallet af frihedsgrader df = n-1
Frihedsgrad betegnes df og beregnes som stikprøvestørrelsen minus 1
Jo højere antal frihedsgrader des mere ligner t-fordelingen standardnormalfordelingen. Når n > 30 er t-fordelingen og standardfordelingen stort set identiske
Hvilken regel gælder der for sammenhængen mellem usikkerhed og stikprøvestørrelsen?
Når vi ønsker at halvere vores usikkerhed, kræver det, at vi firedobler stikprøvestørrelsen.
Eks: n=25 for margin of error på 0,05. n er så 100 for margin of error på 0,25.
Eks2: Hvis margin of error går fra 0,05 til 0,01 (altså en femtedel mindre) skal stikprøvestørrelsen blive: n * 5^2
Formlen for et 95%-konfidensinterval.
Hvad sker der når n bliver større?
CI95(p^) = p^ +/- 1,96 * kvdrtrd(p^ (1-p^)/n)
hvor p^=x/n
Når n bliver større bliver hele tallet efter 1,96 mindre, hvilket betyder at konfidensintervallet bliver smallere. Dette giver også rent intuitivt mening.
Hvad er margin of error?
Formlen for et konfidensinterval kan godt bruges når X, selvom data ikke rigtig følger normalfordelingskurven.
Når n>30.