Kap 7 Flashcards
Begrebsapparat for population og stikprøve
μ Middelværdi (Population) σ Standardafvigelse (Population) X-streg Middelværdi (Stikprøve) s Standardafvigelse – (Stikprøve) p Andel (Population) p^ Andel (Stikprøve)
Stikprøvefordeling
Stikprøvefordelingen beskriver den variation, der er mellem forskellige stikprøver, når vi benytter stikprøveandel, stikprøvemiddelværdi til at estimere populations parametre (populationsandel, populationsmiddelværdi)
Stikprøvefordelingen fortæller os noget om hvor sandsynlige de mulige værdier er
Med andre ord hjælper stikprøvefordelinger os med at forudsige hvor pålideligt et estimat den andel/eller middelværdi vi kan beregne på baggrund af stikprøven er for den ”sande værdi”/parameter i populationen
Når stikprøven fortæller os at 51 % vil stemme på rød blok, hvor sikker er dette estimat så for hvor stor en andel af alle stemmeberettigede danskere, der vil stemme på rød blok
Kategori variabel: Andel
Kvantitative variabel: Middelværdi
Hvad er populationsfordeling, datafordeling og stikprøvefordeling?
Populationsfordeling
Det er den fordeling, hvorfra vi udtager stikprøven. Værdien af populationsfordelingens parametre (populationsandelen for kategori variabel og middelværdi for kvantitativ variabel er som regel ukendte. Det er dem vi ønsker at estimere
Eksempel: Alle stemmeberettigede danskere
Datafordelingen
Dette er fordelingen for den stikprøve /de data vi undersøger). Her kigger vi påSti kprøveandel, Stikprøvemiddelværdi
Eksempel: de 1.428 personer vi har spurgt I Gallups meningsmåling om Folketingsvalget
Stikprøvefordelingen
Det er den fordeling der gælder for hhv.stikprøveandelen/stikprøvemiddelværdi
Eksempel: Denne fordeling er baseret på at vi gennemfører mange Gallups meningsmålinger, eksempelvis 1.000 og for hver af disse stikprøver beregner vi andelen, der stemmer på rød blok. Vi får på denne made 1.000 værdier for p^ (andel der stemmer på rød blok). I praksis vil vi aldrig gennemføre 1.000 stikprøver (det er for dyrt/besværligt). Istedet anvendes Normalfordelingen
Hvad er standard-fejl (standard error)?
(NTS: Ikke sikker.)
Formålet er, at bestemme usikkerheden på vores stikprøve-estimat p^.
Formel for SE:
SE (p^) = kvadratrod( p(1-p)/n )
Hvilken effekt har n på Standard-fejlen?
Når stikprøvestørrelsen n stiger, stiger nævneren i formlen for standardfejlen, SE(^p). Hvilket igen medfører at standardfejlen, SE(^p) falder
På baggrund af dette gælder det, at for større stikprøver er det mere sandsynligt at stikprøveandelen ligger tættere på populationsandelen
Hvad sker der med Gauss-kurven (kurven for en normalfordeling), når n stiger?
Den er mere centreret/smal.
Dette giver mening, da jo større n er, jo tættere på populationen er man, og jo mere retvisende billede kan man give. Derfor falder usikkerheden i stikprøven: forskellen i værdierne inden for Gauss-kurven falder.
Den centrale grænseværdisætning
Den helt korte udgave:
Gennemsnit/middelværdi af næsten alt er normalfordelt, hvis bare stikprøven er stor nok
Centrale grænseværdisætning
For tilfældig stikprøveudtrækning gælder, at når stikprøve-størrelsen ’n’ vokser, så vil fordelingen af stikprøvemiddelværdien X-streg tilnærme sig en normalfordeling.
Dette gælder uanset formen af populationens fordeling
I de fleste tilfælde vil en stikprøve på omkring n=30 være nok til en god tilnærmelse til normalfordelingen af stikprøvegennemsnittene
Jo større stikprøve, jo mindre standardfejl og jo større præcision