Uge 37 - lektion 4 - Prøveudtagning Flashcards
Forklar begreberne: Befolkning, stikprøve og inferens
Befolkning → den gruppe mennesker man gerne vil undersøge
Stikprøve → En udvælgelse fra befolkningen som man drager inferens på
Inferens → Vi tager en mindre gruppe mennesker, og laver analyse på dem, og baseret på den stikprøve, kan vi sige noget om befolkningen som helhed. Fx. spørgeskemaer
Eksempel:
Vi ønsker at forstå den danske befolknings politiske overbevisning
Befolkning → danskerne
Stikprøve → En randomiseret udvælgelse af befolkningen
Inferens → baseret på stikprøven kan vi lave inferens
Forklar udvælgelsesmetoden “simpel tilfældig udvælgelse”
Ud fra ens befolkning udvælger man en tilfældig del. Fx. 6 i dette eksempel
Man skal over ens vis størrelse i stikprøver hvis man ønsker et repræsentativt billede af befolkningen.
Jo dårligere stikprøve, jo større er ens standard error og desto mindre kan vi være sikre på vores data.
Forklar udvælgelsesmetoden “stratifikation”
Man vælger en fra hver befolkningsgruppe
En god metode hvis man kender befolkningen godt.
Det er ikke en god metode hvis man ikke kender befolkningen godt → hvordan ved man så hvor nogle passer ind?
Man skal have nogle stratificererbare mål → fx. forskellige uddannelsesniveauer, forskellige indkomstniveauer.
Forklar udvælgelsesmetoden “klyngeudvælgelse”
Man kan ikke gøre det når man laver surveys, men man kan lave det når man laver eksperimenter.
Man sammenligner to klynger med hinanden, for at finde ud af forskellen mellem de to grupper.
Klyngeudvælgelse er i statistik en metode til udvælgelse af stikprøver. I mange populationer er individerne samlet i klynger, der er naturlige grupperinger; fx er personer samlet i husstande.
Eksempel:
Man udvælger en bestemt kommune, og det er den kommune man kigger på
Det kan være svært at sammenligne to kommuner, da de skal være nogenlunde ens. Fx. hvis den ene kommune er rig og den anden er fattig, fungerer det ikke.
Forklar hvad en standardfejl er og hvad det bruges til
Et virkelig vigtigt statistik nøgletal, der fortæller os hvor godt vores estimat er.
Standardfejl bruges til at måle den statistiske nøjagtighed af et estimat. Dette estimat afhænger af:
Mængden af variabilitet i prøveresultaterne (f.eks. standardafvigelsen)
Stikprøvestørrelsen.
Stor standardfejl = er vi meget usikre på det (fx. at folk svarer i øst og vest)
Lille standardfejl = er vi meget sikre på det. (fx. at folk svarer meget ens)
Forklar konfidensinterval
Siger noget om sandsynligheden for, at den sande værdi er repræsenteret i vores stikprøve
Altså, et interval hvori den sande værdi vil ligge med ens vis sandsynlighed
Et konfidensinterval er et interval, der angiver, hvor præcist du forventer, at den sande værdi af en parameter ligger, med en given sandsynlighed. For eksempel kan et 95% konfidensinterval omkring et gennemsnit angive, at du er 95% sikker på, at den sande værdi er inden for det angivne interval.
Forklar P-værdi
En p-værdi er sandsynligheden for at tilfældighed generede vores resultater.
Vi bruger P-værdien til at forkaste vores nulhypotese mod observerede data.
Forklar Type I fejl og Type II fejl
Falsk positiv = fx. du er gravid til en mand
Falsk negativ = fx. du er ikke gravid til en kvinde som er gravid
Vi håber på, at statistik viser det rette billede.
Det er her P-værdi hjælper os.
Hvis vores P-værdi er tættere på 1, desto mindre sikre kan vi være
Hvis vores P-værdi er tættere på 0, kan vi være mere sikre.
Bygger på Popper! falsificere noget