Populasjon og Utvalg Flashcards
Populasjon:
Alle vi ønsker å si noe om. (“All possible individuals making up a group of interest in a study”, Bordens & Abbott) Eksempler: -> Alle over 18 år i Norge (4,0 mill) -> Alle kvinner over 67 år (0,4 mill) -> Alle som tar PSY1010 (ca. 250)
Utvalg (sample):
De som er med i studien. “A relatively small number of individuals drawn from a population for inclusion in a study» (Bordens & Abbott).
Eksempler:
- > 200 personer over 18 år
- > 200 kvinner over 67 år
- > 50 PSY1010 studenter
Sampling: å trekke et utvalg
Utvalgsprosessen:
1) Definer populasjonen.
2) Spesifiser samplingframe.
1) Sampling frame: En liste over alle i populasjonen som kan bli samplet.
2) Hvorfor kan ikke alle bli samplet?
3) Spesifiser en samplingmetode.
4) Velg hvor mange som skal samples.
Ytre validitet og utvalg:
I hvilken grad dine resultater kan generaliseres fra den eksperimentelle settingen (generaliserbarhet).
Generalisering/ytre validitet avhenger av hvor representativt utvalget er for populasjonen.
Utvalget (samplet) representerer populasjonen og skal være en miniatyrkopi av variasjonen i populasjonen.
Hvis dette er tilfelle har vi et representativt utvalg.
Hvis dette ikke er tilfelle sier vi at utvalget er skjevt (biased).
Randomisert og Ikke-randomisert sampling:
Randomisert sampling:
Antas i alle statistiske analyser.
Vi kjenner sannsynligheten for å bli valgt ut.
God generaliserbarhet til populasjonen
Ikke-randomisert sampling:
Vi kjenner ikke sannsynligheten for å bli valgt.
Dårlig generaliserbarhet til populasjonen (ytre validitet).
Vanlig innen psykologisk forskning.
Standardfeilen:
=Standardavviket til utvalgsfordelingen:
SE=SD/√n
• SD: standardavviket i utvalget (est. for populasjon)
• n: størrelsen på utvalget (antallet observasjoner)
Utvalgsfordelingen:
Utvalgsfordelingen av en statistikk er distribusjonen av mulige verdier statistikken kan ta. Som alle fordelinger (distribusjoner) en forventning (gjennomsnitt) og standardavvik
To ting vi kan vite om utvalgsfordelingen til gjennomsnittet:
- Store talls lov gir oss teoretisk grunnlag til å hevde at gjennomsnittet i et utvalg vil nærme seg snittet i den populasjonen utvalget var trukket fra når n vokser.
- Sentralgrenseteoremet gir oss informasjon om hvordan usikkerheten rundt snittet er fordelt. Når utvalget vokser nærmer fordelingen seg en normalfordeling.
Standardavvik vs Standardfeil
Standardavviket viser hvor stor variasjon som finnes.
Standardfeilen viser hvor presise estimatene våre er (hvor stor variasjon som finnes mellom utvalg).
SE=SD/√n
Typer randomisert sampling:
- Vanlig randomisert sampling
- Stratifisert randomisert sampling
- Systematisk randomisert sampling
- Cluster sampling
Ikke-sannsynlighetssampling:
- Bekvemmelighetsutvalg (haphazard/convinience sampling)
- Quota sampling (kvotesampling)
- “Subject pool”
- Snøballsampling
Trenger en alltid et representativt utvalg?
Viktigst hvis du ønsker å finne et estimat på en eksakt populasjonsverdier:
Prevalenser for psykiske lidelser i befolkningen
Holdninger til politiske tema
Men: Ikke så viktig hvis man studere mekanismer.
Fundamentale prosesser som er temmelig like i populasjonen (syn, hjerne-aktivering, effekt av søvndeprivasjon m.m.)
Du er mer interessert i å teste hypoteser og ikke generalisere en eksakt verdi til populasjonen
- Parameter er karakteristika ved…
2. Statistikken gir karakteristika i…
- populasjonen
μ (mu)= gjennomsnittet i en populasjon - utvalget
(x bar) = gjennomsnittet i et utvalg .
Vanlig randomisert sampling
Tilfeldig uttrekning.
I et vanlig tilfeldig utvalg (simple random sample), har alle i sampling framen like stor sannsynlighet for å bli inkludert.
Potensielle problemer:
Fremgangsmåten kan være sårbar for feil og tilfeldigheter, da den kan resultere i et utvalg som ikke gjenspeiler populasjonen.
Subgrupper ikke nødvendigvis godt representert.
Stratifisert randomisert sampling
Populasjonen deles i subgrupper (strata), trekker tilfeldig innen disse.
Forholdstallsampling – gjenspeiler populasjonen.
Oversampling – høyere sannsynlighet for å trekke individer med bestemte kjennetegn (alder, kjønn, demografi osv).
->Bedre mulighet til å trekke slutninger om spesifikke subgrupper.
Systematisk randomisert sampling
Alternativ måte for å oppnå et sannsynlighetsutvalg på. Godt egnet når sample frame allerede er tilfeldig organisert (når det gjelder egenskapene du er interessert i), f.eks. hver 10. pasient, folk født 19. hver måned.