Learning statistics with jamovi: a tutorial for psychology students and other beginners (8 Estimere ukjente mengder fra en prøve) Flashcards

1
Q

Hva var forskjellen mellom beskrivende statistikk og konklusjonsstatistikk?

A

rollen til beskrivende statistikk å kortfattet oppsummere det vi vet . I motsetning til dette er hensikten med konklusjonsstatistikk å “lære det vi ikke vet fra det vi gjør”.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hva er en befolkning i dette faget?

A

En befolkning er en mer abstrakt idé. Det refererer til settet av alle mulige personer, eller alle mulige observasjoner, som du ønsker å trekke konklusjoner om og er generelt mye større enn utvalget.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hva er enkelt tilfeldig utvalg?

A

En prosedyre der hvert medlem av befolkningen har samme sjanse til å bli valgt kalles et enkelt tilfeldig utvalg

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

I et utvalg, hva vil prøve “uten erstatning” bety?

A

EKS:
Jeg tar ut sjetonger fra en pose.

At vi ikke la sjetongene tilbake i posen etter å ha trukket dem ut gjør at man ikke kan observere det samme to ganger, og i slike tilfeller skal observasjonene ha blitt tatt uten erstatning .

Dette er mest vanlig

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

I et utvalg hva vil prøve “med erstatning” bety?

A

EKS:
Vi bruker sjetonger igjen, men de som er brukt blir lagt tilbake i posen

Denne gangen registrerer vi imidlertid observasjonen og legger så brikken tilbake i posen. Igjen lukker vi øynene, rister posen og drar ut en chip. Vi gjentar deretter denne prosedyren til vi har 4 sjetonger. Datasett generert på denne måten er fortsatt enkle stikkprøver, men fordi vi legger sjetongene tilbake i posen umiddelbart etter å ha trukket dem omtales det som en prøve med erstatning . Forskjellen mellom denne situasjonen og den første er at det er mulig å observere samme befolkningsmedlem flere ganger.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hva betyr Stratifisert prøvetaking, kom med eksempel?

A

populasjonen din er (eller kan være) delt inn i flere forskjellige underpopulasjoner, eller strata. Kanskje du kjører en studie på flere forskjellige steder, for eksempel. I stedet for å prøve å prøve tilfeldig fra populasjonen som helhet, prøver man i stedet å samle et eget tilfeldig utvalg fra hvert av lagene.

EKS:
For eksempel, når du studerer schizofreni, ville det være mye bedre å dele befolkningen inn i to.

lag (schizofrene og ikke-schizofreni) og deretter prøve et like stort antall personer fra hver gruppe. Hvis du valgte personer tilfeldig, ville du fått så få schizofrene personer i utvalget at studien din ville være ubrukelig. Denne spesifikke typen stratifisert prøvetaking omtales som oversampling fordi den gjør et bevisst forsøk på å overrepresentere sjeldne grupper

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Forklar hva snøballprøvetakning er

A

Snøballprøvetaking er en teknikk som er spesielt nyttig ved prøvetaking fra en “skjult” eller vanskelig tilgjengelig befolkning, og er spesielt vanlig i samfunnsvitenskap.

EKS:
Anta for eksempel at forskerne ønsker å gjennomføre en meningsmåling blant transpersoner. Forskerteamet har kanskje bare kontaktinformasjon for noen få transpersoner, så undersøkelsen starter med å be dem om å delta (trinn 1). På slutten av undersøkelsen blir deltakerne bedt om å oppgi kontaktinformasjon for andre personer som måtte ønske å delta. I trinn 2 blir de nye kontaktene kartlagt. Prosessen fortsetter til forskerne har tilstrekkelig med data.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Forklar hva Bekvemmelighetssampling er

A

Prøvene er valgt på en måte som er praktisk for forskeren, og ikke valgt tilfeldig fra populasjonen av interesse.

EKS:
Forsker er avhengig av psykologostudenter.

For det første betyr avhengighet av psykologistudenter automatisk at dataene dine er begrenset til en enkelt underpopulasjon. For det andre får studentene vanligvis velge hvilke studier de deltar i, så utvalget er en selvvalgt undergruppe av psykologistudenter og ikke en tilfeldig valgt undergruppe

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Spørsmål: Hva er riktig av 1 og 2 når det kommer til utvalg som skal representere hele verden:

I studie 1 har jeg faktisk muligheten til å prøve tilfeldig fra alle mennesker som er i live, med ett unntak: Jeg kan bare prøve personer født på en mandag. I studie 2 er jeg i stand til å prøve tilfeldig fra den australske befolkningen. Jeg ønsker å generalisere resultatene mine til befolkningen til alle levende mennesker. Hvilken studie er bedre?

A

Svaret er åpenbart studie 1. Hvorfor? For vi har ingen grunn til å tro at det å være «født på en mandag» har noe interessant forhold til arbeidsminnekapasitet. Derimot kan jeg tenke på flere grunner til at «å være australsk» kan ha betydning. Australia er et velstående, industrialisert land med et meget godt utviklet utdanningssystem. Mennesker som vokser opp i det systemet vil ha hatt livserfaringer som ligner mye mer på opplevelsene til menneskene som utformet testene for arbeidsminnekapasitet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Forklar hva en populasjonsparameter er

A

populasjonsparametere sitt kjennetegn er ved hele befolkningen.

populasjonsparametrene er de tingene du ønsker å lære om mens prøvestatistikk de tingene du kan beregne fra datasettet ditt.

Altså dersom du tar en stikkprøve av populasjonen, vil den ikke være identisk til populasjonsparameteren, men nesten.

Eksempel Figur 8.4 a og 8.4 b

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hvordan gjør man stikk prøver mer reliable og mer nøyaktig?

Og forklar denne: Når N går mot uendelig, nærmer utvalgsgjennomsnittet populasjonsgjennomsnittet

A

TA FLERE PRØVER OG SAMLE INN MER DATA

EKS:
gå fra 1000 personer til 10000 personer
Eller 10000 personer til 100000 personer

Forklaring:
loven om store tall sier at når utvalget blir større, har utvalgets gjennomsnitt en tendens til å komme nærmere den sanne populasjonsgjennomsnittet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hva er prøvefordeling av gjennomsnittet?

A

Det er flere mindre eksperiment med et mindre utvalg hvor gjennomsnittet på IQ vil være mellom et sted mellom f.eks 90-110. Så eksperimentet blir gjenskapt mange ganger. med f.eks et utvalg av 5 personer. Over tid vil du skape et nytt datasett med gjennomsnitt som du kan måle mot hverandre.

Dette er et verktøy dersom man ikke har så mange personer i utvalget. Det er likevel mulig å tolke resultatet og bruke dette til en vurdering.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hva er prøvefordelingen av maksimum

A

Du tar ut 5 personer og velger den med høyest IQ, deretter gjør du dette 5 ganger helt til du har 5 personer. Da vil utvalget være over gjennomsnittet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hvilke av disse er korrekt?

  1. Gjennomsnittet av prøvefordelingen er det samme som gjennomsnittet av populasjonen.
  2. Standardavviket til samplingsfordelingen (dvs. standardfeilen) blir mindre etter hvert som utvalgsstørrelsen øker.
  3. Formen på prøvefordelingen blir normal når prøvestørrelsen øker.
A

ALLE

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hva står SE og SEM for?

A

Standardfeilen til en statistikk er ofte betegnet SE, og siden vi vanligvis er interessert i standardfeilen til prøvegjennomsnittet, bruker vi ofte akronymet SEM.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Hva er en objektiv estimator og en partisk estimator?

A

Objektiv estimator:
I gjennomsnitt betyr utvalget viser seg å være 100, uavhengig av utvalgsstørrelse, og er lik populasjonsgjennomsnittet. Det er en objektiv estimator , som i hovedsak er grunnen til at ditt beste anslag for populasjonsgjennomsnittet er utvalgets gjennomsnitt.

Partisk estimator:
I gjennomsnitt prøvens standardavvik er mindre enn populasjonsstandardavviket spesielt for små utvalgsstørrelser.

Med andre ord, hvis vi ønsker å gjøre en “beste gjetning” om verdien av befolkningens standardavvik vi bør sørge for at gjetningen vår er litt større enn prøvestandardavviket
.

17
Q

Forklar kort konfidensintervall

A

Vi ønsker å kunne si noe som uttrykker graden av sikkerhet som vi har i vår gjetning. For det er alt det er i bunn og grunn.

For eksempel ville det være fint å kunne si at det er en 95%
sjansen for at den sanne gjennomsnittet ligger mellom 109 og 121 (eksempel). Navnet på dette er et konfidensintervall for gjennomsnittet.

Med et konfidensintervall på 95% kan man si at hvis 1000 mennesker gjør testen, så kan vi med 95% sannsynligheten si at populasjonsgjennomsnittet ligger innenfor et visst området.

18
Q

Utvalgsfordeling for gjennomsnittet?