Learning statistics with jamovi: a tutorial for psychology students and other beginners (begynnelsen) Flashcards
Forklar hva Simpsons paradoks er: Det er et ekte eksempel!
Det er at statistiske resultater fra en analyse av aggregert data, kan gi et annet resultat enn hva som er tilfelle i en statistisk analyse på gruppenivå.
F.EKS:
Det var flere menn som søkte på en stilling og flere menn som fikk stillingene. 8000 menn mot 4000 kvinner. 44% av mennene fikk jobb, mens 35% av kvinnene. Statistisk sett er dett urettferdig. MEN, når de analyserte situasjonen, fant de ut at kvinnene søkte på de avdelingene som krevde høyere kompetanse, mens menn søkte på de lettere avdelingene. Altså det var en grunn for at det var forskjellige, det var ikke urettferidsg.
Hva er Belief bias-effekten og gi et eksempel?
hvis du ber folk om å bestemme om et bestemt argument er logisk gyldig (dvs. konklusjonen ville vært sann hvis premissene var sanne), har vi en tendens til å bli påvirket av troverdigheten til konklusjonen, selv når vi ikke burde.
1) For eksempel, her er et gyldig argument der konklusjonen er troverdig:
Alle sigaretter er dyre (premiss 1)
Noen vanedannende ting er rimelige (premiss 2)
Derfor er noen vanedannende ting ikke sigaretter (Konklusjon)
2) Og her er et gyldig argument der konklusjonen ikke er troverdig:
Alle vanedannende ting er dyre (premiss 1)
Noen sigaretter er rimelige (premiss 2)
Derfor er noen sigaretter ikke vanedannende (konklusjon)
Den logiske strukturen til argument #2 er identisk med strukturen til argument #1, og de er begge gyldige. I det andre argumentet er det imidlertid gode grunner til å tro at premiss 1 er feil, og som et resultat er det sannsynligvis slik at konklusjonen også er feil. Men det er helt irrelevant for emnet for hånden; et argument er deduktivt gyldig dersom konklusjonen er en logisk konsekvens av premissene. Det vil si at et gyldig argument ikke trenger å involvere sanne utsagn.
3) å den annen side, her er et ugyldig argument som har en troverdig konklusjon:
Alle vanedannende ting er dyre (premiss 1)
Noen sigaretter er rimelige (premiss 2)
Derfor er noen vanedannende ting ikke sigaretter (konklusjon)
4) Og til slutt, et ugyldig argument med en utrolig konklusjon:
Alle sigaretter er dyre (premiss 1)
Noen vanedannende ting er rimelige (premiss 2)
Derfor er noen sigaretter ikke vanedannende (konklusjon)
Hva er en måling og hva består den av?
Måling i seg selv er et subtilt konsept, men i bunn og grunn handler det om å finne en måte å tilordne tall, eller etiketter, eller en annen form for veldefinerte beskrivelser, til “ting”. Så, noe av følgende vil telle som en psykologisk måling:
Min ALDER er “33 år”.
Jeg liker “ikke” ANSJOS.
Mitt KROMOSOMALE KJØNN er “mann” .
Mitt SELVIDENTIFISERTE KJØNN er “kvinne” .
I den korte listen ovenfor er det som er i stor skrift “det som skal måles”, og det dekket av “ er “selve målingen”. Som du kan se, for noen ting (som alder) virker det ganske åpenbart hva settet med mulige mål skal være, mens det for andre ting blir litt vanskelig.
Hva menes med operasjonalisering når det kommer til måling?
Det handler om å definere målingene dine.
F.eks:
Vær presis på hva du prøver å måle. Betyr for eksempel “alder” “tid siden fødselen” eller “tid siden unnfangelsen” i forbindelse med forskningen din?
Bestem hvilken metode du vil bruke for å måle den. Vil du bruke egenrapportering for å måle alder, spørre en forelder eller slå opp en offisiell post? Hvis du bruker selvrapportering, hvordan vil du formulere spørsmålet?
Definere settet med tillatte verdier som målingen kan ta. Merk at disse verdiene ikke alltid trenger å være numeriske, selv om de ofte er det. Ved måling av alder er verdiene numeriske, men vi må fortsatt tenke nøye gjennom hvilke tall som er tillatt. Ønsker vi alder i år, år og måneder, dager eller timer? For andre typer målinger (f.eks. kjønn) er verdiene ikke numeriske. Men, akkurat som før, må vi tenke på hvilke verdier som er tillatt. Hvis vi ber folk om å selvrapportere kjønnet sitt, hvilke alternativer lar vi dem velge mellom? Er det nok å tillate bare “mannlig” eller “kvinnelig”? Trenger du et “annet” alternativ? Eller bør vi ikke gi folk spesifikke alternativer og i stedet la dem svare med sine egne ord? Og hvis du åpner opp settet med mulige verdier for å inkludere all verbal respons, hvordan vil du tolke svarene deres?
Nevn fire begreper som har en tydelig sammenheng knyttet til målinger:
En teoretisk konstruksjon.
Dette er tingen du prøver å måle, som “alder”, “kjønn” eller en “mening”. En teoretisk konstruksjon kan ikke observeres direkte, og ofte er de faktisk litt vage.
Et tiltak.
Målingen refererer til metoden eller verktøyet du bruker for å gjøre dine observasjoner. Et spørsmål i en undersøkelse, en atferdsobservasjon eller en hjerneskanning kan alle telle som et mål.
En operasjonalisering.
Begrepet «operasjonalisering» refererer til den logiske sammenhengen mellom målet og den teoretiske konstruksjonen, eller til prosessen der vi prøver å utlede et mål fra en teoretisk konstruksjon.
En variabel.
Endelig et nytt begrep. En variabel er det vi ender opp med når vi bruker målet vårt på noe i verden. Det vil si at variabler er de faktiske “dataene” som vi ender opp med i datasettene våre.
Hva er en nominell skala?
En nominell skalavariabel (også referert til som en kategorisk variabel) er en der det ikke er noe spesielt forhold mellom de forskjellige mulighetene. For denne typen variabler gir det ingen mening å si at en av dem er “større” eller “bedre” enn noen annen, og det gir absolutt ingen mening å snitte dem.
Det klassiske eksemplet på dette er “øyefarge”. Øyne kan være blå, grønne eller brune, blant andre muligheter, men ingen av dem er “større” enn noen andre. Som et resultat ville det føles veldig rart å snakke om en “gjennomsnittlig øyenfarge”.
På samme måte er kjønn også nominelt: mann er ikke bedre eller verre enn kvinne. Det gir heller ikke mening å prøve å snakke om et “gjennomsnittlig kjønn”. Kort fortalt er nominelle skalavariabler de der det eneste du kan si om de ulike mulighetene er at de er forskjellige.
Hva er ordinalskala?
Ordinalskalavariabler har litt mer struktur enn nominelle skalavariabler, men ikke mye. En ordinalskalavariabel er en der det er en naturlig, meningsfull måte å ordne de forskjellige mulighetene på, men du kan ikke gjøre noe annet. Det vanlige eksemplet gitt på en ordinalvariabel er “sluttposisjon i et løp”. Du kan si at personen som kom først i mål var raskere enn personen som ble nummer to, men du vet ikke hvor mye raskere. Som en konsekvens vet vi at 1 var bedre enn 2 og vi vet at 2 var bedre enn 3, men forskjellen mellom 1 og 2 kan være mye større enn forskjellen mellom 2 og 3.
Her er et mer psykologisk interessant eksempel. Anta at jeg er interessert i folks holdninger til klimaendringer. Så går jeg og ber noen om å velge utsagnet (fra fire oppførte utsagn) som passer best med deres tro:
Temperaturene stiger på grunn av menneskelig aktivitet
Temperaturene stiger, men vi vet ikke hvorfor
Temperaturene øker, men ikke på grunn av mennesker
Temperaturene stiger ikke
Legg merke til at disse fire utsagnene faktisk har en naturlig rekkefølge, når det gjelder “i hvilken grad de stemmer overens med dagens vitenskap”. Påstand 1 er et nært samsvar, påstand 2 er et rimelig samsvar, påstand 3 er ikke et veldig godt samsvar, og påstand 4 er i sterk opposisjon til dagens vitenskap. Så når det gjelder det jeg er interessert i (i hvilken grad folk støtter vitenskapen), kan jeg bestille varene som 1>2>3>4.
Forklar hva intervallskala er
I motsetning til nominelle og ordinale skalavariabler, er intervallskala- og forholdsskalavariabler variabler der den numeriske verdien er genuint meningsfull. For intervallskalavariabler er forskjellene mellom tallene tolkbare, men variabelen har ikke en “naturlig” nullverdi. Et godt eksempel på en intervallskalavariabel er å måle temperatur i grader celsius. For eksempel, hvis det var 15
i går og 18 grader i dag, så den 3 grader forskjellen mellom de to er virkelig meningsfull. Dessuten at 3 grader forskjellen er nøyaktig den samme som 3 grader forskjell på 7 grader og 10 grader. Kort sagt, addisjon og subtraksjon er meningsfulle for intervallskalavariabler.
Legg imidlertid merke til at 0 grader betyr ikke “ingen temperatur i det hele tatt”. Det betyr faktisk “temperaturen der vannet fryser”, som er ganske vilkårlig. Som en konsekvens blir det meningsløst å prøve å multiplisere og dividere temperaturer. Det er feil å si at 20 grader er dobbelt så varmt som 10 grader, akkurat som det er rart og meningsløst å prøve å påstå at 20 grader er negativ to ganger så varm som -10
.
Hva betyr og forklar hva forholdstall er
Den fjerde og siste typen variabel å vurdere er en forholdsskalavariabel , der null egentlig betyr null, og det er greit å multiplisere og dele.
Et godt psykologisk eksempel på en forholdsskalavariabel er responstid (RT). I mange oppgaver er det veldig vanlig å registrere hvor lang tid noen bruker på å løse et problem eller svare på et spørsmål, fordi det er en indikator på hvor vanskelig oppgaven er.
Anta at Alan bruker 2,3 sekunder på å svare på et spørsmål, mens Ben bruker 3,1 sekunder. Som med en intervallskalavariabel er både addisjon og subtraksjon meningsfulle her. Ben tok virkelig 3,1 - 2,3 = 0,8 sekunder lenger enn Alan gjorde. Legg imidlertid merke til at multiplikasjon og divisjon også gir mening her også: Ben tok 3,1/2,3 = 1,35 ganger så lang tid som Alan gjorde for å svare på spørsmålet. Og grunnen til at du kan gjøre dette er at for en forholdsskalavariabel som RT betyr “null sekunder” virkelig “ingen tid i det hele tatt”.
Hva er altså de fire skalaene?
- Nominell skala
- Ordinalskala
- Intervallskala
- Forholdstall
Hva er forskjellen mellom en diskret variabel og en kontinuerlig variabel?
En kontinuerlig variabel er en der, for alle to verdier du kan tenke deg, er det alltid logisk mulig å ha en annen verdi i mellom.
EKS:
Hvis Alan bruker 3,1 sekunder og Ben bruker 2,3 sekunder på å svare på et spørsmål, vil Camerons responstid ligge i mellom hvis han tok 3,0 sekunder.
En diskret variabel er faktisk en variabel som ikke er kontinuerlig. For en diskret variabel er det noen ganger slik at det ikke er noe i midten.
EKS:
Diskrete variabler oppstår når denne regelen brytes. For eksempel er nominelle skalavariabler alltid diskrete. Det er ikke en type transport som faller “imellom” tog og sykler, ikke på den strenge matematiske måten at 2,3 faller mellom 2 og 3. Så transporttypen er diskret. På samme måte er ordinalskalavariabler alltid diskrete. Selv om “2. plass” faller mellom “1. plass” og “3. plass”, er det ingenting som logisk kan falle mellom “1. plass” og “2. plass”.
FORKLARING:
Kontinuerlige variabler kan bare være intervall og forholdstall.
Diskret variabler kan være alle 4
Hva er en Likert-skala?
- Helt uenig
- Være uenig
- Verken enig eller uenig
- Enig
- Helt enig
Likert-vekter er veldig nyttige, om enn noe begrensede, verktøy. Spørsmålet er hva slags variabler de er? De er åpenbart diskrete, siden du ikke kan gi et svar på 2,5. De er åpenbart ikke nominell skala, siden varene er bestilt; og de er ikke forholdsskala heller, siden det ikke er noe naturlig null.
Men er de ordinalskala eller intervallskala? Et argument sier at vi egentlig ikke kan bevise at forskjellen mellom «helt enig» og «enig» er av samme størrelse som forskjellen mellom «enig» og «verken enig eller uenig». Faktisk, i hverdagen er det ganske tydelig at de ikke er like i det hele tatt. Så dette antyder at vi bør behandle Likert-skalaer som ordinalvariabler. På den annen side ser de fleste deltakerne i praksis ut til å ta hele «på en skala fra 1 til 5»-delen ganske seriøst, og de har en tendens til å opptre som om forskjellene mellom de fem svaralternativene var ganske like hverandre. Som en konsekvens behandler mange forskere Likert-skaladata som intervallskala.
Hva menes med pålitelighet og gyldighet når det kommer til måling?
Pålitelighet er faktisk et veldig enkelt konsept. Det refererer til repeterbarheten eller konsistensen av målingen din.
Målingen av vekten min ved hjelp av en “badevekt” er veldig pålitelig. Hvis jeg går av og på vekten om og om igjen, vil det fortsette å gi meg det samme svaret. Å måle intelligensen min ved å “spørre mamma” er veldig upålitelig. Noen dager forteller hun meg at jeg er litt tykk, og andre dager forteller hun meg at jeg er en fullstendig idiot.
Hva er de fire måtene å måle reliabilitet på?
Test-retest pålitelighet
Inter-rater pålitelighet
Parallelle former pålitelighet
Intern konsistens pålitelighet
Forklar kort Test-retest pålitelighet
Dette gjelder konsistens over tid. Hvis vi gjentar målingen på et senere tidspunkt, får vi samme svar?