Learning statistics with jamovi: a tutorial for psychology students and other beginners (begynnelsen) Flashcards

1
Q

Forklar hva Simpsons paradoks er: Det er et ekte eksempel!

A

Det er at statistiske resultater fra en analyse av aggregert data, kan gi et annet resultat enn hva som er tilfelle i en statistisk analyse på gruppenivå.

F.EKS:
Det var flere menn som søkte på en stilling og flere menn som fikk stillingene. 8000 menn mot 4000 kvinner. 44% av mennene fikk jobb, mens 35% av kvinnene. Statistisk sett er dett urettferdig. MEN, når de analyserte situasjonen, fant de ut at kvinnene søkte på de avdelingene som krevde høyere kompetanse, mens menn søkte på de lettere avdelingene. Altså det var en grunn for at det var forskjellige, det var ikke urettferidsg.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
1
Q

Hva er Belief bias-effekten og gi et eksempel?

A

hvis du ber folk om å bestemme om et bestemt argument er logisk gyldig (dvs. konklusjonen ville vært sann hvis premissene var sanne), har vi en tendens til å bli påvirket av troverdigheten til konklusjonen, selv når vi ikke burde.

1) For eksempel, her er et gyldig argument der konklusjonen er troverdig:

Alle sigaretter er dyre (premiss 1)
Noen vanedannende ting er rimelige (premiss 2)
Derfor er noen vanedannende ting ikke sigaretter (Konklusjon)

2) Og her er et gyldig argument der konklusjonen ikke er troverdig:

Alle vanedannende ting er dyre (premiss 1)
Noen sigaretter er rimelige (premiss 2)
Derfor er noen sigaretter ikke vanedannende (konklusjon)

Den logiske strukturen til argument #2 er identisk med strukturen til argument #1, og de er begge gyldige. I det andre argumentet er det imidlertid gode grunner til å tro at premiss 1 er feil, og som et resultat er det sannsynligvis slik at konklusjonen også er feil. Men det er helt irrelevant for emnet for hånden; et argument er deduktivt gyldig dersom konklusjonen er en logisk konsekvens av premissene. Det vil si at et gyldig argument ikke trenger å involvere sanne utsagn.

3) å den annen side, her er et ugyldig argument som har en troverdig konklusjon:

Alle vanedannende ting er dyre (premiss 1)
Noen sigaretter er rimelige (premiss 2)
Derfor er noen vanedannende ting ikke sigaretter (konklusjon)

4) Og til slutt, et ugyldig argument med en utrolig konklusjon:

Alle sigaretter er dyre (premiss 1)
Noen vanedannende ting er rimelige (premiss 2)
Derfor er noen sigaretter ikke vanedannende (konklusjon)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hva er en måling og hva består den av?

A

Måling i seg selv er et subtilt konsept, men i bunn og grunn handler det om å finne en måte å tilordne tall, eller etiketter, eller en annen form for veldefinerte beskrivelser, til “ting”. Så, noe av følgende vil telle som en psykologisk måling:

Min ALDER er “33 år”.
Jeg liker “ikke” ANSJOS.
Mitt KROMOSOMALE KJØNN er “mann” .
Mitt SELVIDENTIFISERTE KJØNN er “kvinne” .

I den korte listen ovenfor er det som er i stor skrift “det som skal måles”, og det dekket av “ er “selve målingen”. Som du kan se, for noen ting (som alder) virker det ganske åpenbart hva settet med mulige mål skal være, mens det for andre ting blir litt vanskelig.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hva menes med operasjonalisering når det kommer til måling?

A

Det handler om å definere målingene dine.

F.eks:
Vær presis på hva du prøver å måle. Betyr for eksempel “alder” “tid siden fødselen” eller “tid siden unnfangelsen” i forbindelse med forskningen din?

Bestem hvilken metode du vil bruke for å måle den. Vil du bruke egenrapportering for å måle alder, spørre en forelder eller slå opp en offisiell post? Hvis du bruker selvrapportering, hvordan vil du formulere spørsmålet?

Definere settet med tillatte verdier som målingen kan ta. Merk at disse verdiene ikke alltid trenger å være numeriske, selv om de ofte er det. Ved måling av alder er verdiene numeriske, men vi må fortsatt tenke nøye gjennom hvilke tall som er tillatt. Ønsker vi alder i år, år og måneder, dager eller timer? For andre typer målinger (f.eks. kjønn) er verdiene ikke numeriske. Men, akkurat som før, må vi tenke på hvilke verdier som er tillatt. Hvis vi ber folk om å selvrapportere kjønnet sitt, hvilke alternativer lar vi dem velge mellom? Er det nok å tillate bare “mannlig” eller “kvinnelig”? Trenger du et “annet” alternativ? Eller bør vi ikke gi folk spesifikke alternativer og i stedet la dem svare med sine egne ord? Og hvis du åpner opp settet med mulige verdier for å inkludere all verbal respons, hvordan vil du tolke svarene deres?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Nevn fire begreper som har en tydelig sammenheng knyttet til målinger:

A

En teoretisk konstruksjon.
Dette er tingen du prøver å måle, som “alder”, “kjønn” eller en “mening”. En teoretisk konstruksjon kan ikke observeres direkte, og ofte er de faktisk litt vage.

Et tiltak.
Målingen refererer til metoden eller verktøyet du bruker for å gjøre dine observasjoner. Et spørsmål i en undersøkelse, en atferdsobservasjon eller en hjerneskanning kan alle telle som et mål.

En operasjonalisering.
Begrepet «operasjonalisering» refererer til den logiske sammenhengen mellom målet og den teoretiske konstruksjonen, eller til prosessen der vi prøver å utlede et mål fra en teoretisk konstruksjon.

En variabel.
Endelig et nytt begrep. En variabel er det vi ender opp med når vi bruker målet vårt på noe i verden. Det vil si at variabler er de faktiske “dataene” som vi ender opp med i datasettene våre.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hva er en nominell skala?

A

En nominell skalavariabel (også referert til som en kategorisk variabel) er en der det ikke er noe spesielt forhold mellom de forskjellige mulighetene. For denne typen variabler gir det ingen mening å si at en av dem er “større” eller “bedre” enn noen annen, og det gir absolutt ingen mening å snitte dem.

Det klassiske eksemplet på dette er “øyefarge”. Øyne kan være blå, grønne eller brune, blant andre muligheter, men ingen av dem er “større” enn noen andre. Som et resultat ville det føles veldig rart å snakke om en “gjennomsnittlig øyenfarge”.

På samme måte er kjønn også nominelt: mann er ikke bedre eller verre enn kvinne. Det gir heller ikke mening å prøve å snakke om et “gjennomsnittlig kjønn”. Kort fortalt er nominelle skalavariabler de der det eneste du kan si om de ulike mulighetene er at de er forskjellige.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hva er ordinalskala?

A

Ordinalskalavariabler har litt mer struktur enn nominelle skalavariabler, men ikke mye. En ordinalskalavariabel er en der det er en naturlig, meningsfull måte å ordne de forskjellige mulighetene på, men du kan ikke gjøre noe annet. Det vanlige eksemplet gitt på en ordinalvariabel er “sluttposisjon i et løp”. Du kan si at personen som kom først i mål var raskere enn personen som ble nummer to, men du vet ikke hvor mye raskere. Som en konsekvens vet vi at 1 var bedre enn 2 og vi vet at 2 var bedre enn 3, men forskjellen mellom 1 og 2 kan være mye større enn forskjellen mellom 2 og 3.

Her er et mer psykologisk interessant eksempel. Anta at jeg er interessert i folks holdninger til klimaendringer. Så går jeg og ber noen om å velge utsagnet (fra fire oppførte utsagn) som passer best med deres tro:

Temperaturene stiger på grunn av menneskelig aktivitet
Temperaturene stiger, men vi vet ikke hvorfor
Temperaturene øker, men ikke på grunn av mennesker
Temperaturene stiger ikke

Legg merke til at disse fire utsagnene faktisk har en naturlig rekkefølge, når det gjelder “i hvilken grad de stemmer overens med dagens vitenskap”. Påstand 1 er et nært samsvar, påstand 2 er et rimelig samsvar, påstand 3 er ikke et veldig godt samsvar, og påstand 4 er i sterk opposisjon til dagens vitenskap. Så når det gjelder det jeg er interessert i (i hvilken grad folk støtter vitenskapen), kan jeg bestille varene som 1>2>3>4.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Forklar hva intervallskala er

A

I motsetning til nominelle og ordinale skalavariabler, er intervallskala- og forholdsskalavariabler variabler der den numeriske verdien er genuint meningsfull. For intervallskalavariabler er forskjellene mellom tallene tolkbare, men variabelen har ikke en “naturlig” nullverdi. Et godt eksempel på en intervallskalavariabel er å måle temperatur i grader celsius. For eksempel, hvis det var 15
i går og 18 grader i dag, så den 3 grader forskjellen mellom de to er virkelig meningsfull. Dessuten at 3 grader forskjellen er nøyaktig den samme som 3 grader forskjell på 7 grader og 10 grader. Kort sagt, addisjon og subtraksjon er meningsfulle for intervallskalavariabler.

Legg imidlertid merke til at 0 grader betyr ikke “ingen temperatur i det hele tatt”. Det betyr faktisk “temperaturen der vannet fryser”, som er ganske vilkårlig. Som en konsekvens blir det meningsløst å prøve å multiplisere og dividere temperaturer. Det er feil å si at 20 grader er dobbelt så varmt som 10 grader, akkurat som det er rart og meningsløst å prøve å påstå at 20 grader er negativ to ganger så varm som -10
.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hva betyr og forklar hva forholdstall er

A

Den fjerde og siste typen variabel å vurdere er en forholdsskalavariabel , der null egentlig betyr null, og det er greit å multiplisere og dele.

Et godt psykologisk eksempel på en forholdsskalavariabel er responstid (RT). I mange oppgaver er det veldig vanlig å registrere hvor lang tid noen bruker på å løse et problem eller svare på et spørsmål, fordi det er en indikator på hvor vanskelig oppgaven er.

Anta at Alan bruker 2,3 sekunder på å svare på et spørsmål, mens Ben bruker 3,1 sekunder. Som med en intervallskalavariabel er både addisjon og subtraksjon meningsfulle her. Ben tok virkelig 3,1 - 2,3 = 0,8 sekunder lenger enn Alan gjorde. Legg imidlertid merke til at multiplikasjon og divisjon også gir mening her også: Ben tok 3,1/2,3 = 1,35 ganger så lang tid som Alan gjorde for å svare på spørsmålet. Og grunnen til at du kan gjøre dette er at for en forholdsskalavariabel som RT betyr “null sekunder” virkelig “ingen tid i det hele tatt”.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hva er altså de fire skalaene?

A
  1. Nominell skala
  2. Ordinalskala
  3. Intervallskala
  4. Forholdstall
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hva er forskjellen mellom en diskret variabel og en kontinuerlig variabel?

A

En kontinuerlig variabel er en der, for alle to verdier du kan tenke deg, er det alltid logisk mulig å ha en annen verdi i mellom.

EKS:
Hvis Alan bruker 3,1 sekunder og Ben bruker 2,3 sekunder på å svare på et spørsmål, vil Camerons responstid ligge i mellom hvis han tok 3,0 sekunder.

En diskret variabel er faktisk en variabel som ikke er kontinuerlig. For en diskret variabel er det noen ganger slik at det ikke er noe i midten.

EKS:
Diskrete variabler oppstår når denne regelen brytes. For eksempel er nominelle skalavariabler alltid diskrete. Det er ikke en type transport som faller “imellom” tog og sykler, ikke på den strenge matematiske måten at 2,3 faller mellom 2 og 3. Så transporttypen er diskret. På samme måte er ordinalskalavariabler alltid diskrete. Selv om “2. plass” faller mellom “1. plass” og “3. plass”, er det ingenting som logisk kan falle mellom “1. plass” og “2. plass”.

FORKLARING:

Kontinuerlige variabler kan bare være intervall og forholdstall.

Diskret variabler kan være alle 4

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Hva er en Likert-skala?

A
  1. Helt uenig
  2. Være uenig
  3. Verken enig eller uenig
  4. Enig
  5. Helt enig

Likert-vekter er veldig nyttige, om enn noe begrensede, verktøy. Spørsmålet er hva slags variabler de er? De er åpenbart diskrete, siden du ikke kan gi et svar på 2,5. De er åpenbart ikke nominell skala, siden varene er bestilt; og de er ikke forholdsskala heller, siden det ikke er noe naturlig null.

Men er de ordinalskala eller intervallskala? Et argument sier at vi egentlig ikke kan bevise at forskjellen mellom «helt enig» og «enig» er av samme størrelse som forskjellen mellom «enig» og «verken enig eller uenig». Faktisk, i hverdagen er det ganske tydelig at de ikke er like i det hele tatt. Så dette antyder at vi bør behandle Likert-skalaer som ordinalvariabler. På den annen side ser de fleste deltakerne i praksis ut til å ta hele «på en skala fra 1 til 5»-delen ganske seriøst, og de har en tendens til å opptre som om forskjellene mellom de fem svaralternativene var ganske like hverandre. Som en konsekvens behandler mange forskere Likert-skaladata som intervallskala.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Hva menes med pålitelighet og gyldighet når det kommer til måling?

A

Pålitelighet er faktisk et veldig enkelt konsept. Det refererer til repeterbarheten eller konsistensen av målingen din.

Målingen av vekten min ved hjelp av en “badevekt” er veldig pålitelig. Hvis jeg går av og på vekten om og om igjen, vil det fortsette å gi meg det samme svaret. Å måle intelligensen min ved å “spørre mamma” er veldig upålitelig. Noen dager forteller hun meg at jeg er litt tykk, og andre dager forteller hun meg at jeg er en fullstendig idiot.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hva er de fire måtene å måle reliabilitet på?

A

Test-retest pålitelighet

Inter-rater pålitelighet

Parallelle former pålitelighet

Intern konsistens pålitelighet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Forklar kort Test-retest pålitelighet

A

Dette gjelder konsistens over tid. Hvis vi gjentar målingen på et senere tidspunkt, får vi samme svar?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Forklar kort Inter-rater pålitelighet

A

Dette gjelder konsistens på tvers av mennesker. Hvis noen andre gjentar målingen (f.eks. noen andre vurderer intelligensen min) vil de produsere det samme svaret?

16
Q

Forklar kort Parallelle former pålitelighet

A

Dette er relatert til konsistens på tvers av teoretisk ekvivalente målinger. Hvis jeg bruker et annet sett med badevekt for å måle vekten min, gir det samme svar?

17
Q

Forklar kort Intern konsistens pålitelighet

A

Hvis en måling er konstruert fra mange forskjellige deler som utfører lignende funksjoner (f.eks. et resultat fra et personlighetsspørreskjema legges sammen over flere spørsmål), har de enkelte delene en tendens til å gi lignende svar.

18
Q

Hva er de klassiske og moderne navnene for uavhengig variabel for avhengig variabel for? (tegnene) LES DET SISTE

A

Klassisk:
1. uavhengig variabel (IV)
2. avhengig variabel (DV).

IV er variabelen du bruker for å forklare (dvs.) og DV er variabelen som forklares (dvs.).

Moderne:
1. “prediktorer (X)”
2. “utfall (Y)”

MEN i faget vil han bruke de moderne begrepene

19
Q

Hva er eksperimentell forskning

A

Nøkkeltrekket ved eksperimentell forskning er at forskeren kontrollerer alle aspekter av studien, spesielt hva deltakerne opplever i løpet av studien. Spesielt manipulerer eller varierer forskeren prediktorvariablene (IV), men lar utfallsvariabelen (DV) variere naturlig. Ideen her er å bevisst variere prediktorene (IV) for å se om de har noen årsakseffekter på utfallene.

20
Q

Hva menes med begrepet “forvirre” når det kommer til målinger?

A

La oss vurdere et veldig enkelt, fullstendig urealistisk og grovt uetisk eksempel. Tenk deg at du ville finne ut om røyking forårsaker lungekreft.

En måte å gjøre dette på er å finne folk som røyker og folk som ikke røyker og se om røykere har en høyere forekomst av lungekreft. Dette er ikke et skikkelig eksperiment, siden forskeren ikke har mye kontroll over hvem som er og ikke er røyker. Og dette betyr virkelig noe. For eksempel kan det være at folk som velger å røyke sigaretter også har en tendens til å ha dårlige dietter, eller kanskje de har en tendens til å jobbe i asbestgruver, eller hva som helst.

Poenget her er at gruppene (røykere og ikke-røykere) faktisk er forskjellige på mange ting, ikke bare røyking. Så det kan være at den høyere forekomsten av lungekreft blant røykere er forårsaket av noe annet, og ikke av røyking i seg selv. I tekniske termer kalles disse andre tingene (f.eks. kosthold) “forvirre”, og vi skal snakke om dem om et øyeblikk.

21
Q

I røyke eksempelet, hvordan kan man forhindre “forvirre” og at andre variabler ødelegger for det som ønskes å forskes på.

A

Et skikkelig eksperiment kan se ut slik:

Husk at vår bekymring var at røykere og ikke-røykere kan være forskjellige på mange måter. Løsningen, så lenge du ikke har noen etikk, er å kontrollere hvem som røyker og ikke. Nærmere bestemt, hvis vi tilfeldig deler unge ikke-røykere i to grupper og tvinger halvparten av dem til å bli røykere, så er det svært usannsynlig at gruppene vil skille seg på noe annet vis enn det faktum at halvparten av dem røyker. På den måten kan vi føle oss ganske sikre på at (a) røyking forårsaker kreft og (b) at vi er mordere, hvis røykegruppen vår får kreft i høyere grad enn gruppen som ikke røyker.

22
Q

Forklar hva ikke-eksperimentell forskning er

A

Ikke-eksperimentell forskning er et bredt begrep som dekker «enhver studie der forskeren ikke har så mye kontroll som de gjør i et eksperiment». Det er klart at kontroll er noe forskere liker å ha, men som det forrige eksemplet illustrerer er det mange situasjoner der du ikke kan eller bør prøve å oppnå den kontrollen. Siden det er grovt uetisk (og nesten helt sikkert kriminelt) å tvinge folk til å røyke for å finne ut om de får kreft, er dette et godt eksempel på en situasjon der du egentlig ikke bør prøve å få eksperimentell kontroll.

23
Q

Det finnes to typer ikke-eksperimentell forskning, hva er disse?

A

kvasi-eksperimentell forskning og case-studier

24
Q

Forklar kvasi-eksperimentell forskning

A

Eksemplet jeg diskuterte tidligere, der vi ønsket å undersøke forekomsten av lungekreft blant røykere og ikke-røykere uten å prøve å kontrollere hvem som røyker og hvem som ikke gjør det, er et kvasi-eksperimentelt design.

Det vil si at det er det samme som et eksperiment, men vi kontrollerer ikke prediktorene (IV).

25
Q

Forklar hva case-studier er

A

Den alternative tilnærmingen, casestudier, tar sikte på å gi en svært detaljert beskrivelse av en eller noen få tilfeller. Generelt kan du ikke bruke statistikk til å analysere resultatene av casestudier, og det er vanligvis svært vanskelig å trekke noen generelle konklusjoner om “mennesker generelt” fra noen få isolerte eksempler. Imidlertid er casestudier svært nyttige i noen situasjoner.

For det første er det situasjoner der du ikke har noe alternativ. Nevropsykologi har dette problemet mye. Noen ganger kan du bare ikke finne mange mennesker med hjerneskade i et bestemt hjerneområde, så det eneste du kan gjøre er å beskrive de tilfellene du har så detaljert og med så mye omhu som du kan. Imidlertid er det også noen reelle fordeler med casestudier. Fordi du ikke har så mange mennesker å studere, har du muligheten til å investere mye tid og krefter på å prøve å forstå de spesifikke faktorene som spiller inn i hvert enkelt tilfelle. Dette er en veldig verdifull ting å gjøre. Som en konsekvens kan casestudier utfylle de mer statistisk orienterte tilnærmingene du ser i eksperimentelle og kvasi-eksperimentelle design.

Vi skal ikke snakke så mye om casestudier i denne boken, men de er likevel svært verdifulle verktøy!

26
Q

Hva betyr validitet og validiteten til en måling? + de 5 typer validitet

A

Mer enn noen annen ting ønsker en vitenskapsmann at forskningen deres skal være “gyldig”. Den konseptuelle ideen bak validitet er veldig enkel. Kan du stole på resultatene av studien din? Hvis ikke, er studien ugyldig. Men selv om det er enkelt å si, er det i praksis mye vanskeligere å sjekke gyldighet enn det er å sjekke reliabilitet. Og i all ærlighet, det er ingen presis, klart enighet om hva gyldighet faktisk er. Faktisk er det mange forskjellige typer validitet, som hver reiser sine egne problemer. Og ikke alle former for validitet er relevante for alle studier. Jeg skal snakke om fem forskjellige typer validitet:

  1. Intern gyldighet
  2. Ytre gyldighet
  3. Konstruksjonsgyldighet
  4. Ansiktsgyldighet
  5. Økologisk gyldighet
27
Q

Hva er de viktigste validitetsoformene?

A

Først en rask guide til hva som betyr noe her.

(1) Intern og ekstern validitet er de viktigste, siden de knytter seg direkte til det grunnleggende spørsmålet om studiet ditt virkelig fungerer.

(2) Konstruksjonsvaliditet spør om du måler det du tror du er.

(3) Ansiktsgyldighet er ikke så veldig viktig bortsett fra i den grad du bryr deg om “utseende”.

(4) Økologisk validitet er et spesielt tilfelle av ansiktsvaliditet som tilsvarer et slags utseende som du kanskje bryr deg mye om.

28
Q

Forklar hva Intern validitet er

A

Intern validitet refererer til i hvilken grad du er i stand til å trekke riktige konklusjoner om årsakssammenhengene mellom variabler. Det kalles “internt” fordi det refererer til forholdet mellom ting “inne” i studien.

EKS:
Tenk deg at du er interessert i å finne ut om en universitetsutdanning får deg til å skrive bedre. For å gjøre det får du en gruppe førsteårsstudenter, ber dem skrive et 1000 ords essay og telle antall stave- og grammatiske feil de gjør. Så finner du noen tredjeårsstudenter, som åpenbart har hatt mer universitetsutdanning enn førsteårsstudentene, og gjentar øvelsen. Og la oss anta at det viser seg at tredjeårsstudentene produserer færre feil. Og så konkluderer du med at en universitetsutdanning forbedrer skriveferdighetene. Er dette riktig?

Bortsett fra at det store problemet med dette eksperimentet er at tredjeårsstudentene er eldre og de har hatt mer erfaring med å skrive ting. Så det er vanskelig å vite sikkert hva årsakssammenhengen er. Skriver eldre bedre? Eller folk som har hatt mer skriveerfaring? Eller folk som har hatt mer utdanning? Hvilken av de ovennevnte er den sanne årsaken til den overlegne ytelsen til tredjeårene? Alder? Erfaring? Utdannelse? Du kan ikke si det. Dette er et eksempel på en svikt i intern validitet, fordi studien din ikke skiller ut årsakssammenhengene mellom de forskjellige variablene.

29
Q

Forklar ekstern validitet

A

Ekstern validitet er relatert til generaliserbarheten eller anvendeligheten av funnene dine.

Det vil si i hvilken grad forventer du å se det samme resultatmønsteret i «det virkelige liv» som du så i studien din. For å si det litt mer presist, vil enhver studie du gjør i psykologi involvere et ganske spesifikt sett med spørsmål eller oppgaver, vil forekomme i et spesifikt miljø, og vil involvere deltakere som er hentet fra en bestemt undergruppe (skuffende ofte er det college studenter!). Så hvis det viser seg at resultatene faktisk ikke generaliserer eller gjelder mennesker og situasjoner utover de du studerte, så er det du har en mangel på ekstern validitet.

EKS:
Det klassiske eksemplet på denne problemstillingen er det faktum at en svært stor andel av studier i psykologi vil bruke psykologistudenter som deltakere. Selvfølgelig bryr forskerne seg imidlertid ikke bare om psykologistudenter. De bryr seg om mennesker generelt. Gitt det, medfører en studie som kun bruker psykologistudenter som deltakere alltid en risiko for å mangle ekstern validitet. Det vil si, hvis det er noe “spesielt” med psykologistudenter som gjør dem annerledes enn den generelle befolkningen på et eller annet relevant vis, så kan vi begynne å bekymre oss for mangel på ekstern validitet.

30
Q

Forklar hva konstruksjonsvaliditet er

A

Konstruksjonsvaliditet er i utgangspunktet et spørsmål om du måler det du vil måle. En måling har god konstruksjonsvaliditet hvis den faktisk måler den korrekte teoretiske konstruksjonen, og dårlig konstruksjonsvaliditet hvis den ikke gjør det.

EKS:
Anta at jeg prøver å undersøke hvor mye universitetsstudenter jukser til eksamen. Og måten jeg prøver å måle det på er ved å be juksestudentene om å stille seg opp i forelesningssalen slik at jeg kan telle dem. Når jeg gjør dette med en klasse på 300 elever hevder 0 personer å være juksemakere. Så jeg konkluderer derfor med at andelen juksere i klassen min er 0%. Klart dette er litt latterlig. Men poenget her er ikke at dette er et veldig dypt metodisk eksempel, men snarere å forklare hva konstruksjonsvaliditet er. Problemet med målet mitt er at mens jeg prøver å måle «andelen av folk som jukser», er det jeg faktisk måler «andelen av folk som er dumme nok til å tåle å jukse, eller blodige nok til å late som om de gjøre”. Det er klart at dette ikke er det samme! Så studien min har gått galt, fordi målingen min har veldig dårlig konstruksjonsvaliditet.

31
Q

Hva er ansiktsvaliditet?

A

Ansiktsvaliditet refererer ganske enkelt til hvorvidt et mål “ser ut som” det gjør det det skal, ikke noe mer. Hvis jeg designer en intelligenstest, og folk ser på den og sier “nei, den testen måler ikke intelligens”, så mangler målet ansiktsvaliditet. Så enkelt er det. Ansiktsvaliditet er åpenbart ikke veldig viktig fra et rent vitenskapelig perspektiv. Det vi bryr oss om er tross alt om tiltaket faktisk gjør det det skal gjøre, ikke om det ser ut som det gjør det det skal.

Tre viktige punkter med ansiktsvaliditet:

  1. Med andre ord, når noen du stoler på kritiserer gyldigheten av studien din, er det verdt å ta deg tid til å tenke nøyere over designet ditt for å se om du kan tenke på grunner til at det kan gå galt. Merk deg, hvis du ikke finner noen grunn til bekymring, bør du sannsynligvis ikke bekymre deg.
  2. Ofte (veldig ofte), vil helt uinformerte mennesker også ha en “anelse” om at forskningen din er dritt. Og de vil kritisere det på internett eller noe. Ved nærmere ettersyn vil du kanskje legge merke til at denne kritikken faktisk er helt fokusert på hvordan studien “ser ut”, men ikke på noe dypere.
  3. For å utvide det siste punktet, hvis troen til utrente mennesker er kritiske (f.eks. er dette ofte tilfellet for anvendt forskning der du faktisk ønsker å overbevise beslutningstakere om et eller annet), så må du bry deg om ansiktsvaliditet. Rett og slett fordi, enten du liker det eller ikke, mange mennesker vil bruke ansiktsgyldighet som en proxy for reell gyldighet.
32
Q

Forklar økologisk validitet

A

Økologisk validitet er en annen forestilling om validitet, som ligner ekstern validitet, men mindre viktig. Tanken er at, for å være økologisk gyldig, bør hele oppsettet av studien nærme seg det virkelige scenariet som blir undersøkt. På en måte er økologisk gyldighet en slags ansiktsgyldighet. Det handler mest om hvorvidt studien “ser” riktig ut, men med litt mer strenghet. For å være økologisk gyldig må studien se riktig ut på en ganske spesifikk måte. Tanken bak er intuisjonen om at en studie som er økologisk gyldig er mer sannsynlig å være eksternt gyldig. Det er ingen garanti, selvfølgelig. Men det fine med økologisk validitet er at det er mye lettere å sjekke om en studie er økologisk valid enn det er å sjekke om en studie er eksternt gyldig.

EKS:
Et enkelt eksempel ville være øyenvitneidentifikasjonsstudier. De fleste av disse studiene har en tendens til å bli gjort i en universitetssetting, ofte med en ganske enkel rekke ansikter å se på, i stedet for en oppstilling. Tiden mellom å se «forbryteren» og bli bedt om å identifisere den mistenkte i «oppstillingen» er vanligvis kortere. “Forbrytelsen” er ikke ekte, så det er ingen sjanse for at vitnet blir redd, og det er ingen politifolk til stede, så det er ikke like stor sjanse for å føle seg presset. Disse tingene betyr alle at studien definitivt mangler økologisk validitet. De kan (men kanskje ikke) bety at det også mangler ekstern validitet.

33
Q
A