1- Reliabilitet Flashcards
Hvorfor trenger vi Reliabilitet?
Alle tester er full av feil. Når vi bruker en test må vi stille krav til nøyaktighet og presisjon. Reliabilitet gjør at vi kan vite hvor stor grad av sikkerhet vi har- det er relevant når vi skal ta en avgjørelse innenfor psykologien.
Forskjell når du skal avgjøre om personen skal bli tatt fra barna sine og når du tar en personlighetstrekk.
Hva er Reliabilitet (definisjon)
“Andelen av total varians i en skåre som kan tilskrives varians i sanne skårer”
=Konsistent og pålitelig resultat av skårer på et måleinstrument.
Dersom vi hadde hatt perfekt reliabilitet, hva ville vi fått da?
Den som testes oppnår samme skåre på testen ved flere målinger under ellers like forhold. Perfekt reliabilitet= fravær av målefeil
Hva er klassisk testteori?
T er det vi egentlig ønsker å måle, men skåren man får på en test antas å være forurenset av målefeil (e)
Vi kan dele inn målefeil i to. Eksempeler på hver?
Usystematiske: Misforsto spørsmålet, surv, dagsform, feil hos administrator
Systematisk: løgn, bias hos testadministrator, testen favoriserer
Hvilken antagelse har vi om målefeil i klassisk testteori?
Vi antar at målefeil er tilfeldige fordi det er vanskelig å fange opp de systematiske feilene.
Hvordan kan vi gå frem for å vite personens sanne skåre?
Teoretisk må vi teste personen uendelig mange ganger, sann skåre vil være gjennomsnittet av alle oppnådde skårer. (ikke mulig i praksis)
I praksis må flere personer skåres på samme test (eller parallelle former av denne) en eller to ganger. Tar du testen en gang må du ha flere spørsmål som spør om det samme begrepet slik at vi kan beregne reliabiliten.
Hva er reliabilitetskoeffisienten et produkt av?
Nevn alle måtene vi kan estimere reliabilitet.
Stabilitetstester
- Test-retest reliabilitet
-Alternativ form/paralelle former
Intern konsistensbaserte tester
-Split half reliabilitet
-Inter rater reliabilitet
-Inter item reliabilitet (Cronbachs alfa)
Hva er stabilitetstester?
Estimerer reliabilitet. Relevant når vi skal måle stabile egenskaper. For stabilitet over tid/ulike versjoner av tester. Som feks IQ eller personlighet
En test nå og en om 1 år.
Hva er test-retest? (stabilitetstester)
Man tester samme person to ganger ved ulike tidspunkt for å så korrelere svarene. Høy korrelasjon vil si høy reliabilitet. Feilkilder kan være at det har skjedd en reell endring, eller at man husker svaret fra sist gang
Hva er alternativ form? (stabilitetstester)
Man tester samme person to ganger, men med litt ulike versjoner som egentlig måler det samme, feks eksamen v22 og h22. Feilkilder kan være at det har skjedd en reell endring, eller at man egentlig ikke måler det samme ved disse to ulike versjonene.
Hva er Intern konsistensbasert tester?
Estimering av reliabilitet. Relevant når det vi skal måle ikke er stabilit over tid. Brukes for måling av en sumskåre på samme tidspunkt. Reliabilitet basert på kun en administrasjon av testen. Feks holdninger. Forutsetter at vi har flere indikatorer.
Hva er inter-rater reliabilitet? (Intern konsistensbasert tester)
To eller flere personer obserververer samme person slik at vi har flere målinger samme “gang”. Ser om det er korrelasjon mellom disse.
Hva er Split-halft? (Intern konsistensbasert tester)
Splitter testen i to. Forutsetter at du har flere indikatorer på det du skal måle. Lager sumskåre på de to delene (som er tilfeldig delt) og korrelerer de med hverandre. Så må du korrigere for at du kun har halve delen. (Spearman Brown korreksjon).
Gammel metode med flere ulemper.