Reliabilitet Flashcards

Question 1

Q

Reliabilitet och hot

Answer

A

Reliabilitet är ett statistiskt mått på testets och mätningens tillförlitlighet, dvs att vi litar på den mätning som gjorts (hur väl kan vi lita på måttet/instrumentet)
Hög reliabilitet innebär att vi får samma resultat under samma testförhållanden.

Hot mot reliabiliteten är mätfel:
Systematiska fel – kan bero på fel i metod eller mätinstrument (felkonstruerat item, fel i manualen)
Slumpmässiga fel – beror på tillfälligheter och kan gå åt vilket håll som helst, ex. testsituation, miljö eller testperson

Question 2

Q

Klassisk testeori

Answer

A

t = sant värde (okänt)
X = erhållet värde (t ex testpoäng)
e = slumpmässigt mätfel (negativt eller positivt)

X = t + e
det erhållna värdet är summan av sant och fel

Question 3

Q

Mätfelens orsaker

Answer

A

Testets egenskaper: svårbegripligt, tvetydigt
Yttre omständigheter: störande faktorer etc. buller
Testtagarens
Stress inför testet
Kapacitet och vilja att följa instruktionerna
Fysisk smärta och emotionell upprördhet
Fysisk påverkan efter att inte ha sovit eller ätit tillräckligt
Hur alert man är
Benägenhet/tendens att hålla med (eller tvärt om)
Förkunskap om testet
Behov av att framställa sig i god dager
Relationen mellan den som testas och den som testar

Question 4

Q

Hot mot rättvisa svar

Answer

A

Om det är ett långt frågeformulär, om individerna inte känner sig motiverade att svara
Människor tenderar generellt att hålla med, hellre än att säga emot
Vissa svar uppfattas som socialt önskvärda
Kan vilja framställa sig i negativ dager för att undvika något
Frågan kan vara otydlig eller svårbegriplig

Question 5

Q

Olika metoder för skattning av reliabilitet

Answer

A

Stabilitet
- Test-retest

Parallelltestmetoden

Intern konsistens
- Split-half
- Kuder-Richardson (kategori)
- Cronbachs alfa (kontinuerlig)

Interbedömarreliabilitet
- Kappa (kategori)
- Intraclass Correlation Coefficient (kontinuerlig)

Question 6

Q

Test-retest

Answer

A

Samma test ges till en representativ grupp av personer vid två tillfällen.

Sambandet mellan mätningarna utgör den uppskattade reliabilitetskoefficienten.

Hög reliabilitet innebär att mätresultatet inte är beroende av dagsform eller andra faktorer som kan orsaka variation i mätning över tid.

Om det finns risk för träningseffekter är detta mått problematiskt iom att det är samma person som ska genomföra testet vid de två tillfällena.

Om det finns studier som visar hög test-retest i tillägg till hög inre konsistens är det starkare stöd för mätinstrumentets reliabilitet.

utvärderingen av förändring → kan var lämpligt att ha lågt på test-retest (behöver alltså inte ha hög stabilitet)

Question 7

Q

Parallelltest

Answer

A

Två likvärdiga test ges till samma grupp personer vid samma tillfälle.

Testen är konstruerade att mäta samma sak, men med olika frågor.

Korrelationen mellan de parallella testen ger en uppskattning av reliabilitetskoefficienten.

Hög korrelationskoefficient tyder på att testen mäter samma sak

Question 8

Q

Split-half

Answer

A

Ett test ges vid ett tillfälle, items/frågorna grupperas i två delar (t.ex. udda och jämna frågor) som summeras. Därefter beräknas sambandet mellan dessa två summavariabler.

Ger ett mått på samstämmigheten mellan de två delarna i testet.

Redovisas sällan och anses mer begränsat visa på inre konsistens

Question 9

Q

Kuder-Richardson

Answer

A

Används vid dikotoma items.

Bygger på att homogenitet ger ett mått på samstämmighet – det som kallas inre/intern konsistens (internal consistency) - likt cronbachs alfa.

Ger ett mått på samstämmigheten mellan samtliga items i ett test – hur väl de mäter samma underliggande dimension.

Ger reliabilitetskoefficienten KR-20 eller KR-21.

Question 10

Q

Cronbachs alfa

Answer

A

Används för kontinuerliga items.

Hur mycket av variationen i mätresultatet kommer av det som deluppgifterna mäter gemensamt, till skillnad från variationen som är unik för varje deluppgift?

Anger kvoten mellan summan av itemvarianserna delat med variansen för totalsumman för hela testet.

Mått på inre konsistens, samstämmighet mellan samtliga item i ett test.

Är tekniskt lätt att beräkna och information om inre konsistens bör finnas i manualer eller publikationer om testet.

Question 11

Q

Reliabilitetskoefficienten

Answer

A

Koefficienten går från 0 till 1.

0.9 - utmärkt
0.8-0.9 - bra
0.7-0.8 - ok

Det går inte att räkna ut den teoretiska formeln, därför använder man andra reliabilitetskoefficienter som uppskattar reliabiliteten – olika metoder kan användas.

Reliabiliteten för inre konsistens påverkas av antalet items eftersom de ingår i formeln för uträkning – fler items ökar reliabilitetskoefficienten (även om detta givetvis också är beroende av frågornas kvalitet).

Spearman-Browns formel kan räkna ut hur mycket reliabiliteten skulle förbättras om man exempelvis dubblar antalet frågor.

Kan också användas för att beräkna hur mycket reliabiliteten skulle öka med dubbelt så många frågor eller för att förkorta test.

Har man fastställt reliabilitetskoefficienten kan man räkna fram standardfelet (SEM) – man utgår ifrån standardavvikelsen på testet och dess reliabilitet.

Question 12

Q

Interbedömarreliabilitet

Answer

A

Avser i hur stor utsträckning två bedömare (kodare, skattare, intervjuare, testledare) kan göra samma kvantitativa bedömning.
Sambandet mellan mätningar gjorda av två olika bedömare redovisas ofta med intraklasskorrelationen (ICC) för kontinuerliga variabler och kappa för kategoriska variabler.

För alla metoder när mätresultaten är beroende av bedömare är denna typ av skattning viktig.

Exempel kan vara kodning av samspel, observationer

Hög interbedömarreliabilitet är beroende av tydliga definitioner och kriterier för bedömningen, bedömarens utbildning och erfarenhet.

Vad som anses som tillräckligt hög interbedömarreliabilitet avgörs till stor del av hur svår bedömningsuppgiften är.

Question 13

Q

Intra-Class Correlations

Answer

A

Cohens kappa är ett exempel (lärare)

Question 14

Q

Standard error of measurement, SEM

Answer

A

Den enskilda mätningens standardfel ger oss standardavvikelsen för den statistiska fördelningen som mätfelet utgör, hur mycket i genomsnitt mätfelen varierar.

Är användbart vid tolkning av resultat, personbedömning, rekommendationer och beslut, när vi sitter med en enskild individ - troligtvis finns det mätfel, vet vi reliabiliteten så vet vi att det finns ett spann (reliabiliteten är oftast lite lägre än 1).

Man kan räkna ut ett förväntat standardfel för individens testresultat på given reliabilitetsnivå.

Högre reliabilitet ger bättre tillförlitlighet, och mindre standardfel – det erhållna testvärdet ligger nära det sanna värdet vilket ger testet bättre prognosvärde.

Exempel:
SEM på prov med reliabilitet på 0.85, där man kan få 50 poäng och där s är 7.5, där blir SEM = 2.9. Med 68% sannolikhet ligger en individ med 35 poäng mellan 32-38 poäng.

Question 15

Q

Faktorer som påverkar reliabiliteten

Answer

A

Antalet items – fler ger högre reliabilitet, men är också beroende av items kvalitet (psykometrisk kvalitet)

Brett eller smalt begrepp som ska undersökas.

Vilken population som testats

Innehållet i testet

Rättningen av testet

För att komma tillrätta med dessa faktorer är det viktigt att göra pilotstudier och räkna på reliabiliteten

Miljön där testet utförs

Testpersonens dagsform

Administratörens skicklighet

Question 16

Q

Reliabilitet vid profiltolkning

Answer

A

När man försöker för en överblick över styrkor och svårigheter jämför man resultat på olika delskalor på exempelvis WISC.
Det är då viktigt att vara medveten om att olika deltest kan ha olika reliabilitet och vissa ganska låg sådan.
Ju lägre reliabilitet desto vanskligare är det att tolka skillnader mellan deltest som något annat än mätfel.
Reliabiliteten kan också variera mellan åldrar och subgrupper

Question 17

Q

Varför går det inte att fastslå ett instruments reliabilitet en gång för alla?

Answer

A

Reliabiliteten kan vara hög i en population men låg i en annan (t.ex. klinisk vs. normalpopulation)
Reliabiliteten för en ny standardisering eller översättning kan vara annorlunda jämfört med tidigare version
Reliabilitestkoefficienter från relevanta populationer är grundläggande information om ett mätinstrument
Var observant på vilken typ av reliabilitetskoefficient som redovisas! Tar hänsyn till olika typer av slumpfel.