Tentafrågor Flashcards

1
Q
  1. Om man väljer en grupp individer med de högsta eller de lägsta värdena i en population så kommer de som grupp att ha ett mindre extremt värde nästa gång man mäter dem. Vad kallas detta fenomen?
A

Regression mot medelvärdet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Du har skapat ett nytt test för att mäta reflekterande förmåga. För att ta reda på om ditt test fungerar har du tagit hjälp av en erfaren psykolog för att göra en klinisk bedömning av dina testpersoners reflekterande förmåga. Du använder psykologens bedömning som facit för om en person har god reflekterande förmåga eller ej.

Beskriv hur du gör för att med denna information räkna ut specificiteten och
sensitiviteten på ditt test.

A

För att undersöka sensitivitet fokuserar jag på andelen som mitt nya testet kategoriserar som
de som har god reflekterade förmåga, av alla som psykologen bedömt ha god reflekterande
förmåga. Enligt en uppställning innebär detta sant positiva delat med sant positiva plus falskt
negativa.

För att undersöka specificitet fokuserar jag på andelen som mitt nya testet kategoriserar som
de som inte har god reflekterade förmåga, av alla som psykologen bedömt inte ha god
reflekterande förmåga. Enligt en uppställning innebär detta sant negativa delat med sant
negativa plus falskt positiva.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Vad är en ROC-kurva i testsammanhang och hur beräknas den?

A

En ROC-kurva visar sambandet mellan sensitivitet och 1-specificitet. Punkterna längs kurvan
visar sensitivitet och 1-specificitet vid varje möjligt gränsvärde. Det gränsvärde som
minimerar antalet som är fel kategoriserade av testet är det gränsvärde som man finner på
kurvan närmast det övre vänstra hörnet. Ytan under kurvan benämns AUC (Area Under the
Curve) och ju större yta under kurvan desto bättre förmåga har testet att diskriminera mellan
case och non-case.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Du sitter med ett testresultat från en person som fått 54 poäng på skalan Öppenhet i ett personlighetstest. Svaren är konverterade till T-skalan och den enskilda mätningens standardfel är 4 och reliabiliteten för skalan i detta test är .84. Mellan vilka värden kan vi med ca 95% säkerhet, utifrån den klassiska testteorin, anta att det sanna värdet ligger? (OBS vi kommer ej räkna på tentan)

A

För att ta fram ett konfidensintervall runt individens mätresultat som visar ett 95%
konfidensintervall gångrar vi SEM med 1.96, detta ger 7.84. Individens testresultat ligger
därmed med 95% säkerhet mellan 54 +/- 7.84.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Du berättar för en vän att du pluggar till en tenta i testmetodik, som bland annat handlar om hur olika test innehåller mätfel och att det spelar roll vilka frågor som är med i formuläret och hur de är formulerade. Din vän som regelbundet får frågeformulär från SCB blir mycket intresserad och vill veta mer om vad som orsakar mätfel och hur man kan undvika dem. Vad svarar du?

A

Exempel på saker att ta upp:
Mätfel kan bero på testets egenskaper, yttre omständigheter vid testsituationen men också
bero på faktorer relaterat till den som tar testet, exempelvis stress inför testet, förkunskaper
om testet, benägenhet att hålla med, hur man mår fysiskt och psykiskt. Relationen till den
som testar kan också spela roll för hur testtagaren svarar. Att besvara frågor kräver att
testtagaren ska förstå frågan, minnas det som frågan gäller, kunna göra en bedömning och
överföra det till svarsalternativen. Det är viktigt att tänka på att inte göra för långa
frågeformulär, att frågorna är tydliga, inte ställa flera frågor i samma fråga eller använda
krångligt språk. Det är viktigt att testet har visat på goda psykometriska egenskaper i tidigare
undersökningar, och har visat på hög reliabilitet särskilt test-retest som tyder på stabilitet i
mätningen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Under din VFU arbetar du på en rekryteringsfirma som använder olika typer av test i rekryteringsprocessen. Ett av testen ska mäta kreativitet utifrån två dimensioner; divergent tänkande och motivation. Du ställer dig frågande till validiteten i testet och bestämmer dig för att undersöka den i ditt kommande examensarbete på psykologprogrammet. Beskriv hur du gör för att utvärdera testets validitet

A

För att undersöka samtidig validitet skulle man kunna undersöka samband mellan det aktuella
testet och ett annat test som mäter samma dimensioner eller snarlika dimensioner vid samma
tillfälle som det aktuella testet ges. För att undersöka prediktiv validitet skulle man kunna
undersöka sambandet mellan det aktuella testet och ett uppsatt kriterium vid ett senare
tillfälle, exempelvis kopplat till något relevant kriterium som skulle kunna belysa kreativitet i
det yrke som rekryteringen gäller. Med hjälp korrelation med annat relevant mått som är
välanvänt för att undersöka de dimensioner som det aktuella testet undersöker kan
begreppsvaliditet undersökas. Man kan också med hjälp av konfirmatorisk faktoranalys
undersöka begreppsvaliditet genom att skapa en hypotes om vilka faktorer som testet
innehåller baserat på teori och se om det strukturen i testet stämmer med hypotesen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Varför används Spearman Brown’s “profetformel” när man beräknar reliabilitet med Splithalves metoden?

A

Reliabilitet i testmätningar är beroende av antalet uppgifter som ingår i testet. Fler items ger högre
reliabilitet, samtidigt som givetvis kvaliteten hos items också har en avgörande betydelse. Med hjälp
av Spearman Brown’s formel kan man beräkna hur mycket reliabiliteten förbättras om man
exempelvis dubblar antalet testuppgifter. Man kan även bestämma sig för vilken reliabilitet man
önskar och räkna ut hur många nya items som skulle behöva läggas till. Formeln kan också användas
för att förkorta test som har väldigt hög reliabilitet, genom att räkna ut hur många items som räcker
för en acceptabel reliabilitet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Vad kallas skaltyperna som beskrivs i tabellen? (HT22, HT23)

A

kolla i dokument

Exempel 1: kön; Egenskaper: ingen egentlig skala; Matematiska operationer: frekvensräkning. Kvalitativa variabler.
Exempel 2: social klass; Egenskaper: styrka; Matematiska operationer: rangordning. Kvalitativa variabler.
Exempel 3: temperatur; Egenskaper: styrka, lika intervall; Matematiska operationer: addition, subtraktion. Kvantitativa variabler.
Exempel 4: vikt, längd; Egenskaper: styrka, lika intervall, absolut nollpunkt; Matematiska operationer: addition, subtraktion, division, multiplikation. Kvantitativa variabler.

Exempel 1 - Nominalskala
Exempel 2 - Ordinalskala
Exempel 3 - Intervallskala
Exempel 4 - Kvotskala

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Många olika typer av validitet har beskrivits i testsammanhang, men de senaste decennierna är den vanliga beskrivningen att de olika typerna av validitet inte är separata fenomen utan att de kan inordnas under ett mer övergripande begrepp. Vilket av följande begrepp är enligt Messick (1986), ett överordnat begrepp. (HT22, HT23)

A

Begreppsvaliditet

  • enda rätta utav:
    – Uppenbar validitet
    Innehållsvaliditet
    Diskriminant validitet
    Ekologisk validitet
    Empirisk validitet
    Kriterievaliditet
    Prediktiv validitet
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Vad av följande är korrekt utifrån den klassiska testteorin? (HT22, VT23, HT23)

A

Rätt:
- Reliabiliteten blir vanligtvis högre ju fler item som ingår i skalan.
- Om ett test inte är reliabelt, kan det heller inte ha hög validitet.
- Reliabilitet omfattar både stabilitet och intern konsistens.
- Validiteten beskriver ett tests förmåga att mäta på ett konsekvent sätt.
- För att beräkna den enskilda mätningens standardfel behöver man känna till testets reliabilitet och standardavvikelse.
- Validiteten beskriver ett tests förmåga att mäta det testet avser att mäta.
- Reliabiliteten beskriver ett tests förmåga att under samma testförhållanden ge samma resultat.

Fel (bla):
- Ett tests ekologiska validitet mäts vanligen med Kuder-Richardson (KR).
- Validitet kan beskrivas som frånvaron av slumpmässiga mätfel.
- Reliabilitet är en egenskap hos testet som fastställs under framtagande av testet och som är oberoende av i vilka sammanhang testet sedan används.
- Reliabiliteten beskriver ett tests förmåga att mäta på ett konsekvent sätt i en viss population.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Reliabilitetsbegreppet inkluderar både stabilitet och intern konsistens. Matcha metod för att skatta reliabilitet med vilken aspekt som den i huvudsak mäter. (HT22)

A

Chronbach’s alfa - Intern konsistens
Split halves - Intern konsistens
Kuder-Richardson - Intern konsistens
Parallella test - Stabilitet
Test-retest - Stabilitet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Bilden nedan visar Item Characteristic Curve för två hypotetiska dikotoma item i en depressionsskala (blå till vänster och röd till höger). Vad av följande är korrekt? (HT22, VT23)

A

kolla i tentan?

Sannolikheten för att någon med genomsnittlig depressionsnivå ska svara “ja” på blått item, är ca 45%.

Theta står för respondentens förmåga eller nivå på det som mäts.

Rött item har en svårighetsgrad på ca 0,75.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Vilken information behöver du ha tillgång till för att kunna beräkna den enskilda mätningens medelfel (SEM) (HT22)

A

Testets standardavvikelse och reliabilitet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Anta att en respondent har fått poängen 140 och den enskilda mätningens medelfel (SEM) för testet är 4. Inom vilka värden kan vi, utifrån den klassiska testteorin, anta att respondentens sanna värde ligger med ungefär 95% säkerhet? (HT22, VT23)

A

132-148

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Anta att en person har fått poängen 200 och den enskilda mätningens medelfel (SEM) för testet är 2. Inom vilka värden kan vi, utifrån den klassiska testteorin, anta att respondentens sanna värde ligger med ungefär 95% säkerhet?

A

196-204

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Inom Item-respons teorin skiljer man mellan modeller som beaktar olika många parametrar. Det finns modeller med en, två och tre parametrar. Vad skiljer i huvudsak en en-parameterlogistisk modell (1PLM) från en tvåparameterlogistisk modell (2PLM)? (VT23)

A

2PLM tar lutningen på item characteristic curve (ICC) med i beräkningen.

17
Q

Anta att du har gjort dig besväret med att översätta ett test till svenska. Du är naturligtvis nyfiken på att ta reda på hur ditt test fungerar i en svensk population och en av de saker som du vill veta är om de dimensioner som finns i den amerikanska förlagan, även återfinns i din svenska version. Du bestämmer dig för att testa data med hjälp av Strukturell ekvationsmodellering (SEM). Vad är det för en metod? (VT23, HT23)

A

Konfirmatorisk faktoranalys (CFA)

18
Q

GHQ-12 – Essäfråga (HT22, VT23, HT23)
Tolvfrågorsversionen av the General Health Questionnaire (GHQ-12) används sedan 1990 i Region Stockholms folkhälsoenkät Hälsa Stockholm för att kartlägga den psykiska ohälsan i befolkningen. En undersökning har gjorts för att ta reda på i vilken utsträckning GHQ-12 har tillräckligt god förmåga att identifiera och utesluta psykisk ohälsa i både i ett patientmaterial och i en normalpopulation i Stockholms län.

Cronbachs alfa var i normalpopulationen r = 0,89. AUC i samma population var 0,76 för diagnosen Egentlig depression. Om man vidare använde det gränsvärde som var bäst enligt Youdens J så fann man att Sensitiviteten var 0,67 och Specificiteten var 0,74.

Vad innebär dessa värden och vad säger de om testets förmåga i sammanhanget?

A

Chronbachs alfa (0,89)
Detta berättar om testets interna konsistens, hur väl de olika frågorna samvarierar. Värdet 0,89 är ett ganska högt värde och berättar att testet har en god reliabilitet avseende intern konsistens. Det innebär att alla frågor verkar höra ihop väl och vi kan kanske tänka oss att det i detta fall innebär att alla frågor bidrar till pusslet kring en persons psykiska ohälsa.

AUC (0,76 för egentlig depression)
Area Under Curve. Detta är ett mått på hur väl testet diskriminerar personer, dvs hur väl testet kan detektera de som det ska detektera (tex. testet visar på ohälsa när ohälsa faktiskt finns hos en person) samt inte detekterar de som det inte ska (tex. testet visar inte på ohälsa hos “perfekt friska” personer).

Detta värde ligger ganska högt och säger att testet förmodligen är helt okay på att plocka ut personer, men detta är sammanslaget sensitiviteten och specificiteten så det kan fortfarande vara så att den ena av dessa är mycket högre än den andra.

Sensitivitet
Detta är hur väl testet kan detektera de sant positiva, de som verkligen har en ohälsa.

Specificitet
Detta är hur väl testet inte detekterar de sant negativa, de som verkligen inte har ohälsa.

Youdens J
Detta är en sammanslagning av sensitivitet och specificitet som vi använder för att hitta optimala cutoff nivåer för test. Genom att välja ett gränsvärde på ett test som har högst J, så har vi optimerat för bästa sensitivitet/specificiteten. Utifrån detta kan vi sedan tweaka ifall vi önskar få högre utav den ena, men då på bekostnad av den andra.

19
Q

Testteori reliabilitet 30 – Essäfråga (VT23)
Inom testteorin används ibland den sk Spearman-Browns profetformel. Vad har man den till och vad gör den?

A

kolla efter svar?

20
Q

Psykometri CTT 10 – Essäfråga (VT23, HT23)
VT23 En grundsten i den klassiska testteorin kan uttryckas med formeln T = t + e. Ibland skrivs formeln istället t = T + e. Vad står formeln för och hur kan det komma sig att båda sätten att skriva har samma innebörd?

A

kolla efter svar?

21
Q

HT23 En grundsten i den klassiska testteorin kan uttryckas med formeln X = t + e. Vad står formeln för och beskriv kortfattat vad den innebär?

A

kolla efter svar?

22
Q

Item Respons Teori (IRT) – Essäfråga (HT23)
Item Respons Teori (IRT) är en testteori som handlar om vad som påverkar hur individer svarar på ett visst item i ett test. Vilka är de två delarna som analyseras inom IRT och som också återfinns på X- och Y-axeln i Item Characteristic Curve (ICC) för varje item?

A

kolla efter svar?

23
Q

Psykometri skalformat 10 – Essäfråga (VT23)
Vilken sorts skala är det här?
Hur ont har du i ryggslutet? Ingen smärta ← → Värsta tänkabara smärta

A

kolla efter svar?

24
Q

Psykometri sensitivitet och specificitet 10 – Essäfråga (VT23)
Beskriv hur man kan göra för att fastställa en optimal cut-off (ett gränsvärde) för ett nytt test som du skapat och som ska screena för depression.

A

kolla efter svar?

25
Q

Reliabilitet – Essäfråga (HT23)
Ett tests reliabilitet kan mätas på olika sätt, och ibland med olika resultat. Vad skulle en rimlig förklaring kunna vara om ett test får hög reliabilitet när man mäter med test-retest, men låg reliabilitet när man mäter med Chronbach’s alfa?

A

kolla efter svar?

26
Q

SEM – Essäfråga (HT23)
Vilken information behöver du ha tillgång till för att kunna beräkna den enskilda mätningens medelfel (SEM)?

A

kolla efter svar?

27
Q

Prediktiv validitet – Essäfråga (HT23)
Beskriv ett sätt att undersöka ett tests prediktiva validitet.

A

kolla efter svar?