Tentafrågor Flashcards
- Om man väljer en grupp individer med de högsta eller de lägsta värdena i en population så kommer de som grupp att ha ett mindre extremt värde nästa gång man mäter dem. Vad kallas detta fenomen?
Regression mot medelvärdet
Du har skapat ett nytt test för att mäta reflekterande förmåga. För att ta reda på om ditt test fungerar har du tagit hjälp av en erfaren psykolog för att göra en klinisk bedömning av dina testpersoners reflekterande förmåga. Du använder psykologens bedömning som facit för om en person har god reflekterande förmåga eller ej.
Beskriv hur du gör för att med denna information räkna ut specificiteten och
sensitiviteten på ditt test.
För att undersöka sensitivitet fokuserar jag på andelen som mitt nya testet kategoriserar som
de som har god reflekterade förmåga, av alla som psykologen bedömt ha god reflekterande
förmåga. Enligt en uppställning innebär detta sant positiva delat med sant positiva plus falskt
negativa.
För att undersöka specificitet fokuserar jag på andelen som mitt nya testet kategoriserar som
de som inte har god reflekterade förmåga, av alla som psykologen bedömt inte ha god
reflekterande förmåga. Enligt en uppställning innebär detta sant negativa delat med sant
negativa plus falskt positiva.
Vad är en ROC-kurva i testsammanhang och hur beräknas den?
En ROC-kurva visar sambandet mellan sensitivitet och 1-specificitet. Punkterna längs kurvan
visar sensitivitet och 1-specificitet vid varje möjligt gränsvärde. Det gränsvärde som
minimerar antalet som är fel kategoriserade av testet är det gränsvärde som man finner på
kurvan närmast det övre vänstra hörnet. Ytan under kurvan benämns AUC (Area Under the
Curve) och ju större yta under kurvan desto bättre förmåga har testet att diskriminera mellan
case och non-case.
Du sitter med ett testresultat från en person som fått 54 poäng på skalan Öppenhet i ett personlighetstest. Svaren är konverterade till T-skalan och den enskilda mätningens standardfel är 4 och reliabiliteten för skalan i detta test är .84. Mellan vilka värden kan vi med ca 95% säkerhet, utifrån den klassiska testteorin, anta att det sanna värdet ligger? (OBS vi kommer ej räkna på tentan)
För att ta fram ett konfidensintervall runt individens mätresultat som visar ett 95%
konfidensintervall gångrar vi SEM med 1.96, detta ger 7.84. Individens testresultat ligger
därmed med 95% säkerhet mellan 54 +/- 7.84.
Du berättar för en vän att du pluggar till en tenta i testmetodik, som bland annat handlar om hur olika test innehåller mätfel och att det spelar roll vilka frågor som är med i formuläret och hur de är formulerade. Din vän som regelbundet får frågeformulär från SCB blir mycket intresserad och vill veta mer om vad som orsakar mätfel och hur man kan undvika dem. Vad svarar du?
Exempel på saker att ta upp:
Mätfel kan bero på testets egenskaper, yttre omständigheter vid testsituationen men också
bero på faktorer relaterat till den som tar testet, exempelvis stress inför testet, förkunskaper
om testet, benägenhet att hålla med, hur man mår fysiskt och psykiskt. Relationen till den
som testar kan också spela roll för hur testtagaren svarar. Att besvara frågor kräver att
testtagaren ska förstå frågan, minnas det som frågan gäller, kunna göra en bedömning och
överföra det till svarsalternativen. Det är viktigt att tänka på att inte göra för långa
frågeformulär, att frågorna är tydliga, inte ställa flera frågor i samma fråga eller använda
krångligt språk. Det är viktigt att testet har visat på goda psykometriska egenskaper i tidigare
undersökningar, och har visat på hög reliabilitet särskilt test-retest som tyder på stabilitet i
mätningen.
Under din VFU arbetar du på en rekryteringsfirma som använder olika typer av test i rekryteringsprocessen. Ett av testen ska mäta kreativitet utifrån två dimensioner; divergent tänkande och motivation. Du ställer dig frågande till validiteten i testet och bestämmer dig för att undersöka den i ditt kommande examensarbete på psykologprogrammet. Beskriv hur du gör för att utvärdera testets validitet
För att undersöka samtidig validitet skulle man kunna undersöka samband mellan det aktuella
testet och ett annat test som mäter samma dimensioner eller snarlika dimensioner vid samma
tillfälle som det aktuella testet ges. För att undersöka prediktiv validitet skulle man kunna
undersöka sambandet mellan det aktuella testet och ett uppsatt kriterium vid ett senare
tillfälle, exempelvis kopplat till något relevant kriterium som skulle kunna belysa kreativitet i
det yrke som rekryteringen gäller. Med hjälp korrelation med annat relevant mått som är
välanvänt för att undersöka de dimensioner som det aktuella testet undersöker kan
begreppsvaliditet undersökas. Man kan också med hjälp av konfirmatorisk faktoranalys
undersöka begreppsvaliditet genom att skapa en hypotes om vilka faktorer som testet
innehåller baserat på teori och se om det strukturen i testet stämmer med hypotesen.
Varför används Spearman Brown’s “profetformel” när man beräknar reliabilitet med Splithalves metoden?
Reliabilitet i testmätningar är beroende av antalet uppgifter som ingår i testet. Fler items ger högre
reliabilitet, samtidigt som givetvis kvaliteten hos items också har en avgörande betydelse. Med hjälp
av Spearman Brown’s formel kan man beräkna hur mycket reliabiliteten förbättras om man
exempelvis dubblar antalet testuppgifter. Man kan även bestämma sig för vilken reliabilitet man
önskar och räkna ut hur många nya items som skulle behöva läggas till. Formeln kan också användas
för att förkorta test som har väldigt hög reliabilitet, genom att räkna ut hur många items som räcker
för en acceptabel reliabilitet.
Vad kallas skaltyperna som beskrivs i tabellen? (HT22, HT23)
kolla i dokument
Exempel 1: kön; Egenskaper: ingen egentlig skala; Matematiska operationer: frekvensräkning. Kvalitativa variabler.
Exempel 2: social klass; Egenskaper: styrka; Matematiska operationer: rangordning. Kvalitativa variabler.
Exempel 3: temperatur; Egenskaper: styrka, lika intervall; Matematiska operationer: addition, subtraktion. Kvantitativa variabler.
Exempel 4: vikt, längd; Egenskaper: styrka, lika intervall, absolut nollpunkt; Matematiska operationer: addition, subtraktion, division, multiplikation. Kvantitativa variabler.
Exempel 1 - Nominalskala
Exempel 2 - Ordinalskala
Exempel 3 - Intervallskala
Exempel 4 - Kvotskala
Många olika typer av validitet har beskrivits i testsammanhang, men de senaste decennierna är den vanliga beskrivningen att de olika typerna av validitet inte är separata fenomen utan att de kan inordnas under ett mer övergripande begrepp. Vilket av följande begrepp är enligt Messick (1986), ett överordnat begrepp. (HT22, HT23)
Begreppsvaliditet
- enda rätta utav:
– Uppenbar validitet
Innehållsvaliditet
Diskriminant validitet
Ekologisk validitet
Empirisk validitet
Kriterievaliditet
Prediktiv validitet
Vad av följande är korrekt utifrån den klassiska testteorin? (HT22, VT23, HT23)
Rätt:
- Reliabiliteten blir vanligtvis högre ju fler item som ingår i skalan.
- Om ett test inte är reliabelt, kan det heller inte ha hög validitet.
- Reliabilitet omfattar både stabilitet och intern konsistens.
- Validiteten beskriver ett tests förmåga att mäta på ett konsekvent sätt.
- För att beräkna den enskilda mätningens standardfel behöver man känna till testets reliabilitet och standardavvikelse.
- Validiteten beskriver ett tests förmåga att mäta det testet avser att mäta.
- Reliabiliteten beskriver ett tests förmåga att under samma testförhållanden ge samma resultat.
Fel (bla):
- Ett tests ekologiska validitet mäts vanligen med Kuder-Richardson (KR).
- Validitet kan beskrivas som frånvaron av slumpmässiga mätfel.
- Reliabilitet är en egenskap hos testet som fastställs under framtagande av testet och som är oberoende av i vilka sammanhang testet sedan används.
- Reliabiliteten beskriver ett tests förmåga att mäta på ett konsekvent sätt i en viss population.
Reliabilitetsbegreppet inkluderar både stabilitet och intern konsistens. Matcha metod för att skatta reliabilitet med vilken aspekt som den i huvudsak mäter. (HT22)
Chronbach’s alfa - Intern konsistens
Split halves - Intern konsistens
Kuder-Richardson - Intern konsistens
Parallella test - Stabilitet
Test-retest - Stabilitet
Bilden nedan visar Item Characteristic Curve för två hypotetiska dikotoma item i en depressionsskala (blå till vänster och röd till höger). Vad av följande är korrekt? (HT22, VT23)
kolla i tentan?
Sannolikheten för att någon med genomsnittlig depressionsnivå ska svara “ja” på blått item, är ca 45%.
Theta står för respondentens förmåga eller nivå på det som mäts.
Rött item har en svårighetsgrad på ca 0,75.
Vilken information behöver du ha tillgång till för att kunna beräkna den enskilda mätningens medelfel (SEM) (HT22)
Testets standardavvikelse och reliabilitet.
Anta att en respondent har fått poängen 140 och den enskilda mätningens medelfel (SEM) för testet är 4. Inom vilka värden kan vi, utifrån den klassiska testteorin, anta att respondentens sanna värde ligger med ungefär 95% säkerhet? (HT22, VT23)
132-148
Anta att en person har fått poängen 200 och den enskilda mätningens medelfel (SEM) för testet är 2. Inom vilka värden kan vi, utifrån den klassiska testteorin, anta att respondentens sanna värde ligger med ungefär 95% säkerhet?
196-204