Sensitivitet och specificitet Flashcards
Normering/standardisering
- Normering innebär att genom statistisk bearbetning överföra
råpoäng till en standardiserad skala. - Normerade poäng är detsamma som standardpoäng eller
standardiserade poäng.
Standardiserad skala
För att kunna jämföra råpoäng
mellan olika skalor används
standardiserade poäng.
* Påverkar inte fördelningen
* Finns olika standardiserade
poäng/skalor:
* 𝑧𝑧 = 𝑥𝑥− ̅𝑥𝑥 / 𝑠𝑠
* 𝑇𝑇 = (𝑧𝑧 ∗ 10) + 50
* IQ = (𝑧𝑧 ∗ 15) + 100
* Stanine = (𝑧𝑧 ∗ 2) + 5
– Avrunda till heltal, max 9
Normer
- Beskriver hur något i allmänhet är, tex normer för barns
språkutveckling, människors vikt/längd - Bygger på insamlad referensdata från en relevant population
(med information om medelvärde och standardavvikelse). - Individen kan jämföras med dessa normer:
– Beskriver hur hur långt från medelvärdet en individs testresultat
ligger (t.ex. med z-poäng) - Viktigt med normer från jämförbara grupper (kultur, ålder, kön)
Exempel standardiserat test
Med hjälp av normalfördelningen och ett standardiserat test kan man avgöra om ett barn
följer en normal språkutveckling
Ett barn får 93 poäng på ett språktest. Testet är normerat så vi känner till medelvärdet på
testet för jämnåriga barn (μ = 100 poäng och σ = 15 poäng). Barnet har då 7 poäng mindre
är genomsnittet. Vad betyder det?
Med hjälp av z-transformering kan man se hur barnet presterar i förhållande till sina
jämnåriga
Barnet ligger en halv standardavvikelse under sina jämnåringar
Enligt z-tabell blir ett z-värde på -0.467 ca 0.32 eller 32%
Mao. 32% av barnen presterar sämre
Gränsvärden / cut-offs
- Gränsvärden/cut-offs definierar brytpunkt mellan meningsfulla
tillstånd (sjuk/frisk, tillräcklig kunskap/otillräcklig kunskap) - Gränsvärden behövs för att exempelvis kunna tolka om en
individs testresultat är
– högt eller lågt,
– om det betyder att individen har symptom på klinisk nivå - Dessa gränsvärden kan tas fram antingen baserat på
– Hur distributionen ser ut i populationen (distrubution based/norm-
referenced)
– En bedömning av vad som anses vara en rimlig gräns (anchor
based/criterion-referenced
Konsekvenser av olika gränsvärden
- Gränsvärde vid A fångar få cases och
få (inga) non-cases
exemepel
* B fångar fler case och några non-
cases
* C fångar nästan alla case men också
många non-cases
* Eftersom grupperna överlappar
kommer vi att få med både cases och non-cases i princip oavsett var vi sätter gränsen
Tänker man sig normalfördelning även om de är non cases så finns det några som har lite mer eller lite mindre av den egenskapen eller svårare att sova och koncentrationssvårigheter osv än någon annan i den gruppen, det skiljer sig
Får väldigt många konskevenser vart man sätter sitt gränsvärde
I vissa fall så bestämmer man att man inte vill missa någon i cases och inte missa någon, då finns det anledning att fånga in fler av de som inte har det för att vara säker på att man fångar alla
Diskriminativt värde - Sensitivitet och specificitet
- Sensitivitet är förmågan hos ett test att identifiera ”sant positiva”,
det vill säga personer som genom mätinstrumentet identifierats som
personer med problem och som i ”verkligheten” också har problem. - Specificitet är förmågan hos ett test att identifiera ”sant negativa”, det
vill säga personer som genom mätinstrumentet identifierats som
personer utan problem och som i ”verkligheten” inte har problem.
Sensitivitet och specificitet varierar från 0 till 1 där
högre värden innebär bättre sensitivitet och
specificitet
Vad ska olika test diskriminera mellan?
- Screeningtest – ska skilja ut de som är i riskzon att utveckla
svårigheter från de som inte är det. - Diagnostiskt test – ska diskriminera mellan de som sannolikt
uppfyller kriterier för en klinisk diagnos från de som inte gör
det
Sensitivitet och specificitet forts bokstäverna
- A= Sant positiva
- B= Falskt Positiva
- C= Falskt negativa
- D= sant negativa
- Sensitiviteten (eller true positive
rate) = A/(A+C) - Specificiteten (true negative rate) =
D/(D+B
ROC-kurvan
- Den cut-off som minimerar antal fel
kategoriserade finner man närmast
vänstra övre hörnet - Bättre cut-off ju närmre vänstra övre
hörnet - Den skärningspunkten kallas Youden’s
index J (Sensitivitet + Specificitet) - 1 - Ju större yta under kurvan desto bättre
förmåga att diskriminera mellan case och
non-case (kallas Area Under Curve (AUC)
eller D’) - Diagonalen representerar yta på 0.5 (=slump)
- Lågt: .5-.7; Moderat: .7-.9; Högt > .9
Betydelse av prestanda hos olika tester
- Test som ger höga andelar falskt positiva – kan leda till att
friska utsätts för onödiga undersökningar och onödig oro. - Test som ger höga andelar falskt negativa – patienter som är
sjuka identifieras inte och får inte den vård de behöver. - Hur hög känslighet och träffsäkerhet behöver ett formulär
som ska identifiera depression ha, för att det ska fungera
som stöd? SBU rekommenderar:
– Intervjuformulär: minst 80% sensitivitet och specificitet
– Formulär för riktad screening: viktigast med hög sensitivite
Välja gränsvärde
- Youdens index J är ett sätt att statistiskt räkna fram det optimala gränsvärdet där flest kategoriseras rätt
- Det finns dock situationer när antingen sensitivitet eller specificitet prioriteras:
- ett exempel kan vara om konsekvenserna av att missa någon anses för stor, kan gränsvärde sänkas
- Information om sensitivitet och specificitet finns med i manualer för nyare diagnostiska test och skattningsskalor
Positivt prediktivt värde (PPV) och negativt prediktivt värde (NPV)
- För praktiskt bruk kan dessa mått snarare än sensitivitet och specificitet vara att föredra
- PPV anger sannolikheten för att de som kommer att få ett positivt testresultat verkligen kommer att ha tillståndet eller behovet
- NPV anger sannolikheten för att de som kommer att få ett negativt testresultat inte kommer att ha tillståndet eller behovet
- PPV och NPV relaterar till den förväntade prevalensen av ett tillstånd i olika verklsamheter
PPV och NVP respektive sensitivitet och specificitet
- PPV och NPV kan användas när man har data om prevalens i populationen
- Specificitet och sensitivitet kan beräknas med test- och kontrollgrupp
- Anger hur stor proportion av positiva och negativa resultat som är sant positiva respektive sant negativa
- PPV = A/A+B
- NPV = D/D+C
Önskvärda egenskaper hos mätinstrument för effektstudier
- Empiriskt stöd för instrumentets begreppsvaliditet och kriterievaliditet
- Empiriskt stöd för instrumentets reliabilitet
- Instrumentet är könsligt för förändring
- Mätinstrumentet är standardiserat och normerat