Prediksjon og maskinlæring Flashcards
Prediksjon
Forsøke å si noe om fremtiden.
Klinsik/ekspert prediksjon
Baserer seg på klinikers erfaringer og ekspertise. Ingen regler for hvordan man kombinerer informasjon. To eksperter kan komme fram til ulik prediksjon. Vekting av informasjon er av viktighet.
- Ikke ofte replikerbar
Statistisk/mekanisk prediksjon
Benytter seg av statistiske formler og tabeller, som integrerer og vektlegger informasjonen på en bestemt måte. Kommer fram til samme prediksjon 100% replikerbar.
Hvilken prediksjon er best?
- Metastudier: ca likt, eller statistisk prediksjon bedre (Grove & Meehl: 64 SP, 8 KP, 64 likt)
- SP = 10% mer accurate
- Studier med likt resultat = statistisk prediksjon > pga billigere
- Nesten ingen foretrekker klinisk
Hvorfor brukes ikke statistisk prediksjon til tross for at den er best?
- Redsel for å miste jobbene sine til maskiner
- Selv-konseptet til klinker
- Tilknytningsteori
- Misforståelsen om at statistisk prediksjon er dehumaniserende ovenfor pasient
- Liker ikke at maskiner kan konkurrere med mennesker
- Ikke adekvat informasjon
Hvorfor er statistisk prediksjon bedre enn klinisk?
- Menneskehjernen kan ikke erstatte statistiske formler.
- Goldberg paradokset
We use precise instruments when needed ex. For eyes or ears - Klinikere har ikke den tilstrekkelige teorien og tilgjengeligheten på instrumenter som kan måle sannsynlighet/prediksjon
- SP vektlegger faktorene på en konsekvent og objektiv måte.
- SP blir ikke påvirket av sosialt press (ops! implsitt bias hos skaperen = følgefeil)
Goldberg paradokset
Formeler og regresjonsvekter som blir skapt av klinikeren, predikerer bedre enn klinikeren som lagde dem, fordi klinikeren ikke vektlegger faktorene på en konsekvent måte.
Sensitivitet
Sannsynligheten for at en syk person får positivt testresultat
Spesifisitet
Sannsynligheten for at en frisk person får riktig svar (negativ test)
- Bør brukes ved generell befolkning
Positiv prediktiv verdi
Sannsynligheten for at en person som fikk positivt resultat faktisk er syk.
Høy PPV = få falske positive
Lav PPV = mange falske positive
Negativ prediktiv verdi
Sannsynligheten for at en person som fikk negativt resultat faktisk er friskt.
Høy NPV = de som får neg, er mest sannsynlig friske
Lav NPV = mange falske negative (risiko for at de er syke)
Prevalens
Hvor mange individer i en bestemt gruppe som har en gitt tilstand eller sykdom, gjerne på et gitt tidspunkt.
- Stor påvirkning på prediktive verdier
Lav prevalens = Lav PPV (øker mengden falske positive), men høy NPV (de som fikk neg er mest sannsynlig ikke syke)
Høy prevalens = Lav NPV (øker mengden falske negative), men høy PPV (de som får pos, har mest sannsynlig sykdommen)
Maskinlæringstilnærming i personlighet
Forsøker å identifisere empiriske assosiasjoner mellom digital data og personlighetstrekk innen et utvalg.
Maskinlæring
Studie og konstrueringen av algoritmer, som kan lære fra datasett, og predikere deretter, uten å være programmert for å utføre spesifikke oppgaver.
Big data
Bruker maskinlæring til å identifisere mønstre, signaler, og adresserer spm som er vanskelige å besvare med mindre datasett.