Prediksjon og maskinlæring Flashcards

1
Q

Prediksjon

A

Forsøke å si noe om fremtiden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Klinsik/ekspert prediksjon

A

Baserer seg på klinikers erfaringer og ekspertise. Ingen regler for hvordan man kombinerer informasjon. To eksperter kan komme fram til ulik prediksjon. Vekting av informasjon er av viktighet.
- Ikke ofte replikerbar

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Statistisk/mekanisk prediksjon

A

Benytter seg av statistiske formler og tabeller, som integrerer og vektlegger informasjonen på en bestemt måte. Kommer fram til samme prediksjon 100% replikerbar.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Hvilken prediksjon er best?

A
  • Metastudier: ca likt, eller statistisk prediksjon bedre (Grove & Meehl: 64 SP, 8 KP, 64 likt)
  • SP = 10% mer accurate
  • Studier med likt resultat = statistisk prediksjon > pga billigere
  • Nesten ingen foretrekker klinisk
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Hvorfor brukes ikke statistisk prediksjon til tross for at den er best?

A
  • Redsel for å miste jobbene sine til maskiner
  • Selv-konseptet til klinker
  • Tilknytningsteori
  • Misforståelsen om at statistisk prediksjon er dehumaniserende ovenfor pasient
  • Liker ikke at maskiner kan konkurrere med mennesker
  • Ikke adekvat informasjon
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hvorfor er statistisk prediksjon bedre enn klinisk?

A
  • Menneskehjernen kan ikke erstatte statistiske formler.
  • Goldberg paradokset
    We use precise instruments when needed ex. For eyes or ears
  • Klinikere har ikke den tilstrekkelige teorien og tilgjengeligheten på instrumenter som kan måle sannsynlighet/prediksjon
  • SP vektlegger faktorene på en konsekvent og objektiv måte.
  • SP blir ikke påvirket av sosialt press (ops! implsitt bias hos skaperen = følgefeil)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Goldberg paradokset

A

Formeler og regresjonsvekter som blir skapt av klinikeren, predikerer bedre enn klinikeren som lagde dem, fordi klinikeren ikke vektlegger faktorene på en konsekvent måte.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Sensitivitet

A

Sannsynligheten for at en syk person får positivt testresultat

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Spesifisitet

A

Sannsynligheten for at en frisk person får riktig svar (negativ test)
- Bør brukes ved generell befolkning

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Positiv prediktiv verdi

A

Sannsynligheten for at en person som fikk positivt resultat faktisk er syk.
Høy PPV = få falske positive
Lav PPV = mange falske positive

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Negativ prediktiv verdi

A

Sannsynligheten for at en person som fikk negativt resultat faktisk er friskt.
Høy NPV = de som får neg, er mest sannsynlig friske
Lav NPV = mange falske negative (risiko for at de er syke)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Prevalens

A

Hvor mange individer i en bestemt gruppe som har en gitt tilstand eller sykdom, gjerne på et gitt tidspunkt.
- Stor påvirkning på prediktive verdier

Lav prevalens = Lav PPV (øker mengden falske positive), men høy NPV (de som fikk neg er mest sannsynlig ikke syke)

Høy prevalens = Lav NPV (øker mengden falske negative), men høy PPV (de som får pos, har mest sannsynlig sykdommen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Maskinlæringstilnærming i personlighet

A

Forsøker å identifisere empiriske assosiasjoner mellom digital data og personlighetstrekk innen et utvalg.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Maskinlæring

A

Studie og konstrueringen av algoritmer, som kan lære fra datasett, og predikere deretter, uten å være programmert for å utføre spesifikke oppgaver.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Big data

A

Bruker maskinlæring til å identifisere mønstre, signaler, og adresserer spm som er vanskelige å besvare med mindre datasett.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

User-footprint matrix

A

Assosierer hvert individ til et antall digitale footprints.

17
Q

K-fold variation

A

Flere runder (k) av kryss-validering ved bruk av subdeler av et datasett. k=10 like store subdeler.

18
Q

Prediksjonsmodeller i maskinlæring

A

Predikerer individuelle forskjeller ibrukers perosnlighetstrekk, basert på digitale “records” i User-footprint matrisen.

19
Q

Prediction accuracy

A

Korrelasjonen mellom skåren på en personlighetstest og de predikerte verdiene på tvers av brukere.

20
Q

Machine Learning research on Personality Assessment (MLPA)

A

Bruk av maskinlæring til å predikere selvrapporterte og peer-rapporterte personlighetstrekk, basert på digitalefotavtrykk.
MLPA:
1. Datainnsamling
2. Data extraction (utdrag)
3. Prediksjon av personlighetstest

21
Q

Substantive validity

A

Til hvilken grad testleddene samsvarer med de teoretiske aspektene, konstruktet er ment å måle.
- Innholdsvaliditet (content validity)

22
Q

Strucutral validity

A

Omhandler de interne karakteristikkene ved en test.
- Reliability
- Generalizability
- Factorial validity

23
Q

External validity

A

Omhandler de eksterne karakteristikkene ved en test
- Convergent validity
- Discriminant validity
- Criterion validity
- Incremental validity

24
Q

The construct validation approach

A
  • Testutvikling og teoriutvikling er intergrert, å utvikle tester, forbedrer teori.
    “Bevis” på construct validity:
    1. Substansive validity
    2. Structural validity
    3. External validity
25
Q

Discriminant validity

A

I hvilken grad en test ikke er relatert til andre tester som måler andre konstrukter.