Week 3 - logistic regressio Flashcards

1
Q

Wat is een Classification Matrix?

A

Samenvatting van de correcte en incorrecte classificaties van een classifier model.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wat is af te lezen uit een Classification Matrix?

A

Rijen ==> Voorspelde klassen
Kolommen ==> Echte klassen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Waarom gebruik je bij een Classification Matrix de validatiedata?

A

Om een goed beeld te krijgen van toekomstige classificatie accuratie en errors.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Welke accuratie indicatoren kan je gebruiken bij Confusion Matrixen?

A

Overall Error Rate

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wat is de Overall Error Rate?

A

Het percentage misclassificaties.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wat zijn propensities?

A

De kans dat een record bij een klasse hoort.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Waarvoor worden propensities gebruikt?

A

Als een tussenstap voor:
1. Classificatie (voorspellen bij welke klasse de record hoort).
2. Rank-ordering van records o.b.v. de kans dat ze tot een klasse van interesse behoren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Op welke 2 manieren kan je een record plaatsen in een klasse?

A
  1. O.b.v. een cutoff value.
  2. O.b.v. de hoogste propensity die een record heeft.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wat houdt Triage in?

A

Triage heeft te maken met het verdelen van waarden in 3 categorieën:
1. Klasse A
2. Klasse B
3. Onduidelijk ==> expert beoordeling of meer predictor variabelen nodig

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wat gebeurt er wanneer de cutoff value hoger/lager is dan 0,5?

A

Er zullen meer misclassificaties optreden.
Dit hoeft niet per se erg te zijn. Soms wil je dat het model gevoeliger of strenger is.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wat houdt de Sensitivity van een classifier in?

A

Het percentage van true positives goed voorspeld van het totale aantal positives.
- Juist voorspelde positives / totale aantal positives

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wat houdt de Specificity van een classifier in?

A

Het percentage van true negatives goed voorspeld van het totale aantal negatives.
- Juist voorspelde negatives / totale aantal negatives

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wat houdt de Precision van een classifier in?

A

Het percentage true positives goed voorspeld van het totale aantal voorspelde positives.
- Juist voorspelde positives / totale aantal voorspelde positives.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wat is Logistic Regression?

A

Lineaire regressie, maar voor categorische variabelen
Y = 0 of 1.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wat is p?

A

P van kans dat een record bij klasse 1 hoort.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hoe bereken je p voor logistic regression?

A

Ingewikkelde formule, niet belangrijk om het volledig te snappen.

16
Q

Waarom is het Logistic Regression en niet Classification?

A
  1. “Het lijkt op lineaire regressie” - Het Internet
  2. Logistic Regression geeft een numerieke waarde, maar wij gebruiken cut-off values om het op basis daarvan te classificeren.