Week 3 - logistic regressio Flashcards
Wat is een Classification Matrix?
Samenvatting van de correcte en incorrecte classificaties van een classifier model.
Wat is af te lezen uit een Classification Matrix?
Rijen ==> Voorspelde klassen
Kolommen ==> Echte klassen
Waarom gebruik je bij een Classification Matrix de validatiedata?
Om een goed beeld te krijgen van toekomstige classificatie accuratie en errors.
Welke accuratie indicatoren kan je gebruiken bij Confusion Matrixen?
Overall Error Rate
Wat is de Overall Error Rate?
Het percentage misclassificaties.
Wat zijn propensities?
De kans dat een record bij een klasse hoort.
Waarvoor worden propensities gebruikt?
Als een tussenstap voor:
1. Classificatie (voorspellen bij welke klasse de record hoort).
2. Rank-ordering van records o.b.v. de kans dat ze tot een klasse van interesse behoren.
Op welke 2 manieren kan je een record plaatsen in een klasse?
- O.b.v. een cutoff value.
- O.b.v. de hoogste propensity die een record heeft.
Wat houdt Triage in?
Triage heeft te maken met het verdelen van waarden in 3 categorieën:
1. Klasse A
2. Klasse B
3. Onduidelijk ==> expert beoordeling of meer predictor variabelen nodig
Wat gebeurt er wanneer de cutoff value hoger/lager is dan 0,5?
Er zullen meer misclassificaties optreden.
Dit hoeft niet per se erg te zijn. Soms wil je dat het model gevoeliger of strenger is.
Wat houdt de Sensitivity van een classifier in?
Het percentage van true positives goed voorspeld van het totale aantal positives.
- Juist voorspelde positives / totale aantal positives
Wat houdt de Specificity van een classifier in?
Het percentage van true negatives goed voorspeld van het totale aantal negatives.
- Juist voorspelde negatives / totale aantal negatives
Wat houdt de Precision van een classifier in?
Het percentage true positives goed voorspeld van het totale aantal voorspelde positives.
- Juist voorspelde positives / totale aantal voorspelde positives.
Wat is Logistic Regression?
Lineaire regressie, maar voor categorische variabelen
Y = 0 of 1.
Wat is p?
P van kans dat een record bij klasse 1 hoort.