Masurarea performantei Flashcards

1
Q

Cum este definita performanta unui model?

A

Performanta unui model masoara capacitatea acestuia de a clasifica corect PD-ul pentru observatii noi

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Pentru ce folosim esantioanele de antrenare si testare?

A

Esantioanele de antrenare sunt folosite pentru a contrui modelul (pentru a obtine ecuatia de regresie)

Esantionul de test este folosit pentru a calcula performanta modelului

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

De obei, dimensiunile esantioanelor de antrenament / testare sunt:

A

Doua treimi din observatii in esantionul de antrenare

O treime din observatii in esantionul de testare

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Ce presupune metoda cross validation?

A

Esantionul este:
* Impartit in K segmente,
* Antrenat pe K-1 segmente
* Testat pe segmentul ramas

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Care sunt elementele unui confusion matrix?

A
  • True positive(TP): numarul de clienti buni clasificati corecti
  • False positive(FP): numarul de clienti buni clasificati gresiti (sunt de fapt rai)
  • True negative(TN): numarul de clienti rai clasificati corecti
  • False negative(FN): numarul de clienti rai clasificati gresiti (sunt buni)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

In functie de elementele din confusion matrix, care sunt masurile performantei?

A

Acuratetea clasificatii: (TP+TN) / (TP+TN+FP+FN)

Rata de eroare

Sensitivitatea (masoara cati clienti buni sunt clasificati corecti) TP / (TP+FN)

Specificitatea(masoara cati clienti rai sunt clasificati corect)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Ce reprezinta curba ROC?

A

Este o reprezentare grafica intre sensitivitate si 1-specificitate

Un model perfect are o sensitivitate de 1 si o specificitate de 1 (adica prezice perfect ambele cazuri)

Cu cat curba ROC este mai apropiata de coltul din stanga-sus, cu atat performanta modelului creste

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Cum interpretam AUC?

Area under curve

A

AUC este interpretata ca probabilitatea ca un client bun ales la alegere sa aibe un scor mai mare decat un client rau ales la alegere

In graficul curbei ROC, diagonala principala reprezinta clienti alesi la alegere

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Ce reprezinta curba CAP

A

Este o reprezentare grafica a proportiei cumulative de clasificari bad

Ne asteptat ca clientii rai sa aibe scoruri mici, deci curba CAP trebuie sa creasca abrupt la inceput, intr-un caz perfect

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Ce reprezinta distanta KS

A

Distanta KS calculeaza distanta dintre distributia cumulativa a scorurilor celor buni fata de cei rai

Poate fi masurata si pe curba ROC, fiind distanta dintre curba ROC si diagonala principala

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Ce este distanta mahalanobis?

A

Reprezinta diferenta dintre scorul mediu al clientilor buni si rai impartit la deviatia standard a populatiei

Un model bun are o distanta mare, adica distributiile scorurilor sunt bine separate

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Care sunt intervalele de clasificare pentru IV?

A
  • < 10% (rosu)
  • [10% - 30%] (galben)
  • > 30% (verde)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Care sunt intervalele de clasificare pentru coeficientul Gini (AR)

A

La nivel de variabila:

  • < 0% (rosu)
  • [0% - 10%] (galben)
  • > 10% (verde)

La nivel de model:

  • < 40% (rosu)
  • [40% - 50%] (galben)
  • > 50% (verde)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Care sunt intervalele de clasificare pentu corelarile dintre variabile?

A
  • > 70% (rosu)
  • [50% - 70%] (galben)
  • < 50% (verde)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly