5a - Rischio di credito: analisi discriminante Flashcards

1
Q

Cosa sono i modelli di scoring quantitativo?

A
  • Trasformano un array di dati quantitativi sul debitore in un punteggio, una variabile sintetica che distingue i buoni clienti dai cattivi (quelli che successivamente alla rilevazione sono falliti)
  • In alcuni casi, oltre al punteggio, possono calcolare una “probabilità di default” (probabilità che il cliente fallisca/non restituisca il prestito entro una certa data)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Che dati vanno immessi nel modello?

A

Il modello deve lavorare sui dati che un esperto avrebbe potuto consultare un anno prima dell’eventuale insolvenza

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Formula della funzione discriminante D(x)

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Cosa è l’analisi discriminante?

A

La “salute” di un debitore può essere descritta da
una moltitudine di variabili x.

Io voglio riassumere in una sola variabile sintetica D, detta funzione discriminante o score, le informazioni prima disperse su più variabili.

D(x) è una funzione lineare delle x, in pratica una “media ponderata”, con segni positivi o negativi

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Come scegliamo “a parole” i pesi della funzione discriminante?

A

Vogliamo scegliere i coefficienti (pesi) Gamma(i) in modo tale che D(x) divida il più possibile i clienti buoni dai cattivi (massimizza la distanza fra i centroidi), aggregandoli attorno ai rispettivi valori medi (“centroidi”)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Come scegliamo “formalmente” i pesi della funzione discriminante?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Calcolo del gradiente nella scelta dei pesi della funzione discriminante

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Utilizzo degli score per la classificazione

A

Fisso un punto a a metà strada tra i due centroidi e classifico un cliente come buono se il suo score è superiore ad alpha, come cattivo se il suo score è inferiore ad alpha

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Dato un cliente i, con variabili naturali xi, quando lo classifico come buono?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Cosa è il Lambda di Wilks?

A

D(x) rende minimo il quoziente (Lambda di Wilks) tra devianza residua e devianza totale.
E’ una misura di bontà della classificazione (in sample); da 1 (totale inefficacia) a 0 (forte efficacia).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Stima delle PD con l’analisi discriminante

A
  • Se accettiamo l’ipotesi che le variabili naturali x1, x2,…, xn siano distribuite secondo una normale multipla (ipotesi irrealistica, si pensi ai ratios troncati tra 0 e 1) allora si dimostra che, dato il vettore xi con le variabili naturali del i-esimo cliente, la probabilità che sia “buono” (stato 1) o cattivo (stato 2: default tra 12 mesi) sono:

(dove gamma e alpha sono le quantità che già conosciamo)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Cosa sono pigreco1 e pigreco2 in questa formula?

A

– si tratta delle “probabilità a priori” (indipendentemente dai suoi dati, xi) che un cliente sia buono o cattivo
– potremmo approssimarle con la percentuale di clienti buoni o cattivi presenti nella nostra popolazione di dati
– potremmo aggiustarle anno per anno, per tenere conto dell’evoluzione congiunturale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Come classifico se un un cliente e buono o cattivo in base alle probabilità di default?

A

E’ la regola di prima, ma il nuovo alpha’ ora è libero di scorrere come un cursore: se ad esempio pigreco1>pigreco2, il log è negativo e alpha’ < alpha, allargando l’area delle “buone”

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Cosa è il tasso di corretta classificazione? (hit rate)

A

è dato dalla somma delle probabilità delle buone di essere classificate come tali e delle cattive di essere classificate come tali

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Costi di errata classificazione

A

C(buona|cattiva) = classificato come buono e poi non mi paga. Costi molto elevati
C(cattiva|buona) = classificato come cattivo e poi mi paga. Costi contenuti

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Possiamo rendere il modello discriminante più conservativo per evitare di incorrere in costi di errori esagerati?

A

Sì, imponendogli di scegliere in base al minor costo di errore atteso, e non in base alla massima probabilità. Utilizziamo quindi l’allocazione in base ai costi di errata classificazione

15
Q

Formula per l’allocazione in base ai costi di errata classificazione

A