5a - Rischio di credito: analisi discriminante Flashcards
Cosa sono i modelli di scoring quantitativo?
- Trasformano un array di dati quantitativi sul debitore in un punteggio, una variabile sintetica che distingue i buoni clienti dai cattivi (quelli che successivamente alla rilevazione sono falliti)
- In alcuni casi, oltre al punteggio, possono calcolare una “probabilità di default” (probabilità che il cliente fallisca/non restituisca il prestito entro una certa data)
Che dati vanno immessi nel modello?
Il modello deve lavorare sui dati che un esperto avrebbe potuto consultare un anno prima dell’eventuale insolvenza
Formula della funzione discriminante D(x)
Cosa è l’analisi discriminante?
La “salute” di un debitore può essere descritta da
una moltitudine di variabili x.
Io voglio riassumere in una sola variabile sintetica D, detta funzione discriminante o score, le informazioni prima disperse su più variabili.
D(x) è una funzione lineare delle x, in pratica una “media ponderata”, con segni positivi o negativi
Come scegliamo “a parole” i pesi della funzione discriminante?
Vogliamo scegliere i coefficienti (pesi) Gamma(i) in modo tale che D(x) divida il più possibile i clienti buoni dai cattivi (massimizza la distanza fra i centroidi), aggregandoli attorno ai rispettivi valori medi (“centroidi”)
Come scegliamo “formalmente” i pesi della funzione discriminante?
Calcolo del gradiente nella scelta dei pesi della funzione discriminante
Utilizzo degli score per la classificazione
Fisso un punto a a metà strada tra i due centroidi e classifico un cliente come buono se il suo score è superiore ad alpha, come cattivo se il suo score è inferiore ad alpha
Dato un cliente i, con variabili naturali xi, quando lo classifico come buono?
Cosa è il Lambda di Wilks?
D(x) rende minimo il quoziente (Lambda di Wilks) tra devianza residua e devianza totale.
E’ una misura di bontà della classificazione (in sample); da 1 (totale inefficacia) a 0 (forte efficacia).
Stima delle PD con l’analisi discriminante
- Se accettiamo l’ipotesi che le variabili naturali x1, x2,…, xn siano distribuite secondo una normale multipla (ipotesi irrealistica, si pensi ai ratios troncati tra 0 e 1) allora si dimostra che, dato il vettore xi con le variabili naturali del i-esimo cliente, la probabilità che sia “buono” (stato 1) o cattivo (stato 2: default tra 12 mesi) sono:
(dove gamma e alpha sono le quantità che già conosciamo)
Cosa sono pigreco1 e pigreco2 in questa formula?
– si tratta delle “probabilità a priori” (indipendentemente dai suoi dati, xi) che un cliente sia buono o cattivo
– potremmo approssimarle con la percentuale di clienti buoni o cattivi presenti nella nostra popolazione di dati
– potremmo aggiustarle anno per anno, per tenere conto dell’evoluzione congiunturale
Come classifico se un un cliente e buono o cattivo in base alle probabilità di default?
E’ la regola di prima, ma il nuovo alpha’ ora è libero di scorrere come un cursore: se ad esempio pigreco1>pigreco2, il log è negativo e alpha’ < alpha, allargando l’area delle “buone”
Cosa è il tasso di corretta classificazione? (hit rate)
è dato dalla somma delle probabilità delle buone di essere classificate come tali e delle cattive di essere classificate come tali
Costi di errata classificazione
C(buona|cattiva) = classificato come buono e poi non mi paga. Costi molto elevati
C(cattiva|buona) = classificato come cattivo e poi mi paga. Costi contenuti