Instructiune Dezvoltare-Monitorizare Flashcards

1
Q

Ce reprezinta un model de rating?

A

Este un instrument de management al riscului prin care bancile determina bonitatea clientilor, prin atribuirea unui scor echivalent cu probabilitatea de default a acestora

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Care sunt principalele tipuri de modele?

A
  • Modele pentru originare: estimeaza PD-uri in momentul solicitarii unui credit nou
  • Modele de monitorizare (pentru calcule ECL): cu care se reevalueaza riscul de credit tinand cont de comportamentul recent al clientilor
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Care sunt pasii dezvoltarii unui model de rating?

A
  1. Crearea bazei de date
  2. Verificarea datelor de input si analiza univariata
  3. Analiza univariata - gruparea variabilelor
  4. Analiza stabilitatii variabilelor
  5. Analiza corelatiei
  6. Analiza multivariata si VIF
  7. Calibrarea scorecard-ului
  8. Contributia variabilelor la modelul final
  9. Evaluarea initala a modelului
  10. Reject inference
  11. Analiza de cut-off
  12. Alocarea clientilor in clase de risc (rating-uri)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Ce presupune pasul in care cream baza de date?

A

In acest pas:

  • Selectam date in asa fel incat sa avem un esantion reprezentativ
  • Calculam variabile noi
  • Facem excluderi initiale
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Ce presupune pasul in care facem verificarea datelor si analiza univariata?

A

In acest pas:

  • Determinam statistici descriptive
  • Verificam valori extreme si valori lipsa
  • Definim target-ul
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Ce presupune pasul in care facem gruparea variabilelor?

Aka binning

A

In acest pas:

  • Analizam variabilele individual dupa WoE, IV si Gini
  • Grupam variabilele continue in 20 de galeti
  • Rulam analiza WoE / IV / Gini pe variabile

Bin-urile trebuie sa aibe peste 5% din observatii, cu exceptii

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Care sunt intervalele de clasificare dupa Gini?

A

La nivel de variabila:
* < 0 % (rosu)
* 0-10 % (galben)
* > 10 % (verde)

La nivel de model:
< 40% (rosu)
40-50% (galben)
> 50% (verde)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Care este obiectivul analizei de stabilitate a variabilelor?

A

Obiectivul este de a verifica daca populatia pe care construim modelul are acelasi profil cu populatia pe care vom aplica modelul

Variabilele sunt analizate pe baza PSI

Analiza se face atat pe perioada pentru dezvoltare cat si o perioada recenta

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Ce implica pasul in care analizam stabilitatea variabilelor?

A
  • Definim o populatie de referinta (esantionul de dezvoltare)
  • Calculam indicele PSI pentru fiecare variabila
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Care sunt elementele ce intra in calculul PSI?

A
  • Actual %: reprezinta procentul de observatii dintr-o categorie a unei variabile dintr-o singura perioada
  • Expected %: reprezinta procentul de observatii din esantionul de referinta pentru o variabila (adica distributia pe tot esantionul)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Care sunt intervalele de clasificare dupa PSI?

A
  • < 10% : Modificari de stabilitate nesemnificative
  • 10 - 25% : Modificari de stabilitate minore
  • > 25% : Modificari de stabilitate majore
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Ce presupune pasul in care analizam corelatia dintre variabile?

A

In acest pas:
* Verificam matricea de corelatie (pe baza coeficientilor WoE din grupele formate)
* Eliminam cate o variabila dintr-o pereche cu corelatie mare

Pe baza coeficientilor Pearson, Spearman si Kendall

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Ce analize fac parte din procesul de selectie a variabilelor?

A
  • Analiza univariata
  • Analiza stabilitatii
  • Analiza corelatiei
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Ce presupune analiza multivariata si VIF?

A

In acest pas:

  • Estimam modelele potentiale
  • Alegem modelul cel mai bun in functie de performanta sa
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Care sunt modurile principale de alegere a unui model?

De construire a modelului

A
  • Forward selection (specific to general)
  • Backwards elimination (general to specific)
  • Stepwise (combinatie a celor doua)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Pe baza a caror criterii alegem modelul cel mai bun?

A
  • Semnificativitatea coeficientilor (sub 10% sau 5% in functie de pragul ales)
  • Logica semnului coeficientilor
  • Performanta (Gini, AUC, ROC, KS)
17
Q

Ce reprezinta acuratetea modelului?

A

Este procentul observatiilor clasificate corect din totalul acestora

(TP+TN) / (TP + TN + FP + FN)

18
Q

Ce reprezinta precizia modelului?

A

Este procentul observatiilor pozitive clasificate corect din totalul previziunilor pozitive

TP / (TP + FP)

19
Q

Ce reprezinta sensitivitatea modelului?

A

Reprezinta procentul pozitiv clasificat corect din totalul de cazuri pozitive observate

TP / (TP + FN)

20
Q

Ce masoara statistica KS

A

Distanta KS masoara distanta maxima dintre distributia clientilor buni si a celor rai

O valoare de peste 0.4 a indicatorilor GINI sau KS indica o buna putere de diferentiere

21
Q

Care sunt intervalele de clasificare dupa VIF?

A
  • VIF < 2 : multicoliniaritate inexistenta
  • 2 <= VIF <= 5 : exista un anumit grad de multicoliniaritate in date
  • VIF > 5 : exista multicoliniaritate puternica in setul de date
22
Q

Ce reprezinta VIF?

A

Este un coeficient care masoara gradul de multicoliniaritate intr-o regresie

Practic estimeaza ce proportie din varianta regresiei este cauzata de multicoliniaritate

23
Q

Ce presupune pasul analizei multivariate + VIF

A

Propunem modele candidat si alegem modelul cel mai bun

Prin forward / backward / stepwise

24
Q

Pe baza a ce criterii stabilim care model propus este cel mai bun?

A
  • Semnificativitatea coeficientilor (p < 5% sau 10%)
  • Logica semnelor coeficientilor
  • Performanta Gini, AUC, KS etc
25
Q

Ce presupune pasul calibrarii scorecard-ului?

A
  • Calculam scorul pentru fiecare bin al fiecarei variabile pe baza valorilor WoE
  • Verificam monotonia scor-urilor
26
Q

Ce presupune pasul analizarii contributiei variabilelor la scorul final?

A
  • Verificam sa avem un model echilibrat (contributii < 25% per variabila)

Lungimea intervalului de scor total: scor max - scor min (toata baza)

Contributie = (scor max - scor min) / lungimea intervalului de scor total

27
Q

Ce presupune pasul evaluarii initiale a modelului ?

A
  • Realizam teste de stres
  • Verificam coeficientul Gini
28
Q

In cate moduri putem realiza teste de stres?

A
  • Fie eliminam din regresie o variabila WoE si comparam Gini-urile
  • Fie eliminam un scor din calculul scorului final si rulam o regresie dintre target si scor + comparatii
29
Q

Ce presupune pasul alocarii clientilor in clase de rating?

A

Determinam 8-9 clase de rating in functie de scor-urile obtinute pentru fiecare client.
* Trebuie sa avem **monotonie in DR **de la o clasa la alta
* Distributia clientilor in clasele de rating trebuie sa fie normala