6. Segmentation Flashcards
Nommer les objectifs d’un système de classification des risques?
Créer une bonne segmentation des risques pour :
- être compétitif sur le marché
- éviter l’anti-sélection
- améliorer la stabilité financière
Nommer 6 caractéristiques de classification désirables
- Causalité entre la caractéristique de risque et les sinistres espérés
- Objectivité
- Pratique (mesurable et facile à vérifier)
- Applicable selon la loi
- Éthique
- Selon les pratiques de l’industrie
Donner une définition de la sélection adverse et comment un assureur peut être victime de sélection adverse.
La sélection adverse se produit lorsque des actions sont entreprises par une partie ayant plus d’information dans le but de créer un avantage financier.
Les assureurs peuvent être victimes de sélection adverse si leur système de classification des risques n’est pas à point. Les “mauvais” risques achèteront de l’assurance et les “bons” risques iront ailleurs.
On vous demande de juger la pertinence d’une certaine classe de risque. Par exemple, les homme de 78 ans ayant eu 2 accidents dans la dernière année. Nommer 4 critères sur lesquels vous pourriez baser votre analyse de classe de risque.
- Crédibilité : pas un groupe très crédible
- Homogénéité : Probablement très homogène
- Stabilité : Peu stable d’année en année
- Réactivité : Trop …
Dans un GLM, on assume que la variable réponse suit une distribution. Quelles sont les distributions possible? Des exemples?
Une distribution qui fait partie de la famille exponentielle. Normale, Gamma, log-normale, binomiale, binomiale négative, Poisson, etc.
Quel est le lien entre la distribution de la variable réponse et la prédiction du modèle?
La prédiction du GLM sera l’espérance de la distribution pour une certaine observation. On peut ensuite s’attendre à ce que l’observation suive la distribution avec l’espérance donnée.
Qu’est-ce que le prédicteur linéaire?
g(u) = B_0 + B_1 * x_1 + B_2 * X_2 + …
Qu’est-ce que la fonction de lien?
C’est la fonction qui fait le lien entre le prédicteur linéaire et la moyenne (u) de la distribution : la prédiction.
Quel est l’intérêt principal de la fonction de lien?
Borner le domaine de la prédiction
Pourquoi la fonction de lien log est-elle aussi populaire?
Elle produit un modèle multiplicatif.
Comment retrouve-t-on la variance de la distribution que suit la variable réponse?
En multipliant le paramètre de dispersion avec la fonction de variance V(u)
Définir l’écart-type associé à un coefficient beta qui est produit avec le modèle.
Un coefficient est le résultat d’un processus aléatoire. Si ce processus était répété un grand nombre de fois, l’écart-type du coefficient serait de tant.
Définir une p-value et son utilité
Puisqu’un coefficient est obtenu d’un processus aléatoire, il est possible que sa véritable valeur soit de 0, mais qu’on ait obtenu une valeur différente simplement par chance. La p-value quantifie la probabilité que la valeur du coefficient soit 0 et que la valeur obtenue ne soit qu’un résultat aléatoire. Elle permet donc d’identifier les variables significatives dans un modèle.
Qu’est-ce qu’un interval de confiance ?
Interval de confiance : Plage de valeurs du coefficients pour lesquelles, l’hypothèse nulle avec un seuil de valeur p ne serait pas rejetée.
Pourquoi prendre le logarithme d’une variable explicative est-il parfois désirable lorsqu’on travaille avec la fonction de lien log?
En prenant le logarithme de la variable explicative, on se retrouve à avoir une relation linéaire en la variable réponse et la variable explicative.
Dans un GLM utilisant la fonction de lien logarithmique, vous avec la variable AOI, et vous utilisez le logarithme de cette variable dans le modèle. Si le coefficient de cette variable est 0.8, quel est l’effet de double le montant d’assurance? De le quadrupler?
Doubler : 2^0.8 = 1.74 fois plus grand
Quadrupler : 4^0.8 = 3.03 fois plus grand
Comment traiter une variable catégorielle? Comment interpréter un coefficient de 0.34 si la fonction de lien est logarithmique?
l’interprétation des résultats pour les variables catégorielles est toujours relatif au niveau de base (qui n’a pas de coefficient).
Un coefficient de 0.34, donne une prédiction de exp(0.34) = 1,405. Donc, une augmentation de 40,5% de la _____ (fréquence, sévérité) (1,405 - exp(0) (niveau de base)/100) relatif au niveau de base.
Quand on travaille avec une variable catégorielle, la sélection du niveau de base a-t-il un impact?
Oui!
Comment traiter les poids dans un GLM? Quel est l’impact d’inclure ceux-ci et quand veut-on les inclure?
Inclure les poids, impact la variance de la distribution choisie (Y_i).
Comment traiter un offset dans un GLM? Quel est l’impact d’inclure celui-ci et quand veut-on l’inclure?
Impacte la moyenne
Décrire les options de distribution pour un GLM pour modéliser une variable continue et dans quelles situations sont-elles les meilleures
Gamma, inverse Gaullienne. Modéliser le montant de réclamations
Décrire les options de distribution pour un GLM pour modéliser une variable de fréquence et des exemples de situation où elle sont appropriées
Les distributions de fréquence sont : Poisson, Binomiale négative. Modéliser le nombre de réclamations