Chapitre 10 - Classification multivariée Flashcards
Quels sont les méthodes de classification univariées ?
- Méthodes de la prime pure
- Méthode du taux de sinistres
Les méthodes de classification univariées ne tiennent pas compte de quelque chose. Qu’est-ce que c’est ?
L’effet des autres variables de tarification.
Qu’est-ce que la méthode de la prime pure univariée ne considère pas ?
la corrélation entre les variables dans les unités d’exposition.
La méthode du taux de sinistre est “meilleur” que la méthode de la prime pure. Expliquez comment et expliquez également qu’est-ce qu’il manque à cette méthode.
La méthode du taux de sinistre tient compte partiellement de la distribution du portefeuille puisque la prime varie selon les différentes variables de tarification, mais la prime chargée n’est qu’un estimé et dévie bien souvent de la vraie espérance de perte.
La méthode de la prime pure ajustée est-elle une meilleure méthode ?
La méthode de la prime pure ajustée, elle aussi, ne tient compte que partiellement de la distribution du portefeuille en multipliant les unités d’exposition par les différentiels actuels.
Quelles cirsconstances ont conduit à l’adoption des méthodes de classification multivariées ?
- Avancées en informatique
- Bases de données plus segmentées disponibles
- Compétition
Quel est le premier bénéfice des méthodes de classification multivariées ?
Les méthodes de classification multivariées considèrent toutes les variables simultanément et ajustent automatiquement pour la corrélation entre les variables de tarification.
**Le biais lié à la corrélation entre les variables est le principal défaut des méthodes d’analyses univariées.
Quel est le deuxième bénéfice des méthodes de classification multivariées ?
Les méthodes de classification multivariées tentent d’éliminer les effets non-systématiques (le bruit) et de capturer seulement les effets systématiques (le signal).
**Les méthodes d’analyses univariées incluent à la fois les effets non-systématiques (le bruit) et les effets systématiques (le signal).
bruit : l’effet aléatoire
Quel est le troisième bénéfice des méthodes de classification mutlivariées ?
Les méthodes de classification multivariées produisent des diagnostics des modèles.
**Les diagnostics des modèles permettent d’avoir de l’information additionnelle à propos de la justesse du modèle.
Quel est le quatrième bénéfice des méthodes de classification multivariées ?
Les méthodes de classifications multivariées permettent d’inclure une considération pour les interactions ou interdépendances entre deux variables ou plus.
Qu’est-ce que la corrélation ?
Une corrélation entre deux variables signifie que la distribution des unités d’exposition d’une variable n’est pas la même selon les différents niveaux d’une autre variable de tarification.
Qu’est-ce que l’interaction ?
Une interaction existe lorsque l’effet d’une variable varie selon le niveau d’une autre variable.
Par exemple, l’effet de l’âge de l’assuré en assurance automobile peut varier selon le sexe de l’assuré.
Nommez un avantage et un inconvénient d’une interaction.
Avantage
* L’ajout d’interactions dans un modèle de tarification est un raffinement du modèle qui peut en augmenter significativement le pouvoir prédictif.
Inconvénient
* Les interactions augmentent aussi la complexité d’un modèle et d’un algorithme de tarification, donc il faut s’assurer que la valeur ajoutée en veut l’augmentation de complexité.
Décrire brièvement les GLM (ou modèles linéaires généralisés).
- Version généralisée des modèles linéaires
- Le GLM supprime les restrictions de la loi normale et de variance constante.
- Permet une fonction de lien autre que additive entre la variable dépendante et la combinaison linéaire des variables prédictives.
- Le choix de différentes fonctions de lien signifie que les variables prédictives n’ont pas nécessairement à être additives comme avec les modèles linéaires. (exemple : fonction de lien log qui assume que les variables sont multiplicatives)
permet ajuster corrélation entre 2 variables et inclure intéraction
Pour quelles raisons les analyse GLMs sont faites sur les données de coûts de sinistres (ou préférablement sur la fréquence et la sévérité séparément) ?
- Pas besoins de mettre les primes aux taux courant (contrairement méthode taux de sinistre)
- Permet de valider nos intuitions de fréquence/sévérité donc permet de mieux distinguer le signal du bruit (qu’elle variable a une influence importante…)
- Non affectés par les changements de taux/algorithme de tarification (contrairement méthode taux de sinistre)