Chapitre 10 - Classification multivariée Flashcards

1
Q

Quels sont les méthodes de classification univariées ?

A
  1. Méthodes de la prime pure
  2. Méthode du taux de sinistres
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Les méthodes de classification univariées ne tiennent pas compte de quelque chose. Qu’est-ce que c’est ?

A

L’effet des autres variables de tarification.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qu’est-ce que la méthode de la prime pure univariée ne considère pas ?

A

la corrélation entre les variables dans les unités d’exposition.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

La méthode du taux de sinistre est “meilleur” que la méthode de la prime pure. Expliquez comment et expliquez également qu’est-ce qu’il manque à cette méthode.

A

La méthode du taux de sinistre tient compte partiellement de la distribution du portefeuille puisque la prime varie selon les différentes variables de tarification, mais la prime chargée n’est qu’un estimé et dévie bien souvent de la vraie espérance de perte.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

La méthode de la prime pure ajustée est-elle une meilleure méthode ?

A

La méthode de la prime pure ajustée, elle aussi, ne tient compte que partiellement de la distribution du portefeuille en multipliant les unités d’exposition par les différentiels actuels.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quelles cirsconstances ont conduit à l’adoption des méthodes de classification multivariées ?

A
  • Avancées en informatique
  • Bases de données plus segmentées disponibles
  • Compétition
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quel est le premier bénéfice des méthodes de classification multivariées ?

A

Les méthodes de classification multivariées considèrent toutes les variables simultanément et ajustent automatiquement pour la corrélation entre les variables de tarification.

**Le biais lié à la corrélation entre les variables est le principal défaut des méthodes d’analyses univariées.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quel est le deuxième bénéfice des méthodes de classification multivariées ?

A

Les méthodes de classification multivariées tentent d’éliminer les effets non-systématiques (le bruit) et de capturer seulement les effets systématiques (le signal).

**Les méthodes d’analyses univariées incluent à la fois les effets non-systématiques (le bruit) et les effets systématiques (le signal).

bruit : l’effet aléatoire

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quel est le troisième bénéfice des méthodes de classification mutlivariées ?

A

Les méthodes de classification multivariées produisent des diagnostics des modèles.

**Les diagnostics des modèles permettent d’avoir de l’information additionnelle à propos de la justesse du modèle.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quel est le quatrième bénéfice des méthodes de classification multivariées ?

A

Les méthodes de classifications multivariées permettent d’inclure une considération pour les interactions ou interdépendances entre deux variables ou plus.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qu’est-ce que la corrélation ?

A

Une corrélation entre deux variables signifie que la distribution des unités d’exposition d’une variable n’est pas la même selon les différents niveaux d’une autre variable de tarification.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Qu’est-ce que l’interaction ?

A

Une interaction existe lorsque l’effet d’une variable varie selon le niveau d’une autre variable.

Par exemple, l’effet de l’âge de l’assuré en assurance automobile peut varier selon le sexe de l’assuré.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Nommez un avantage et un inconvénient d’une interaction.

A

Avantage
* L’ajout d’interactions dans un modèle de tarification est un raffinement du modèle qui peut en augmenter significativement le pouvoir prédictif.

Inconvénient
* Les interactions augmentent aussi la complexité d’un modèle et d’un algorithme de tarification, donc il faut s’assurer que la valeur ajoutée en veut l’augmentation de complexité.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Décrire brièvement les GLM (ou modèles linéaires généralisés).

A
  • Version généralisée des modèles linéaires
  • Le GLM supprime les restrictions de la loi normale et de variance constante.
  • Permet une fonction de lien autre que additive entre la variable dépendante et la combinaison linéaire des variables prédictives.
  • Le choix de différentes fonctions de lien signifie que les variables prédictives n’ont pas nécessairement à être additives comme avec les modèles linéaires. (exemple : fonction de lien log qui assume que les variables sont multiplicatives)

permet ajuster corrélation entre 2 variables et inclure intéraction

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Pour quelles raisons les analyse GLMs sont faites sur les données de coûts de sinistres (ou préférablement sur la fréquence et la sévérité séparément) ?

A
  • Pas besoins de mettre les primes aux taux courant (contrairement méthode taux de sinistre)
  • Permet de valider nos intuitions de fréquence/sévérité donc permet de mieux distinguer le signal du bruit (qu’elle variable a une influence importante…)
  • Non affectés par les changements de taux/algorithme de tarification (contrairement méthode taux de sinistre)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quelles sont les étapes pour effectuer un test de diagnostic ?

A
  1. calcul de l’écart-type (IC mutuellement exclusif : différend statistiquement)
  2. consistance des résultats d’une année à l’autre
  3. comparer le résultat espéré prédit par le modèle vs le résultat historique sur un échantillon de validation
17
Q

Quel est l’impact de l’utilisation de variables qui reflètent un effet non-systématique (bruit) dans notre modèle ?

A

Les résultats du GLM ne seront pas prédictifs. Le modèle sera bon sur les données utilisées pour la modélisation, mais sera mauvais sur l’échantillon de validation car cet échantillon ne contient pas le même bruit (overfitting)

18
Q

Quel est l’impact de l’oublie de variables importantes dans notre modèle ?

A

Le modèle va bien prédire les résultats futurs, mais ne pointera pas vers les variables qui impactent les coûts (underfitting). Le cas extrême serait un modèle sans aucune variable qui prédit toujours la moyenne.

19
Q

Pour tester le pouvoir prédictif d’une variable, on peut utiliser des tests statistiques comme le calcul de déviance. Un exemple commun est le test du Chi-Carré. Expliquez le brièvement.

A

On fait un modèle avec la variable et un modèle sans la variable. On regarde l’augmentation de précision du modèle versus la complexité d’avoir un paramètre supplémentaire à estimer. L’hypothèse nulle est que les deux modèles sont égaux.

Un % de Chi-Carré inférieur à 5% indique normalement que l’hypothèse nulle doit être rejetée et donc utiliser le modèle avec un paramètre supplémentaire

Un % de Chi-Carré supérieur à 30% indique normalement que l’hypothèse nulle ne doit pas être rejetée. Comme les deux modèles sont égaux, l’actuaire devrait choisir celui qui n’inclut pas la variab;e additionnelle.

On considère normalement les % de Chi-Carré entre 5% et 30% comme non concluants.

20
Q

Quel est le rôle d’un actuaire dans l’utilisation des considérations pratiques ?

A
  • s’assurer que les données sont adéquates pour le niveau de détails de l’analyse de tarification
  • identifier lorsque des résultats irréguliers nécessitent une explication supplémentaire
  • revoir le modèle en ayant en tête les considérations statistiques et l’application pour la compagnie
  • développer des méthodes de communication des résultats appropriées en terme d’objectifs de tarification de la compagnie.