Chapitre 10 - Classification multivariée Flashcards

1
Q

Est-ce que les méthodes de classification univariées (celles vues plus tôt) tiennent compte de l’effet des autres variables de tarification?

A

Non, ou si oui, seulement en partie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est-ce qui peut poser problème si on utilise la méthode de la prime pure pour calculer un différentiel indiqué par âge du véhicule sans tenir compte de l’âge des assurés?

A

Il peut y avoir une défaillance illogique où le différentiel est plus élevé pour un véhicule âgé (sinistres espérés pour un véhicule récent sont inférieurs à ceux du véhicule âgé).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Comment peut-on corriger le problème de défaillance de la méthode de la prime pure univariée pour calculer le différentiel indiqué?

A

Utiliser la méthode de la prime pure bivariée donc ajouter une classe “âge de l’assuré”.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Pourquoi la méthode de la prime pure univariée est biaisée?

A

Parce que les véhicules âgés sont souvent conduits par des assurés plus jeunes, qui eux tendent à avoir une fréquence de sinistres plus élevée.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Expliquez le problème de défaillance de la méthode de la prime pure univariée.

A

La méthode de la prime pure univariée ne considère pas la corrélation entre les variables dans les unités d’exposition.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Expliquez le problème de défaillance de la méthode du taux de sinistre.

A

La méthode du taux de sinistre tient compte partiellement de la distribution du portefeuille puisque la prime varie selon les
différentes variables de tarification, mais la prime chargée n’est qu’un estimé et dévie bien souvent de la vraie espérance de
perte.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Expliquez le problème de défaillance de la méthode de la prime pure ajustée.

A

La méthode de la prime pure ajustée, elle aussi, ne tient compte que partiellement de la distribution du portefeuille en multipliant
les unités d’exposition par les différentiels actuels.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quelles sont les 3 circonstances qui ont conduit à l’adoption des méthodes de classification multivariées?

A
  1. Avancées en informatique
  2. Bases de données plus segmentées disponibles
  3. Compétition
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quels sont les 4 bénéfices des méthodes de classification multivariées?

A
  1. Elles considèrent toutes les variables simultanément et ajustent automatiquement pour la corrélation entre les variables de tarification.
  2. Elles tentent d’éliminer les effets non-systématiques (le bruit) et de capturer seulement les effets systématiques (le signal).
  3. Elles produisent des diagnostics des modèles.
  4. Elles permettent d’inclure une considération pour les interactions ou
    interdépendances entre deux variables ou plus.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quelle est la différence entre une interaction entre deux variables et une corrélation entre deux variables?

A

Une corrélation entre deux variables signifie que la distribution des unités
d’exposition d’une variable n’est pas la même selon les différents niveaux
d’une autre variable de tarification.
Une interaction existe lorsque l’effet d’une variable varie selon le niveau
d’une autre variable. Par exemple, l’effet de l’âge de l’assuré en assurance
automobile peut varier selon le sexe de l’assuré.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qu’est-ce qui peut augmenter significativement le pouvoir prédictif d’un modèle? Mais quel est le problème résultant?

A

L’ajout d’interactions dans un modèle est un raffinement qui augmente le pouvoir prédictif, mais elles augmentent aussi la complexité.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Comment exprime-t-on Y dans un modèle linéaire?

A

Y = mu + epsilon
où mu : moyenne
epsilon : terme d’erreur
Mais Y est une combinaison linéaire de variables prédictives, par exemple :
Y = B1 * X1 + B2 * X2 + B3 * X3 + epsilon
où epsilon suit une normale(0, sig2)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Que supprime les GLM si on les compare aux modèles linéaires?

A

Les GLM suppriment les restrictions de loi normale et de variance constante.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Que permet le GLM?

A

Une fonction de lien (« link function ») autre que additive entre la variable dépendante et la combinaison linéaire des variables prédictives.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Que signifie le choix de différentes fonctions de lien?

A

Que les variables prédictives n’ont pas nécessairement à être additives comme avec les modèles linéaires. Par exemple, des GLMs pour prédire les coûts des réclamations en assurance spécifient souvent une fonction de lien logarithmique qui assume que les variables sont multiplicatives.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qu’a-t-on besoin pour résoudre un GLM?

A
  1. Base de données incluant suffisamment de données et contenant l’information de la variable dépendante associées aux variables prédictives à considérer dans le modèle.
  2. Sélectionner une fonction de lien pour définir le lien entre les composantes systématiques et aléatoires.
  3. Sélectionner la distribution du processus aléatoire sous-jacent (ex: Normal, Poisson, Gamma, …).
17
Q

Est-ce qu’on doit mettre les primes au taux courant pour utiliser les GLM?

18
Q

Est-ce que les GLM sont affectés par les changements de taux/algorithme de tarification?

A

Non, contrairement à la méthode du taux de sinistre.

19
Q

Dans quelle situation le GLM sera mauvais?

A

Si des variables qui reflètent un effet non-systématique (du bruit) sont retenues dans le modèle, les résultats du GLM ne seront pas prédictifs. Le modèle sera mauvais sur l’échantillon de validation car celui-ci ne contient pas le même bruit.

20
Q

Si des variables importantes ont été oubliées dans le modèle, que va-t-il se produire?

A

Le modèle va bien prédire les résultats futurs, mais ne pointera pas vers les variables qui impactent les coûts. Le cas extrême serait un modèle sans aucune variable qui prédit toujours la moyenne.

21
Q

Comment peut-on calculer le pouvoir prédictif d’un GLM?

A

En utilisant des tests statistiques comme le calcul de déviance (ex : Chi Carré).

22
Q

Comment fait-on un test Chi-Carré?

A

On fait un modèle avec la variable et un modèle sans la variable. On regarde
l’augmentation de précision du modèle versus la complexité d’avoir un
paramètre supplémentaire à estimer. L’hypothèse nulle est que les deux modèles
sont égaux.

23
Q

Un % de Chi-Carré inférieur à 5% indique quoi?

A

Que l’hypothèse nulle doit être rejetée et donc utiliser le modèle avec un paramètre
supplémentaire.

24
Q

Un % de Chi-Carré supérieur à 30% indique quoi?

A

Que l’hypothèse nulle ne doit pas être rejetée (i.e. les deux modèles sont égaux).
Comme les deux modèles sont égaux, l’actuaire devrait choisir celui qui n’inclut
pas la variable additionnelle.

25
Q

Si le % de Chi-Carré est entre 5% et 30%, que conclut-on?

A

On considère le test non concluant.

26
Q

Quel est le rôle de l’actuaire en ce qui concerne les GLMs?

A
  1. S’assurer que les données sont adéquates pour le niveau de détails de
    l’analyse de tarification (« Garbage in = Garbage out »).
  2. Identifier lorsque des résultats irréguliers nécessitent une explication
    supplémentaire.
  3. Revoir le modèle en ayant en tête les considérations statistiques et
    l’application pour la compagnie.
  4. Développer des méthodes de communication des résultats appropriées
    en terme d’objectifs de tarification de la compagnie (dislocation, compétitivité, …).