6 - régression logistique 3 Flashcards

1
Q

utilité de la sélection de variables

A

identifier les plus pertinentes car certaines sont redondantes et d’autres ont aucun rapport avec la variable dépendante

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

méthode qui guide sur la sélection de variables

A

méthode statistique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

pourquoi la sélection de variables ?

A
  • facilite l’interprétation des variables
  • déploiement facilité (analyse par les logiciels)
  • modèle a plus de chance d’être robuste
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

sur quoi le choix de variables repose-t-il?

A
  • bonne connaissance scientifique du problème
  • utilisation appropriée des méthodes statistiques
  • connaissance de la littérature
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

choix de variables : comment avoir le meilleur modèle

A
  • prise en considération des variables explicatives potentielles
  • contrôle des variables confondantes
  • résultats stables
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

conséquences s’il y a trop de variables dans le modèle

A
  • perte de puissance
  • sur-ajustement
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

conséquences s’il y a pas assez de variables dans le modèle

A
  • possibilité de confusion résiduelle
  • moins bonne adéquation du modèle
  • interprétation plus facile
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

procédure pas à pas : méthode ascendante

A
  1. ajout de variable au modèle à chaque pas
  2. arrêt de la procédure quand toutes les variables sont intégrées ou quand p > seuil
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

procédure pas à pas : méthode descendante

A
  1. ajout de toutes les variables dans le modèle
  2. arrêt de la procédure quand toutes les variables sont retirées du modèle ou que p < seuil
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

procédure pas à pas : méthode progressive

A
  1. ajout de variable à chaque pas, mais on peut éliminer des variables déja introduites
  2. celles qui restent sont testées et la plus significative se rajoute à celle déja sélectionnée
  3. arrêt de la procédure lorsque toutes les variables sont intégrées ou p > seuil
  • peuvent être retirées lorsqu’elles ne sont plus significatives après introduction de nouvelles variables (ex : leur p < 0,1 devient > 0,1 en ajoutant une autre variable)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

v ou f : il arrive qu’on force des variables potentielles dans le modèle

A

v

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

sélection de variables : pourquoi le seuil n’est pas de 5%

A

on garde le seuil plus large car on n’évalue pas encore la variable test

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

mdl progressif : pourquoi forcer des variables

A

> On peut forcer des variables dans un mdl même si elles ne sont pas stats signif (possible qu’on n’ait pas de lien dans l’échantillon qu’on a)
Dans certains modèles de maladie, certaines variables sont obligatoirement ajoutées, malgré qu’on n’ait pas de liens

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

méthode pas à pas progressive : cmt une variable peut perdre sa significativité?

A
  • si son effet était biaisé
  • si la nouvelle variable était un facteur de confusion
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

que répresente les coefficient (B1, B2, etc)

A

l’effet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

V ou F : en présence d’interaction, on peut se fier au coefficient pour voir l’effet

A

F, il faut calculer l’effet en fct de l’interaction

17
Q

méthode de mesure de l’effet d’un groupe de variables

A

avec un test LRT (rapport de vraisemblance)

18
Q

critères de choix du modèle

A

AIC et BIC

19
Q

caractéristiques de AIC

A
  • pénalise le nbr de paramètres
  • on veut le modèle avec le AIC plus petit
  • compromis entre le biais et la parcimonie
  • moins applicable pour les petits échantillons (n/k < 40)
20
Q

caractéristiques de BIC

A
  • on évalue selon le nbr de paramètres et la taille d’échantillon
  • on veut le modèle avec le BIC plus petit
21
Q

parcimonie

A

nécessité de décrire les données avec le moins de paramètres possible

22
Q

pourquoi faire la transformation de données

A

la supposition de linéarité n’est pas tjr rencontrée

23
Q

AIC et BIC : leur utilité dans la transformation de données

A

permettre de sélectionner le mdl le plus proche de la réalité

24
Q

IC et test statistique : cmt savoir si l’effet est statistiquement significatif

A
  • selon le IC : ne doit pas contenir la valeur nulle (1) ou être trop large (manque de précision)
  • selon le Pvalue : < 0,05
25
Q

IC et test statistique : cmt savoir si l’effet est cliniquement significatif

A

selon le OR, doit être > 1

26
Q

critère de choix du modèle qui est le plus parcimonieux

A

BIC