FINAL 7 - Codage des variables Flashcards
Quels sont les codages possibles avec des variables binaires ?
0 et 1 : RR = eᵝ
-1 et +1 : RR = e²ᵝ
β avec 0 est 2x le β avec -1 donc les RR sont identiques
Quel est le codage pour des variables qualitatives nominales sans variables indicatrices ?
Attribuer une valeur de X à chaque catégorie et déterminer une catégorie comme référence
Ex : X = 1 est la référence
X = 2 : RR = e²ᵝ⁻ᵝ = eᵝ
X = 3 : RR = e³ᵝ⁻ᵝ = e²ᵝ
X = 4 : RR = e⁴ᵝ⁻ᵝ = e³ᵝ
Quel est le codage pour des variables qualitatives nominales avec des variables indicatrices ?
Pour une variable X à k niveaux, k - 1 variables indicatrices sont utilisées qui prennent les valeurs 0 ou 1 (0 ou -1 comme référence)
X = 1 : RR = eᵝ¹ˣ¹⁺ᵝ²ˣ⁰⁺ᵝ³ˣ⁰ / eᵝ¹ˣ⁰⁺ᵝ²ˣ⁰⁺ᵝ³ˣ⁰ = eᵝ¹
X = 2 : RR = eᵝ¹ˣ⁰⁺ᵝ²ˣ¹⁺ᵝ³ˣ⁰ / eᵝ¹ˣ⁰⁺ᵝ²ˣ⁰⁺ᵝ³ˣ⁰ = eᵝ²
X = 3 : RR = eᵝ¹ˣ⁰⁺ᵝ²ˣ⁰⁺ᵝ³ˣ¹ / eᵝ¹ˣ⁰⁺ᵝ²ˣ⁰⁺ᵝ³ˣ⁰ = eᵝ³
Quels sont les codages possibles pour des variables qualitatives ordinales ?
Attribuer une valeur X à chaque catégorie puis :
1. analyser comme une variable continue (1 RR)
RR est le risque de passer à la catégorie juste après
2. construire des variables indicatrices (k - 1 RR)
RR contient la même référence pour toutes les catégories
Comment choisir quelle approche à utiliser pour les variables ordinales ?
- Se baser sur des connaissances antérieures
- Utiliser un test de vraisemblance qui suit une loi χ² avec k - 2 degré de liberté
- Faire un graphique β₁X₁ + β₂X₂ + β₃X₃ vs X (choisir l’approche de la variable continue si la relation représente une droite)
Que suppose la forme additive du modèle de Cox ?
Relation linéaire entre log (h₀(t)) et X
Non-linéarité : ajustement global avec polynômes de degré supérieur à 1(X² ou X³) ou fractionnaires (exposants négatifs ou non entiers)
Comment vérifier que la transformation des variables continues en variables qualitatives n’apporte pas de changements au modèle de Cox ?
Attribuer une valeur de X à chaque catégorie de variables continues
X = variable continue
X’ = 1 si X < x
X’ = 2 si X > x
Utiliser un LRT pour tester H₀ : le modèle X’ (variables qualitatives) n’est pas différent du modèle X (variable continue)
Quels problèmes peuvent survenir avec la transformation de variables continues en variables qualitatives ?
- Estimé biaisé
- Perte de précision
- Valeur p gonflée
- Pas de reproductibilité