2 - Régression logistique simple Flashcards
Quelles sont les autres termes pour les variables dépendantes et indépendantes ?
Y vs X :
Expliquée vs explicative
Issue vs facteur de risque
Réponse vs covariable
Outcome vs exposition
Quelle est la différence entre la régression linéaire et la régression logistique ?
Linéaire = variables dépendantes continues, droite
Logistique = variables dépendantes non continues (binaires), courbe sigmoïdale
Quelles sont les conditions pour une régression linéaire ?
- Les erreurs (ε : différence entre les observations et la régression) sont distribuées selon une loi normale
- La variance des erreurs est constante
- Les observations sont indépendantes
Quelles sont les conditions pour une régression logistique ?
- Les erreurs sont contraintes à prendre deux valeurs possibles ce qui exclue une distribution normale
- La variance des erreurs dépend de x donc n’est pas constante
- La quantité E(Y|X) = β₀ + β₁xᵢ correspond à une probabilité de développer la condition (Y = 1) et devient E(Y|X = x) = π (x) = ODDS
Quels sont les objectifs de la régression logistique ?
- Estimation : estimer l’ampleur de la relation entre Y et X
- Prédiction : développer une équation qui détermine comment la probabilité qu’un individu avec la condition (Y = 1) dépend de X
Quelle est la fonction logistique d’une régression logistique simple ?
E(Y|X = x) = π (x) = (eᵝ⁰ ⁺ ᵝ¹ˣ)/(1 + eᵝ⁰ ⁺ ᵝ¹ˣ)
La fonction logistique donne la probabilité de développer l’outcome Y en fonction de l’exposition X
P(Y = 1|X) = ODDS / (1 + ODDS)
Quelle est la fonction logit d’une régression logistique simple ?
logit(π (x)) = ln ( (π (x)) / (1 - (π (x)) ) = β₀ + β₁x
La fonction logit exprime la relation linéaire qui lie X à Y
LOGIT = LN (ODDS)
Quelle est l’interprétation de β₀ et de β₁ lorsque X est continue ?
β₀ = risque de base, probabilité d’avoir la maladie sans exposition
β₁ = accroissement de logit(π (x)) par unité de x
Quelle est l’interprétation du odds ratio lorsque X est continue ?
Évolution des rapports des probabilités d’apparition de la condition (Y = 1) contre l’évènement (Y = 0) lorsque X passe de x à x + 1 mesurée par le ratio de l’exponentielle de β₁ de x + 1 sur l’exponentielle de β₁ de x
OR = ODDS (x+1) / ODDS (x)
ODDS = P(Y = 1) / P(Y = 0)
Quelle est l’interprétation du odds ratio lorsque X est binaire ?
Évolution des rapports des probabilités de Y avec l’exposition (X = 1) et sans l’exposition (X = 0) mesurée par le ratio de de P(Y = 1|X = 1) × P(Y = 0|X = 0) sur P(Y = 1|X = 0) × P(Y = 0|X = 1)
Exemple :
X = 1 indique un fumeur
Y = 1 indique une maladie coronarienne
OR = 2.66 indique qu’un fumeur à 2.66 de risque de développer une maladie coronarienne
Quelle est la méthode pour estimer les paramètres β₀ et de β₁ ?
Méthode du maximum de vraisemblance
Quelles sont les propriétés des estimateurs de maximum de vraisemblance ?
- Asymptomatiquement sans biais = estimation non biaisée peu importe le n donc pas de sur/sous-estimation
- Variance minimale donc estimation précise
- Distribution normale asymptomatique = estimation suit une loi normale peu importe le n
Quelle est l’intervalle de confiance à 95% de β₁ ?
[ β₁ - 1.96 × s(β₁) , β₁ + 1.96 × s(β₁) ]
OR : utiliser l’exponentielle des bornes de l’IC de β₁