Régression logistique simple Flashcards
comment on appelle Y ?
variable dépendante ou variable réponse /expliquée
Comment on appelle X
variables indépendantes, explicatives ou facteurs de risques
RLS :
variable dépendante est ?
catégorique
RLS
définition mathématique
pi (x) = P(Y=1|X=x)
La probabilité de X = probabilité que y = 1 (personne ait l’événement) étant donné que la variable x prend une telle valeur
Caractéristiques de la RLS
linéaire :
erreurs eps : distribués selon loi normale
-variance erreur est constante
-
erreurs epsilon => sont contrainte à prendre 2 valeurs possibles (dichotomiques) ce qui exclue une distribution normale des résidus
variance des erreurs dépend de x donc, pas constante
-qt b0+b1x doit appartenir à l’intervalle fermé [0,1]
2 objectifs de la régression logistique
- estimation :estimer l’ampleur de la relation entre un outcome (Y) et une exposition (X) en évaluant l’association entre y et x
- prédiction: développer une équation qui détermine comment la probabilité qu’un individu avec la condition (y=1) dépend de X
2 écritures du modèles
fonction logistique
fonction logit
Fonction logit :
exprime la relation LINÉAIRE qui lie la variable indépendante (âge) à la variable dépendante (CHD)
pprendre la probabilité de X et diviser par 1- probabilité de X
ODDS
p/ 1-p
ou
p = odds / 1+odds
Interprétation des coefficients b0
la probabilité d’avoir l’événement mm si j’ai pas le facteur de risque
Interprétation des coefficients de b1
b1 : c’est lui qui mesure l’ampleur entre l’âge et la maladie coronarienne
représente l’accroissement de logit pi(x) par unité de x
qd je me déplace de 1 unité ds l’axe des x, mon y se déplace de cb ? Accroissement de la valeur y
OR
ratio des 2 odds
ou un autre calcul
p(x+1) / 1- p(x+1) /////// p(x) / 1 - p(x)
e^b1
Comment calculer OR avec un tableau ?
AD / CB
Vraisemblance L
consiste à quoi
entre quelle valeur ?
à produire les paramètres b0 et b1 (et leurs écarts type) de la régression logistique qui rendent la vraisemblance maximale (CHERCHE DES ITÉRATIONS)
-varie entre 0 et 1
Propriétés des estmateurs de maximum de vraisemblance (3)
importance pour ?
- asymptotiquement sans biais
- variance minimale
- asymptotiquement une distribution normale
=la référence statistique (IC et test de significativité)