Stats 8 Flashcards
Qu’est-ce la régression logistique ?
Technique d’analyse stat. où on cherche à prédire ou expliquer la probabilité d’un événement à partir d’une ou plusieurs variables.
Quelle est la principale différence avec la régression linéaire ?
La variable dépendante est dichotomique (et non continue)
Quel est le modèle de régression logistique ?
probabilité (de l’événement) = fonction (variables indépendantes)
Quels sont les 3 objectifs de la régression logistique ?
Étudier les liens qui existent entre la probabilité qu’un événement spécifique survienne et les différentes caractéristiques des sujets.
Permettre de tester si la probabilité d’un événement varie selon les caractéristiques des sujets étudiés.
Permettre d’estimer l’effet indépendant de plusieurs variables sur la probabilité d’un événement.
Qu’est-ce la régression logistique permet quand on a plusieurs pertes au suivi ?
Elle permet de contrôler les variables confondantes quand on a plusieurs pertes au suivi.
Permet aussi de faire une analyse per protocole (analyse ajustée).
Quel type d’analyse statistique permet d’identifier des facteurs de risque pour une issue ?
Régression logistique. Pas besoin d’une variable d’intérêt.
Qu’est-ce qu’une variable confondante ?
Variable associée à l’exposition et à l’issue.
ET
n’est pas dans le chemin causal entre l’exposition et la variable dépendante.
Comment doit-on encoder les variables dans le modèle de régression logistique ?
variable aléatoire dichotomique :
1 = issue
0 = pas d’issue
TOUJOURS. car le OR est calculé pour le 1
Vrai ou faux : dans un modèle de régression logistique, le modèle s’écrit ln (p/1-p)
alors que le modèle de régression linéaire est pour une moyenne
Vrai
Vrai ou faux : Les bêta s’interprètent de la même façon pour une régression logistique et une régression linéaire
Faux.
On doit transformer les bêtas dans une régression logistique pour les interpréter (on doit les mettre à l’exponentiel)
La probabilité que l’événement survienne est une fonction de quelle(s) variable(s) ?
variables indépendantes
Que représente B0 ?
Le risque de base dans la population pour les gens non exposés.
Le modèle de régression logistique est quel type de rapport ?
Rapport de côtes (OR)
p/1-p
Régression logistique vs régression linéaire :
Variable réponse (dépendante)
Loi de la variable réponse
Modélisation
Bêtas
Variable réponse (dépendante) :
dichotomique vs continue
Loi : binomiale vs normale
Modélisation :
probabilité d’un événement en fonction d’une ou plusieurs variables vs moyenne d’une variable en fonction d’une ou plusieurs variables
Bêtas :
bêtas représentent un rapport de cotes (la fonction des bêtas) vs bêtas représentent une différence de moyenne
Quelles sont les hypothèses d’une régression logistique ?
H0 : bêta = 0
Ha : bêta = différent de zéro
H0 : RC = 1
Ha : RC = différent de 1