Régression logistique simple Flashcards

1
Q

comment on appelle Y ?

A

variable dépendante ou variable réponse /expliquée

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Comment on appelle X

A

variables indépendantes, explicatives ou facteurs de risques

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

RLS :

variable dépendante est ?

A

catégorique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

RLS
définition mathématique

pi (x) = P(Y=1|X=x)

A

La probabilité de X = probabilité que y = 1 (personne ait l’événement) étant donné que la variable x prend une telle valeur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Caractéristiques de la RLS

linéaire :
erreurs eps : distribués selon loi normale

-variance erreur est constante

-

A

erreurs epsilon => sont contrainte à prendre 2 valeurs possibles (dichotomiques) ce qui exclue une distribution normale des résidus

variance des erreurs dépend de x donc, pas constante

-qt b0+b1x doit appartenir à l’intervalle fermé [0,1]

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

2 objectifs de la régression logistique

A
  • estimation :estimer l’ampleur de la relation entre un outcome (Y) et une exposition (X) en évaluant l’association entre y et x
  • prédiction: développer une équation qui détermine comment la probabilité qu’un individu avec la condition (y=1) dépend de X
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

2 écritures du modèles

A

fonction logistique

fonction logit

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Fonction logit :

A

exprime la relation LINÉAIRE qui lie la variable indépendante (âge) à la variable dépendante (CHD)

pprendre la probabilité de X et diviser par 1- probabilité de X

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

ODDS

A

p/ 1-p
ou
p = odds / 1+odds

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Interprétation des coefficients b0

A

la probabilité d’avoir l’événement mm si j’ai pas le facteur de risque

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Interprétation des coefficients de b1

b1 : c’est lui qui mesure l’ampleur entre l’âge et la maladie coronarienne

A

représente l’accroissement de logit pi(x) par unité de x

qd je me déplace de 1 unité ds l’axe des x, mon y se déplace de cb ? Accroissement de la valeur y

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

OR

ratio des 2 odds

ou un autre calcul

A

p(x+1) / 1- p(x+1) /////// p(x) / 1 - p(x)

e^b1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Comment calculer OR avec un tableau ?

A

AD / CB

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Vraisemblance L
consiste à quoi

entre quelle valeur ?

A

à produire les paramètres b0 et b1 (et leurs écarts type) de la régression logistique qui rendent la vraisemblance maximale (CHERCHE DES ITÉRATIONS)

-varie entre 0 et 1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Propriétés des estmateurs de maximum de vraisemblance (3)

importance pour ?

A
  • asymptotiquement sans biais
  • variance minimale
  • asymptotiquement une distribution normale

=la référence statistique (IC et test de significativité)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Intervalle de confiance
(mesuré à un niveau de confiance 1- alpha)

pour b1

pour

OR

A

b1 +/- (1,96)*std error

e^b1 +/- (1,96)*std error

17
Q

qu’est-ce qu’on est capable de trouver avec l’IC ?

A

probabilité d’avoir la maladie avec une grosse formule