2,4,6-Régression logistique Flashcards

1
Q

3 conditions pour faire le modèle de régression simple

A
  1. Les erreurs sont distribués selon une loi normale
  2. La variance des erreurs est constante
  3. Les observations sont indépendantes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

3 raisons pourquoi l’approximation linéaire est pas adéquate et il faut utiliser la régression logistique

A
  1. Les erreurs sont contraintes à prendre 2 valeurs possibles (0 et 1) ce qui exclue une distribution normale
  2. La variance des erreurs dépend de x donc elle n’est plus constante
  3. La quantité B0+B1x correspond à une probabilité et doit par conséquent satisfaire un certain nombre de propriétés et en particulier appartenir à l’intervalle fermé (0-1)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Objectifs (2) de la régression logistique

A
  1. L’estimation: Estimer l’ampleur de la relation entre un outcome et un exposition en évaluant l’association entre Y et X
  2. La prédiction: Développer une équation qui détermine comment la probabilité qu’un individu avec la condition Y=1 dépend de X
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Odds ratio lorseque X est continue

A

Mesure l’évolution des rapports des probabilités d’apparition de l’évènement Y=1 contre l’évènement Y=0 lorseque X passe de x à x+1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

La vraisemblance varie entre ___, et son logarithme varie entre ___

A

0 et 1, -inf et 0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

3 propriétés d’un estimateur de maximum de vraisemblance

A
  1. Il est asymptomatique sans biais
  2. Il est de variance minimale
  3. Il a asymptomatiquement une distribution normale
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

deux approches pour faire un test de significativité en régression logistique multiple

A
  1. S’appuyer sur la normalité asymptomatique des estimateurs (du maximum de vraisemblance) et utiliser le test de Wald
  2. S’appuyer sur le principe du rapport de vraisemblance qui est une approche en cohérence avec la démarche d’estimation des paramètres
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

2 définitions pour le facteur de confusion F

A
  1. s’il existe un lien enre F et la maladie (F est un facteur de risque pour M) et un lien entre F et l’exposition E (F est concomittant de E)
  2. F est facteur de confusion si la relation brute entre le facteur de risque E et la maladie M n’est pas la même obtenue aux différents niveaux Fi de F
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

But d’ajustement pour les facteurs de confusion

A

l’effet d’un facteur de confusion peut augmenter la mesure de l’association entre E et M ou diminuer la mesure de l’association entre E et M
l’ajustement permet d’augmenter la précision (on prends en compte un facteur qui augmente la variabilité de la mesure d’efficacité)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Doit on ajuster pour les facteurs de confusion dans un essai randomisé?

A

Non, la randomisation assure la répartition harmonieuse entre les groupes des variables pronostiques

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

dans le contexte des facteurs de confusion, comment avoir un gain de puissance et de précision dans un essai clinique

A

ajustement décidé a priori reposant sur les variables de stratification de la randomisation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

un bon choix de modèles à inclure dans le modèle de régression linéaire repose sur (3)

A
  1. Une bonne connaissance scientifique du problème
  2. Une utilisation appropriée des méthodes statisitiques
  3. Une connaissance de la littérature
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Objectifs d’avoir le meilleur modèle (3)

A
  1. Prise en considération des variables explicatives potentielles
  2. Control des variables confondantes
  3. Résultats stables
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Résultats de plusieurs variables dans le modèle (2)

A
  1. Perte de puissance
  2. Sur-ajustement
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Résultats de pas assez de variables prises en considération

A
  1. Possibilité de confusion résiduelle
  2. Moins bonnes adéquations du modèle
  3. Interprétation plus facile
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Vrai ou faux: il nous arrive souvent qu’on force des variables potentielles dans le modèle

A

Vrai (si on sait que y’a un effet)

17
Q

Quel test permet de sélectionner un modèle parmi deux modèles emboités

A

LRT

18
Q

Critères utilisés pour sélectionner un modèle quand ils ne sont pas emboités

A

AIC et BIC

19
Q

Stratégie de AIC et BIC

A

Pénaliser la vraisemblance par une fonction de nombre de paramètres

20
Q

formule de l’AIC

A

-2log(L)+2k

21
Q

l’AIC représente

A

un compromis entre le biais (qui diminue le nombre de paramètres) et la parcimonie (nécessité de décrire les données avec le plus petit nombre de paramètres possibles)

22
Q

limite de l’AIC

A

on peut pas l’utiliser quand n/k < 40

23
Q

formule du BIC

A

-2log(L)+klog(n)

24
Q

logit ou odds ratio: symmétrique autour de 0

A

logit

25
Q

logit ou odds ratio: relation linéaire avec les variables explicatives

A

logit

26
Q

logit ou odds ratio: changement dans les odds associé avec l’accroissement d’une unité de variable explicative

A

odds ratio

27
Q

logit ou odds ratio: une valeur minimale de 0

A

odds ratio

28
Q

e^Beta

A

le odds ratio nous indique le changement dans le risque d’avoir l’évènement lorseque le facteur de risque change d’une unité (quand x est continue)

29
Q

-2LL

A

plus la déviance du modèle est petite plus le modèle est adéquat

30
Q

Wald

A

Statistique utilisée pour juger si la variable explicative contribue au risque d’avoir l’évènement ou non

31
Q

que signifie le log de la vraisemblance

A

la mesure de la puissance explicative du modèle

32
Q

la régression logistique est basée sur une distribution normale ou binomiale

A

binomiale

33
Q

la régression logistique est essentielle lorseque

A

seulement la variable dépendante est catégorielle quelque soit le type de variables indépendantes

34
Q

la fonction logit est utilisée dans la régression logistique pour

A

pour avoir une relation linéaire entre le logit et les facteurs de risque

35
Q

la statistique de wald est une fonction de

A

beta