Modélisation Flashcards
V/F Un modèle applique une équation mathématique aux données d’une étude épidémiologique pour décrire la relation entre une exposition et la survenue d’un évènement de santé
Vrai
Quelles sont les 2 fonctions de la modélisation?
- prédiction
- Contrôle de la confusion
Définition de la prédiction
Estimer le risque, en fonction de l’information fournie par des prédicteurs
Définition de contrôle de la confusion
Évaluer le rôle causal d’un ou plusieurs facteurs en contrôlant simultanément pour l’effet d’autres facteurs de confusion
V/F:modélisation permet de tenir compte d’autres variables
Vrai
V/F La modélisation ne permet pas de contrôler de façon simultanée l’influence de plusieurs facteurs confondants
faux
MODÈLE LINÉAIRE : ^𝑌 = 𝑎0 + 𝑎1𝑋
- 𝑌^ est la valeur estimée de Y pour toute valeur donnée de X
- 𝑎0 est l’ordonnée à l’origine (intercept) // La valeur de Y quand X vaut 0
- a1 est le coefficient de X, soit la pente de la droite: ceci correspond au changement de 𝑌^ pour chaque unité de changement de X
V/F Un modèle peut inclure plus d’un facteur dans l’équation
Vrai
𝑌^ est toujours la variable de résultat (outcome) ou la variable d’exposition
variable dépendante(variable de résultat (outcome))
V/F Dans un modèle linéaire généralisé : L’effet de chaque facteur est ajusté pour l’effet des autres facteurs: le modèle procure ainsi une valeur non biaisée mutuellement pour chacun des facteurs
Vrai
V/F Pour éviter d’arriver à des situations aberrantes, on peut transformer notre variable dépendante
Vrai
V/F Mathématiquement, il n’y a pas de limites quant au nombre de variables qui peuvent être incluses dans le modèle, mais les données elles-mêmes peuvent être limitantes en pratique
Vrai
Que faire pour s’assurer que la variable dépendante ne prenne que des valeurs positives
on peut utiliser les logarithmes
ln( 𝑌^) peut varier de_____ à _________
moins l’infini à + infini
V/F 𝑌^ lui-même peut seulement être positif parce qu’on ne peut pas faire le ln d’un nombre négatif
Vrai
Dans le modèle linéaire généralisé pour obtenir y ^ on doit
e exposé a0+a1x+a2x
Les transformations effectuées pour que les données s’accordent aux modèles mathématiques ont des implications(1)
conditionnent le type de mesure que les coefficients du modèle vont estime
ex: si les données sont des mesures de risque, le modèle logistique ne donnera que des RC, pas des estimés de la différence de risque
Vaccination = 0,18 + 0,35âge – 0,2MPOC + 0,1ATCD grippe
* Comment interpréter les coefficients?
1) De l’âge? e0,35 = 1,42: Pour chaque augmentation d’un an en âge, la cote d’être vacciné augmente de 42%
2) De la maladie pulmonaire obstructive chronique (MPOC)? e-0,2 = 0,82; Le fait d’avoir une MPOC réduit la probabilité d’être vacciné. La cote d’être vacciné est diminuée de 18%.
3)Des antécédents de grippe? e0,1 = 1,11. Le fait d’avoir eu la grippe auparavant accroît la cote d’être vacciné de 11%.
Quel est l’un des principaux avantages des modèles de régression multivariés ?
facilité avec laquelle les variables confondantes peuvent être contrôlées simultanément
Analyse par régression linéaire
* Si on utilise une régression incluant l’âge et le terme d’exposition, le modèle produira deux droites parallèles avec les données, quelles sont ces 2 droites %
o Une droite décrivant l’effet de l’âge chez les non-exposés
o Une droite décrivant l’effet de l’âge chez les exposés
- Le modèle extrapole la relation avec l’âge pour les exposés et les non- exposés et estime l’effet à partir des droites extrapolées.
But d’une régression linéaire
- Permet d’estimer un effet de l’exposition sur l’issue
Un modèle de régression linéaire + efficace que l’analyse stratifiée a quel le condition ?
- À condition que le modèle linéaire colle bien aux données
V/F Si on ne peut savoir quel modèle est le bon, l’analyse stratifiée apparaît encore une meilleure solution!
Vrai
Les analyses stratifiées permettent aux chercheurs et aux lecteurs (si les analyses sont présentées) de bien visualiser et connaître la distribution des données pour les variables clés. Mais quel est leur désavantage ?
elles ne peuvent contrôler simultanément de nombreux facteurs potentiellement confondants
V/F Analyses multivariées sont plus performantes, mais plus obscures et devraient être utilisées pour appuyer les analyses stratifiées et non comme outil principal
Vrai
V/F modélisation peut également servir à prédire la survenue d’une maladie pour un individu à partir des données recueillies dans un groupe
Vrai
Quelles variables le modèle peut-il inclure pour prédire la survenue d’une maladie
toutes les variables qui sont associées à la survenue de la maladie
V/F le modèle utilisé pour prédire ne fait pas de distinction entre les associations causales et les autres
Vrai
quelle est la formule de cote de risque pour prédire
e exposant y
et pour le risque ( R= ey/(1+ ey) )
V/F Les facteurs prédictifs doivent être nécessairement de nature causale
Faux
V/F on veut que ce soit les données et non le modèle qui nous indiquent la forme de la relation entre l’exposition et l’événement
Vrai
La plupart du temps, seulement une ou deux variables vont exercer un effet confondant important dans un modèle de régression . Qu’est ce qu’on peut faire dans ce temps ?
Utiliser l’analyse stratifiée
V/F Quand plusieurs variables confondantes exercent des effets confondants au moins modérés, la régression multiple est préférable
vrai
V/F Il devrait y avoir environ 10-15 observations pour chaque terme dans un modèle de régression. Autrement, on dira que le modèle est sur-ajusté: il sera trop influencé par l’erreur aléatoire des donnée
Vrai
Qu’est-ce que veut dire sur-ajusté ?
il sera trop influencé par l’erreur aléatoire des données
QU’est ce qu’un modèle explicatif ?
1)Perspective descriptive (association) ou causale
2) Sert à isoler l’association ou l’effet de A sur l’issue Y.
Qu’est ce qu’on fait dans un modèle explicatif ? (2)
1) s’intéresse à une variable d’exposition (A) en particulier et on ajuste pour les confondants (B, C, D, E).
2) La modélisation multivariée contrôle simultanément pour plusieurs facteurs de confusion
V/f Le modèle explicatif ne distingue pas la variable d’intérêt
vrai
V/F Dans la perspective explicative on ne s’intéresse pas aux valeurs des mesures d’association entre les variables confondantes et l’issue.
Vrai
qu’est ce quon essaie de faire avec un modèle explicatif
s’assure que l’estimation de la relation entre A et Y soit la plus valide possible.
Qu’est ce qu’on fait dans un modèle prédictif ?
Sert à prédire le risque d’avoir l’issue pour un individu
V/F Dans un modèle prédictif Les variables sont sur le même pied d’égalité, on ne s’intéresse pas plus à une variable par rapport aux autres
Vrai
Est-ce qu’il y a des variables confondantes dans les modèles prédictifs ?
NON
V/F Les variables pertinentes incluses dans le modèle prédictif sont sélectionnées pour que le modèle (dans sa globalité) prédise le mieux l’issue sans se soucier de la causalité.
vrai
Quelle est l’étape supplémentaire pour calculer le risque dans un modèle prédictif en régression logistique
R = ey/(1+ey)
Dans le modèle additif quel est le type de régression utilisé et la mesure d’association ?
Régression linéaire
β (DR au sens large)
Dans le modèle multiplicatif quel est le type de régression utilisé (2) et la mesure d’association?
- Régression linéaire avec transformation logarithmique
-Régression logistique (donne toujours des RC)
-e exposant β (RR au sens large)