Cours 10 - Modélisation Flashcards
Une modélisation applique une ______ ____________ aux données d’une étude pour décrire la relation entre une ____________ et la survenue d’un __________.
Une modélisation applique une ÉQUATION MATHÉMATIQUE aux données d’une étude pour décrire la relation entre une EXPOSITION et la survenue d’un ÉVÉNEMENT.
Quelles sont les deux fonctions primaires pour lesquelles est utilisée la modélisation ?
Prédiction (estimation du risque)
Contrôle des confondants (évaluer le rôle causal en contrôlant pour la confusion)
V ou F
La modélisation permet de contrôler de façon simultanée l’influence de plusieurs confondants
V
V ou F
Dans une équation linéaire de forme Y = a0 +a1X, le paramètre a0 représente l’ordonnée à l’origine (intercept) ce qui représente graphiquement l’endroit où la droite traverse X = 0 (ordonnée)
F
En fait, l’intercept permet d’estimer le nombre d’événements survenus SANS EXPOSITION. Toutefois, elle diffère de la valeur réelle du graphique.
Soit une situation où des patients exposés à X sont à risque de subir l’événement Y.
La droite Y = 2.6 + 1.2X traduit la situation.
Que signifie 1.2 ?
C’est la pente de la droite. Ça représente l’estimation de la variation de survenue de l’événement pour une augmentation d’une unité de X.
V ou F
Il est possible de calculer des mesures d’association à partir d’une régression linéaire
V
On n’a qu’à comparer les valeurs Y d’une droite pour deux valeurs de X données.
Les modèles généralisés peuvent être utilisés comme alternative à quoi pour contrôler la confusion ?
La stratification
V ou F
Un modèle généralisé où on contrôle pour les confondants procure une valeur NON BIAISÉE pour chacun des facteurs inclus dans le modèle
V
Pourquoi cherche-t-on parfois à effectuer une transformation d’un modèle ?
Pour éviter que le modèle traduise une situation impossible (ex. un nombre négatif d’événement)
Qu’est-ce qu’on peut utiliser comme transformation pour que la variable Y ne prenne que des valeurs positives ?
On peut utiliser une transformation logarithmique. (On utilise souvent ln)
Quel calcul mathématique complexe utilise-t-on pour obtenir la valeur réelle de la variable Y si elle a été transformée en logarithme naturel ?
Y = e^équation
Donc on a
ln(Y) = A0 + A1X1 + … + AkXk
ET
Y = e^[A0 + A1X1 + … + AkXk]
Si on fait face à une mesure dichotomique de l’exposition (oui = 1 ou non = 0), Comment peut-on estimer la différence de taux entre les exposés et non-exposés ?
On peut l’estimer par l’équation Ye - Yne
Ou on peut utiliser A1 qui représente la pente dans un modèle linéaire simple. (Y = A0 + A1X)
Quelle est l’équation de la DIFFÉRENCE DE TAUX dans un modèle généralisé transformé en logarithme naturel où l’exposition est dichotomique
On a déjà vu que la différence de taux pour une exposition dichotomique est
Ye - Yne = A1
Donc le logarithme naturel de ça sera
ln (Yexp) - ln (Ynexp) = A1
Transformez cette équation en antilogarithme
ln(Ye) - ln(Yne) = A1
Ye/Yne = e^A1
Ainsi, quand on se ramasse avec une transformation en LOG et qu’on veut estimer une différence de taux, on se retrouve à plutôt estimer un RATIO
Dans les cas où la variable dépendante serait une mesure de risque comprise entre 0 et 1, quelle transformation devrait-on utiliser ?
Une transformation logistique
Quelles sont les deux étapes d’une transformation logistique ?
- Convertir la mesure du risque R (allant de 0 à 1) en cote de risque (avec l’équation R/(1-R)
- Convertir la cote du risque (allant de 0 à l’infini) en logit (allant de - infini à + infini) –> ln[R/(1-R)].
V ou F
R/(1-R) représente le risque d’événement divisé par le risque de non-événement
V
Quelle équation obtient-on lors d’une transformation logistique ?
ln[R/(1-R)] = A0 + A1X
V ou F
Dans une transformation logistique où l’exposition est dichotomique, le ratio des logits exposé/non-exposé correspond à e^a1
F
Il correspond à A1
Si on fait l’antilogarithme pour obtenir les valeurs réelles du risque, e^A1 correspond au RC
V ou F
On peut obtenir des différences de risque avec une transformation logisitque
F
On ne peut obtenir que des RC.
C’est pourquoi toute transformation effectuée sur un modèle mathématique CONDITIONNE le type de mesure estimée
Soit l’équation logistique
Nombre de petites à T-Bud = 0.18 + 2.1Âge de la petite.
Faites l’interprétation du coefficient de l’âge de la petite
e^1.2 = 3.32
Pour chaque augmentation d’un an de l’âge de la petite, la cote du nombre de petites à T-Bud augmente de 232 %.
Un des principaux avantages des modèles de régression multivariés est la facilité avec laquelle les ____________ peuvent être contrôlés
Confondants
V ou F
Les analyses stratifiées offrent plus d’information que des analyses multivariées
V
Dans l’analyse stratifiée, on peut voir la distribution des données
Quelle analyse est la plus performante ? Multivariée ou stratifiée ?
Multivariée! Elle donne toutefois moins de détails et ne devrait pas être utilisée comme outil principal mais plutôt pour appuyer l’analyse stratifiée.
V ou F
La modélisation permet d’identifier les variables causales
F
Bien qu’on puisse mettre plein de variables dans un modèle, aucune distinction ne se fait entre les associations causales et les autres variables
Quelles sont les 4 étapes de la stratégie d’analyse ?
ouf…
- Examination (on examine les données, les variables, les associations simples, analyses stratifiées simples pour voir si tout fonctionne)
- Détermination des confondants
- Forme de la relation entre l’exposition et l’issue de santé
- Interaction causale
Combien devrait-il y avoir d’observation par variable pour éviter le sur-ajustement ?
10 à 15.
10-15 événement et 10-15 non-événement par variable.
Qu’est-ce que provoque le sur-ajustement ?
Le sur-ajustement augmente l’effet de l’erreur aléatoire
Quand on a pas assez d’observations pour ajuster pour les confondants sans faire de sur ajustement, on peut se tourner vers des scores résumés. Lesquels ?
- Score de risque de maladie
- Score de propension (+++)