Cours 10 - Modélisation Flashcards

Question 1

Q

Une modélisation applique une ______ ____________ aux données d’une étude pour décrire la relation entre une ____________ et la survenue d’un __________.

Answer

A

Une modélisation applique une ÉQUATION MATHÉMATIQUE aux données d’une étude pour décrire la relation entre une EXPOSITION et la survenue d’un ÉVÉNEMENT.

Question 2

Q

Quelles sont les deux fonctions primaires pour lesquelles est utilisée la modélisation ?

Answer

A

Prédiction (estimation du risque)

Contrôle des confondants (évaluer le rôle causal en contrôlant pour la confusion)

Question 3

Q

V ou F

La modélisation permet de contrôler de façon simultanée l’influence de plusieurs confondants

Question 4

Q

V ou F
Dans une équation linéaire de forme Y = a0 +a1X, le paramètre a0 représente l’ordonnée à l’origine (intercept) ce qui représente graphiquement l’endroit où la droite traverse X = 0 (ordonnée)

Answer

A

F

En fait, l’intercept permet d’estimer le nombre d’événements survenus SANS EXPOSITION. Toutefois, elle diffère de la valeur réelle du graphique.

Question 5

Q

Soit une situation où des patients exposés à X sont à risque de subir l’événement Y.

La droite Y = 2.6 + 1.2X traduit la situation.

Que signifie 1.2 ?

Answer

A

C’est la pente de la droite. Ça représente l’estimation de la variation de survenue de l’événement pour une augmentation d’une unité de X.

Question 6

Q

V ou F

Il est possible de calculer des mesures d’association à partir d’une régression linéaire

Answer

A

V

On n’a qu’à comparer les valeurs Y d’une droite pour deux valeurs de X données.

Question 7

Q

Les modèles généralisés peuvent être utilisés comme alternative à quoi pour contrôler la confusion ?

Answer

A

La stratification

Question 8

Q

V ou F
Un modèle généralisé où on contrôle pour les confondants procure une valeur NON BIAISÉE pour chacun des facteurs inclus dans le modèle

Question 9

Q

Pourquoi cherche-t-on parfois à effectuer une transformation d’un modèle ?

Answer

A

Pour éviter que le modèle traduise une situation impossible (ex. un nombre négatif d’événement)

Question 10

Q

Qu’est-ce qu’on peut utiliser comme transformation pour que la variable Y ne prenne que des valeurs positives ?

Answer

A

On peut utiliser une transformation logarithmique. (On utilise souvent ln)

Question 11

Q

Quel calcul mathématique complexe utilise-t-on pour obtenir la valeur réelle de la variable Y si elle a été transformée en logarithme naturel ?

Answer

A

Y = e^équation

Donc on a

ln(Y) = A0 + A1X1 + … + AkXk

ET

Y = e^[A0 + A1X1 + … + AkXk]

Question 12

Q

Si on fait face à une mesure dichotomique de l’exposition (oui = 1 ou non = 0), Comment peut-on estimer la différence de taux entre les exposés et non-exposés ?

Answer

A

On peut l’estimer par l’équation Ye - Yne

Ou on peut utiliser A1 qui représente la pente dans un modèle linéaire simple. (Y = A0 + A1X)

Question 13

Q

Quelle est l’équation de la DIFFÉRENCE DE TAUX dans un modèle généralisé transformé en logarithme naturel où l’exposition est dichotomique

Answer

A

On a déjà vu que la différence de taux pour une exposition dichotomique est

Ye - Yne = A1

Donc le logarithme naturel de ça sera

ln (Yexp) - ln (Ynexp) = A1

Question 14

Q

Transformez cette équation en antilogarithme

ln(Ye) - ln(Yne) = A1

Answer

A

Ye/Yne = e^A1

Ainsi, quand on se ramasse avec une transformation en LOG et qu’on veut estimer une différence de taux, on se retrouve à plutôt estimer un RATIO

Question 15

Q

Dans les cas où la variable dépendante serait une mesure de risque comprise entre 0 et 1, quelle transformation devrait-on utiliser ?

Answer

A

Une transformation logistique

Question 16

Q

Quelles sont les deux étapes d’une transformation logistique ?

Answer

A

Convertir la mesure du risque R (allant de 0 à 1) en cote de risque (avec l’équation R/(1-R)
Convertir la cote du risque (allant de 0 à l’infini) en logit (allant de - infini à + infini) –> ln[R/(1-R)].

Question 17

Q

V ou F

R/(1-R) représente le risque d’événement divisé par le risque de non-événement

Question 18

Q

Quelle équation obtient-on lors d’une transformation logistique ?

Answer

A

ln[R/(1-R)] = A0 + A1X

Question 19

Q

V ou F
Dans une transformation logistique où l’exposition est dichotomique, le ratio des logits exposé/non-exposé correspond à e^a1

Answer

A

F

Il correspond à A1

Si on fait l’antilogarithme pour obtenir les valeurs réelles du risque, e^A1 correspond au RC

Question 20

Q

V ou F

On peut obtenir des différences de risque avec une transformation logisitque

Answer

A

F

On ne peut obtenir que des RC.

C’est pourquoi toute transformation effectuée sur un modèle mathématique CONDITIONNE le type de mesure estimée

Question 21

Q

Soit l’équation logistique

Nombre de petites à T-Bud = 0.18 + 2.1Âge de la petite.

Faites l’interprétation du coefficient de l’âge de la petite

Answer

A

e^1.2 = 3.32

Pour chaque augmentation d’un an de l’âge de la petite, la cote du nombre de petites à T-Bud augmente de 232 %.

Question 22

Q

Un des principaux avantages des modèles de régression multivariés est la facilité avec laquelle les ____________ peuvent être contrôlés

Answer

A

Confondants

Question 23

Q

V ou F

Les analyses stratifiées offrent plus d’information que des analyses multivariées

Answer

A

V

Dans l’analyse stratifiée, on peut voir la distribution des données

Question 24

Q

Quelle analyse est la plus performante ? Multivariée ou stratifiée ?

Answer

A

Multivariée! Elle donne toutefois moins de détails et ne devrait pas être utilisée comme outil principal mais plutôt pour appuyer l’analyse stratifiée.

Question 25

Q

V ou F

La modélisation permet d’identifier les variables causales

Answer

A

F
Bien qu’on puisse mettre plein de variables dans un modèle, aucune distinction ne se fait entre les associations causales et les autres variables

Question 26

Q

Quelles sont les 4 étapes de la stratégie d’analyse ?

ouf…

Answer

A

Examination (on examine les données, les variables, les associations simples, analyses stratifiées simples pour voir si tout fonctionne)
Détermination des confondants
Forme de la relation entre l’exposition et l’issue de santé
Interaction causale

Question 27

Q

Combien devrait-il y avoir d’observation par variable pour éviter le sur-ajustement ?

Answer

A

10 à 15.

10-15 événement et 10-15 non-événement par variable.

Question 28

Q

Qu’est-ce que provoque le sur-ajustement ?

Answer

A

Le sur-ajustement augmente l’effet de l’erreur aléatoire

Question 29

Q

Quand on a pas assez d’observations pour ajuster pour les confondants sans faire de sur ajustement, on peut se tourner vers des scores résumés. Lesquels ?

Answer

A

Score de risque de maladie

- Score de propension (+++)