Cours 10 - Modélisation Flashcards

1
Q

Une modélisation applique une ______ ____________ aux données d’une étude pour décrire la relation entre une ____________ et la survenue d’un __________.

A

Une modélisation applique une ÉQUATION MATHÉMATIQUE aux données d’une étude pour décrire la relation entre une EXPOSITION et la survenue d’un ÉVÉNEMENT.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quelles sont les deux fonctions primaires pour lesquelles est utilisée la modélisation ?

A

Prédiction (estimation du risque)

Contrôle des confondants (évaluer le rôle causal en contrôlant pour la confusion)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

V ou F

La modélisation permet de contrôler de façon simultanée l’influence de plusieurs confondants

A

V

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

V ou F
Dans une équation linéaire de forme Y = a0 +a1X, le paramètre a0 représente l’ordonnée à l’origine (intercept) ce qui représente graphiquement l’endroit où la droite traverse X = 0 (ordonnée)

A

F

En fait, l’intercept permet d’estimer le nombre d’événements survenus SANS EXPOSITION. Toutefois, elle diffère de la valeur réelle du graphique.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Soit une situation où des patients exposés à X sont à risque de subir l’événement Y.

La droite Y = 2.6 + 1.2X traduit la situation.

Que signifie 1.2 ?

A

C’est la pente de la droite. Ça représente l’estimation de la variation de survenue de l’événement pour une augmentation d’une unité de X.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

V ou F

Il est possible de calculer des mesures d’association à partir d’une régression linéaire

A

V

On n’a qu’à comparer les valeurs Y d’une droite pour deux valeurs de X données.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Les modèles généralisés peuvent être utilisés comme alternative à quoi pour contrôler la confusion ?

A

La stratification

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

V ou F
Un modèle généralisé où on contrôle pour les confondants procure une valeur NON BIAISÉE pour chacun des facteurs inclus dans le modèle

A

V

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Pourquoi cherche-t-on parfois à effectuer une transformation d’un modèle ?

A

Pour éviter que le modèle traduise une situation impossible (ex. un nombre négatif d’événement)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Qu’est-ce qu’on peut utiliser comme transformation pour que la variable Y ne prenne que des valeurs positives ?

A

On peut utiliser une transformation logarithmique. (On utilise souvent ln)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quel calcul mathématique complexe utilise-t-on pour obtenir la valeur réelle de la variable Y si elle a été transformée en logarithme naturel ?

A

Y = e^équation

Donc on a

ln(Y) = A0 + A1X1 + … + AkXk

ET

Y = e^[A0 + A1X1 + … + AkXk]

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Si on fait face à une mesure dichotomique de l’exposition (oui = 1 ou non = 0), Comment peut-on estimer la différence de taux entre les exposés et non-exposés ?

A

On peut l’estimer par l’équation Ye - Yne

Ou on peut utiliser A1 qui représente la pente dans un modèle linéaire simple. (Y = A0 + A1X)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quelle est l’équation de la DIFFÉRENCE DE TAUX dans un modèle généralisé transformé en logarithme naturel où l’exposition est dichotomique

A

On a déjà vu que la différence de taux pour une exposition dichotomique est

Ye - Yne = A1

Donc le logarithme naturel de ça sera

ln (Yexp) - ln (Ynexp) = A1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Transformez cette équation en antilogarithme

ln(Ye) - ln(Yne) = A1

A

Ye/Yne = e^A1

Ainsi, quand on se ramasse avec une transformation en LOG et qu’on veut estimer une différence de taux, on se retrouve à plutôt estimer un RATIO

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Dans les cas où la variable dépendante serait une mesure de risque comprise entre 0 et 1, quelle transformation devrait-on utiliser ?

A

Une transformation logistique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quelles sont les deux étapes d’une transformation logistique ?

A
  1. Convertir la mesure du risque R (allant de 0 à 1) en cote de risque (avec l’équation R/(1-R)
  2. Convertir la cote du risque (allant de 0 à l’infini) en logit (allant de - infini à + infini) –> ln[R/(1-R)].
17
Q

V ou F

R/(1-R) représente le risque d’événement divisé par le risque de non-événement

A

V

18
Q

Quelle équation obtient-on lors d’une transformation logistique ?

A

ln[R/(1-R)] = A0 + A1X

19
Q

V ou F
Dans une transformation logistique où l’exposition est dichotomique, le ratio des logits exposé/non-exposé correspond à e^a1

A

F

Il correspond à A1

Si on fait l’antilogarithme pour obtenir les valeurs réelles du risque, e^A1 correspond au RC

20
Q

V ou F

On peut obtenir des différences de risque avec une transformation logisitque

A

F

On ne peut obtenir que des RC.

C’est pourquoi toute transformation effectuée sur un modèle mathématique CONDITIONNE le type de mesure estimée

21
Q

Soit l’équation logistique

Nombre de petites à T-Bud = 0.18 + 2.1Âge de la petite.

Faites l’interprétation du coefficient de l’âge de la petite

A

e^1.2 = 3.32

Pour chaque augmentation d’un an de l’âge de la petite, la cote du nombre de petites à T-Bud augmente de 232 %.

22
Q

Un des principaux avantages des modèles de régression multivariés est la facilité avec laquelle les ____________ peuvent être contrôlés

A

Confondants

23
Q

V ou F

Les analyses stratifiées offrent plus d’information que des analyses multivariées

A

V

Dans l’analyse stratifiée, on peut voir la distribution des données

24
Q

Quelle analyse est la plus performante ? Multivariée ou stratifiée ?

A

Multivariée! Elle donne toutefois moins de détails et ne devrait pas être utilisée comme outil principal mais plutôt pour appuyer l’analyse stratifiée.

25
Q

V ou F

La modélisation permet d’identifier les variables causales

A

F
Bien qu’on puisse mettre plein de variables dans un modèle, aucune distinction ne se fait entre les associations causales et les autres variables

26
Q

Quelles sont les 4 étapes de la stratégie d’analyse ?

ouf…

A
  1. Examination (on examine les données, les variables, les associations simples, analyses stratifiées simples pour voir si tout fonctionne)
  2. Détermination des confondants
  3. Forme de la relation entre l’exposition et l’issue de santé
  4. Interaction causale
27
Q

Combien devrait-il y avoir d’observation par variable pour éviter le sur-ajustement ?

A

10 à 15.

10-15 événement et 10-15 non-événement par variable.

28
Q

Qu’est-ce que provoque le sur-ajustement ?

A

Le sur-ajustement augmente l’effet de l’erreur aléatoire

29
Q

Quand on a pas assez d’observations pour ajuster pour les confondants sans faire de sur ajustement, on peut se tourner vers des scores résumés. Lesquels ?

A
  • Score de risque de maladie

- Score de propension (+++)