Concepts et méthodes final Flashcards
qu’est-ce que l’ajustement
- résumer en une mesure globale les mesures spécifiques des différentes strates
- modification du poids attribué à chacun des strates
le choix du poids dans l’ajustement est choisi comment
de manière arbitraire
qu’est-ce qu’un biais de confusion et ses caractéristiques nécessaires
- l’effet d’un facteur sur l’exposition est entremêlé avec l’effet d’un autre facteur
- lien avec exposition et événement, mais pas dans la chaîne causale
comment peut-on corriger une biais de confusion
- en stratifiant le résultat selon des catégories du facteur confondant
qu’est-ce que la standardisation directe
- présence d’une population standard de référence fournissant les poids wsi
- calcul avec la formule pour chaque catégorie
qu’est-ce que la standardisation indirecte
- les poids proviennent des exposés et non d’une population standard
que permet de faire la standardisation indirecte
calculer une mesure ajustée même si seul le nombre total de cas est connu = nombre total de cas par strate est inconnu
la standardisation est largement utilisé pour ajuster l’effet de X mais peut être utilisé pour contrôler X
- l’âge
- tout autre variable confondante
est-ce que le choix des poids a un grand effet et pourquoi
oui, car si les poids les plus importants sont placés dans les catégories avec les taux d’incidence les plus élevés le résultat sera nécessairement élevé
que permet la standardisation
- contrôler les biais internes
- permet comparaison avec d’autres résultats
lorsque l’on stratifie pour la variable potentiellement confondante devrait-il ou non maintenir une variation dans la strate pour la variable d’exposition
il ne devrait plus avoir de variation
qu’est-ce que l’estimateurs de mantel-haenszel
- permet de réaliser une moyenne des mesures d’associations en fonction de l’importance de chacune des strates = la strate avec le plus de connées sera celle obtenant le plus de poids
l’estimateurs de mantel-haenszel peut être utilisé pour quel type d’analyses
- ration
- différences
quelle est la condition pour l’utilisation de l’estimateurs de mantel-haenszel
la mesure d’association doit être uniforme pour toutes les strates
comment on interprète les résultats de l’estimateurs de mantel-haenszel
- mention de la mesure d’association ajustée obtenue
- mention de la mesure d’association brute
- mention de la différence relative entre les deux résultat (ajusté-brute/brute) = %
- mention du facteur confondant qui affectait la mesure brute
que se produit-il lorsque le facteur confondant est considéré en large catégories
- le contrôle de la confusion est imparfait
- la mesure ajustée est affectée de confusion résiduelle
- un meilleur contrôle de la confusion entraîne la mesure d’association plus loin dans la même direction
quoi faire lorsque l’on considère que plusieurs facteurs peuvent avoir un effet confondant sur la mesure d’association
- juger de leur effet conjointement plutôt que de façon séquentielle l’un après l’autre
- L’analyse stratifiée peut trouver ses limites avec plusieurs facteurs confondants et des données hétérogènes
que doit toujours avoir l’estimateurs de MH
être compris entre les mesures spécifiques des strates: mathématiquement, c’est nécessaire puisqu’il
est une mesure pondérée des résultats des strates
que se passe-t-il si les mesures sont très proches ou identiques
la mesure pondérée sera très similaire
que se passe-t-il si les mesures sont très différentes
il sera plus difficile de prédire quelle sera la mesure pondéree
si ma valeur ajustée et brute n’ont pas de facteur confondant laquelle j’utilise pour trouver IC
la valeur brute donc utilisé la formule de la valeur d’association
est-ce que les mesures standardisées sont réelles ou non
- Les mesures standardisées ne sont pas des mesures réelles, mais elles
permettent la comparaison entre les populations - Elles permettent des comparaisons directes si les poids donnés à chacune des
strates sont les mêmes
vrai ou faux, la stratification permet de contrôler la confusion
oui
Vrai ou Faux. Le rapport standardisé de mortalité repose sur une standardisation indirecte.
vrai
vrai ou faux, les estimateurs de Mantel-Haenszel permet de faire une moyenne des mesures d’association en fonction de l’importance de chacune des strates (moyenne pondérée)
vrai
comment se calcule le rapport standardisé de mortalité
cas observés / cas escomptés ou attendus
comment savoir si mon facteur est confondant ou non
si la différence entre valeur brute et valeur valeur ajustée est de 10% ou plus elle est confondante
qui suis-je, je suis la méthode pour tenir compte des facteurs de confusion dans une mesure d’effet, on obtient une mesure globale ajustée à partir des poids des différentes strates
standardisation
comment s’interprète un RSM supérieur à 1 versus inférieur à 1
- supérieur 1 = risque de mourir dans pop observée est plus élevée que ce à quoi on aurait observé dans la population de référence
- inférieur 1 = risque de mourir dans pop observée est moins grand que ce à quoi on aurait observé dans la population de référence
qui suis-je, je suis la moyenne de mesures de toutes les strates
estimateur de MH
que permet estimateur de MH
avoir une mesure globale pour l’ensemble de la population
que représente:
- I
- 1
- 0
- i = mesure dans chacune des strates
- 1 = mesure chez les exposés
- 0 = mesure chez les non exposés
comment savoir si mon facteur confondant sur ou sous estime
comparer valeur brute et valeur ajustée
- si facteur de protection soit sous 1 = regarde différence entre mesure brute et valeur nulle pareil pour valeur ajustée, quand la mesure brute est plus loin que 1 = surestime
- facteur de risque = méthode habituelle
Comment savoir si j’ai une valeur confondante
Si ma valeur brute n’est pas à l’intérieur de mon intervalle des résultats stratifiés, le facteur est confondant
Pourquoi le fait de prendre ma valeur brute au lieu de mes valeurs stratifiées lors de confusion est mal
Car cela mettrait de côté l’exposition des effets spécifique distinct du facteur confondant sur les strates
À quoi réfère le concept d’interaction
Basé sur l’idée que l’effet d’une exposition, comparée avec une non-exposition de référence peut dépendre de la présence d’une ou plusieurs autres conditions
Quels sont les 2 autres concepts auxquels fait référence l’interaction
- Synergie
- Antagonisme
Est-ce qu’une variable peut être en même temps confondante et modifiante
oui
En d’autres mots, que permet l’interaction
- Savoir si l’association est différente selon les catégories d’exposition
Pourquoi il y a beaucoup d’ambiguïté et de confusion du terme interaction
- Car la définition d’interaction varie si on la voie de manière statistique, biologique ou de santé publique
Qui suis-je, cherche à évaluer l’effet d’une variable M sur une relation entre X et Y = est-ce que l’association entre X et Y varie selon les niveaux de M
- Modificateur
Qui suis-je, on donne un statut égal à X et M = effet conjoint entre les deux facteurs sur Y
- Interaction
Qu’est-ce que l’interaction biologique
- Interdépendance entre les causes où un facteur peut potentialiser ou inhiber un autre
- L’apparition de l’événement dépend de 2 expositions à la fois pour certains individus
L’interaction biologique fait référence à quel concept
- Causes suffisantes de Rothman
Est-ce que l’interaction biologique peut être présente même si les effets sont additifs
oui
Dans le cadre du modèle des causes suffisantes, la présence d’interaction dite biologique ne se mesure que sur une échelle X
- Additive
Lorsque l’on décrit notre interaction il ne faut pas oublier quoi?
- Toujours identifier l’échelle de mesure
On peut évaluer la présence d’interaction biologique avec des mesures d’association basées sur les X et sur les X
- Différences
- Rations
L’interaction dans le cadre du cours a été présentée avec des formules précises, quelle est la particularité de l’utilisation de ces formules
- Ces formules fonctionnement seulement pour des expositions augmentant le risque
- Ainsi si on a un effet protecteur comme exposition (activité physique sur le diabète) on doit regarder le sens inverse de l’exposition (manque d’activité physique sur le diabète)
Pourquoi il y a un intérêt des interactions causales
- Identification des interactions biologiques a des conséquences en santé publique
Qu’est-ce que l’interaction statistiques
- L’effet d’une variable peut différer selon le statut d’une autre variable sur une échelle donnée
- Elle n’a pas de signification universelle (comme c’est le cas de l’interaction biologique), car elle diffère selon le modèle statistique
Est-ce que l’interaction statistique peut varier selon l’échelle utilisée
- Oui
- Elle peut être présente sur une échelle additive
- Elle ne peut pas être présente sur une échelle multiplicative
Qu’est-ce que la modification de la mesure d’effet
- Situation dans laquelle une mesure d’association varie en fonction du niveau d’une autre variable
Quel terme serait préférable à utiliser pour la modification de la mesure d’effet et pourquoi
- Modification de la mesure d’association
- Car effet devrait seulement être réserver aux associations que l’on considère comme des causes
Différence entre modèle additif et modèle multiplicatif
- Modèle additif = le terme d’interaction met en cause l’effet conjoint de deux facteurs sur la différence des risques (taux d’incidence, proportion d’incidence, prévalence)
- Modèle multiplicatif = le terme d’interaction met en cause l’effet conjoint de deux facteurs sur le risque relatif (rapport de taux d’incidence, de proportion d’incidence, de prévalence)
Quel modèle il faut utiliser pour la santé publique versus la recherche étiologique
- Santé publique = additif
- Étiologique = multiplicatif
Que permet d’identifier l’interaction dans le modèle multiplicatif
- Évaluer la modification du risque relatif
Entre l’interaction biologique et statistique, laquelle est la plus ambiguë
- Celle statistique, car elle dépend du modèle statistique ou de la mesure d’effet ce qui n’est pas le cas de l’interaction biologique.
- L’interaction biologique est là ou non
Vrai ou faux, deux facteurs peuvent être en interaction dans un modèle additif sans l’être dans le modèle multiplicatif
- Vrai
- Se présente sous la forme d’un RI ou RRI plus grand que 0, mais un Iab = 1
Que cela veut dire si RA>1 et que RB>1, l’absence d’interaction ou la présence d’interaction positive dans le modèle multiplicatif (IAB=1 ou >1)
- Il y a une interaction dans le modèle additif (IAB=1)
Vrai ou faux, A et B peuvent être en interaction négative dans le modèle multiplicatif sans l’être dans le modèle additif
- Vrai
- Se présente ainsi : modèle multiplicatif aura Iab inférieur a 1 mais modèle additif aura un RI égal à 0
Si X et Z ont un effet, et qu’il n’y a pas d’interaction dans le modèle multiplicatif, que cela veut dire?
- Il y aura une interaction dans le modèle additif.
Dans la majorité des cas il y a interaction dans les deux types de modèles, que ce passe-t-il dans ce temps
- Il peut y avoir des sens différents à l’interaction
Comment reconnaître que l’uniformité des mesures d’associations dans les différentes strates n’est pas respectée (méthode Mantel Haenszel)
- Il y a une variation substantielle entre les mesures d’effets ou d’association dans les différentes strates
Quoi faire quand l’uniformité des mesures d’associations dans les différentes strates n’est pas respectée
- Faire un test homogénéité ou hétérogénéité
- Permet de juger dans les données pour la mesure d’association choisie de l’importance de la déviation par rapport au modèle statistique de base
Le postulat d’uniformité des mesures d’association relatives (RI, RR, RC) correspond à quoi
- Au postulat d’une relation multiplicative entre l’exposition et la variable de stratification
L’absence d’hétérogénéité dans les mesures d’association relatives veut dire qu’il y a présence d’une interaction biologique ou statistique
- Biologique
Vrai ou faux, l’absence de modification de la mesure d’effet sur des ratios constitue une évidence qu’il y a une interaction causale entre les variables
- Vrai
Si je remarque que pour deux strates, les IC de chacune ne se recoupent pas, il y a interaction ou non
- Il y a interaction
- Mais l’inverse n’est pas vrai
Que représente RAB, RA, RB et RBase
- RAB = lorsque le facteur A et B sont présents
- RA = lorsque seulement le facteur A est présent
- RB = lorsque le facteur A n’est pas présent
- RBase = lorsque ni le facteur A ni le facteur B ne sont présents
Comment connaître ma proportion de cas ou risque relatif attribuable à l’interaction et si cette proportion est forte ou pas
- Ri ou RRi / Rab ou RRab
- Si le résultat est plus grand que l’effet unique combiné de Ra et Rb alors la proportion est forte
Comment savoir si je dois utiliser la méthode additive ou multiplicative
- Additionner Ra et Rb, faire pareil en les multipliant
- Si un des résultats donne le même que Rab alors on prend l’autre
Comment savoir avec le modèle additif si mes facteurs sont indépendants (pas d’interaction)
- Mon Ri ou RRi doit être de 0 pour être indépendant
Comment savoir avec le modèle multiplicatif si j’ai une interaction
- Mon résultat du modèle multiplicatif doit être autre que 1 pour avoir une interaction sur l’échelle multiplicative
Comment tester si j’ai une variation entre mes strates
- Test hétérogénéité = test d’interaction pour deux strates
- Je regarde si ma valeur de x2 est plus grande que mon seuil obtenu pour mon alpha
- Si oui alors mon exposition modifie mon association
Quelles sont les étapes menant aux choix de la meilleure mesure d’association à présenter
- Analyse brute
- Mesure d’association par strate
- Interaction avec test hétérogénéité
Additive = si pas égale à 0
Multiplicative = si pas égale à 1 - Pas d’interaction = confusion en regardant si différence de 10%
- Si confusion on présente la mesure standardisée ou stratifiée MH ou modélisée
Comment faire différence dans un graphique entre un graphique sans effet modifiant sur échelle additive et multiplicative
- additive = deux lignes parallèles
- multiplicative = deux lignes non parallèles
Est-ce que le fait de ne pas tenir compte de l’interaction biaise la mesure
- Non mais il y a perte d’Information à travers les strates
Sur quelle échelle (biologique ou statistique) parle-t-on d’effet modifiant
- échelle statistique
- modifiant = interaction sur cette échelle
sur l’échelle statistique, quand il n’y a pas d’interaction sur l’échelle multiplicative est-ce qu’il y en a une sur l’échelle additive
oui
comment choisir entre échelle biologique ou statistique
- biologique = regarde si interaction de A et B a un effet sur la maladie
- statistique = regarde si l’association entre A et la maladie est modifié par B = risque relatif
si mes strates sont homogènes (de même valeur) est-ce qu’il y a une interaction
non
la mesure du risque (ou proportion du risque) attribuable à l’interaction peut être mesurer pour quoi
- facteurs de risques
- facteurs protecteurs
seulement facteur de risques, donc on ne peut pas pour les facteurs protecteurs (valeur négative)
Comment savoir si j’ai une absence interaction sur l’échelle additive et multiplicative
- Additive = absence si ma différence de risque avec groupe non exposé est la même tout au long des différents points
- Multiplicative = absence si mon rapport de risque avec groupe non exposé est la même tout au long des différents points
À quoi faire attention avec les interactions sur l’échelle multiplicative
- Il est possible de ne pas avoir d’interaction sur l’échelle multiplicative, mais que la même ligne en ait une sur le modèle additif
Comment savoir si mon interaction est négative ou positive
- Regardé si ma différence ou rapport de risque augmente (positive) ou diminue (négative) avec mon avancement dans les données
Qu’est-ce qu’un modèle ?
- Applique une équation mathématique aux données d’une étude épidémiologique
- Pour décrire la relation entre une exposition et la survenue d’un événement de santé
La modélisation est utilisée pour quelles deux fonctions
- Prédiction = estimer le risque en fonction de l’information fournie par des prédicteurs
- Contrôle de la confusion = évaluer le rôle causal d’un ou plusieurs facteurs en contrôlant simultanément pour l’effet d’autres facteurs de confusion
Est-ce que la modélisation permet de tenir compte d’autres variables
oui
Pourquoi la modélisation est utile dans les recherches causales
- Car elle permet de contrôler de manière simultanée l’influence de plusieurs facteurs confondants
Qu’est-ce qu’une droite de régression
- Estime les valeurs moyennes de la variable Y selon les valeurs de la variable X
Dans mon équation pour la droite de régression linéaire, que représente ŷ, a0 et a1
- Ŷ = valeur estimée de Y pour toute valeur donnée de x
- A0 = ordonnée à l’origine
- A1 = pente de la droite
Comment interpréter la valeur de la pente
- La valeur obtenue pour la pente indique qu’on estime que le nombre de survenu de l’événement devrait augmenter ou diminuer de la valeur obtenue pour chaque exposition en plus
- L’augmentation absolue du risque de l’événement par l’exposition
- Avec une variable dichotomique = différence de taux entre les exposés et non-exposés
Dans le modèle linéaire généralisé, est-ce qu’il peut y avoir plus d’un facteur dans l’équation
oui
Les modèles linéaires généralisé avec plus d’un facteur peuvent être utilisé comme alternative à quoi
- À la stratification pour contrôler la confusion
Pourquoi les modèles linéaires généralisé avec plus d’un facteur peuvent être utilisé comme alternative à la stratification
- Chaque facteur est ajusté pour l’effet des autres facteurs
- Donnant ainsi une valeur non biaisée mutuellement pour chacun des facteurs
Quelle est la particularité de la variable dépendante (x)
- Elle ne peut pas avoir une valeur négative = l’exposition ne peut pas être négative
Comment interpréter les coefficients dans mon équation de régression
- 2,718 exposants mon coefficient
- Si le résultat obtenu est supérieur de 1, on fait -1 = pour chaque augmentation de l’exposition, la cote de l’événement augmente du pourcentage obtenu
- Si le résultat obtenu est inférieur à 1, on fait 1 – résultat obtenu = le fait d’avoir l’exposition x réduit la probabilité d’avoir l’événement de x pourcent
Dans le modèle linéaire généralisé comment avoir ma mesure d’association avec seulement mon coefficient
- 2,718 exposants mon coefficient
Si j’ai une variable continue j’utilise quel modèle et quand j’ai une variable dichotomique
- Continue = régression linéaire
- Dichotomique = régression logistique
Principale avantage du modèle de régression multivariée comparativement aux analyses stratifiées
- Facilité du contrôle des variables confondantes
À quoi ressemblera ma droite de régression si j’inclue l’âge et le terme d’exposition
- J’aurai deux droites, une pour l’âge chez les non-exposé et une pour l’âge chez les exposés
À quoi il faut faire attention pour utiliser le modèle de régression
- Que le modèle linéaire colle bien aux données, sinon il faut utiliser un autre modèle
Quoi faire si je ne sais pas choisir entre modèle de régression ou relation curviligne
- Meilleure solution = analyse stratifiée
Comparatif entre analyses stratifiées et modélisation
- Modélisation = multivariée = plus performantes mais demande un modèle approprié et devrait être utilisé en appui des analyses stratifiées
- Stratifiée = permettent de bien visualiser la distribution des données mais ne contrôle pas simultanément de nombreux facteurs confondants
La modélisation peut servir à prédire la survenu d’une maladie pour un individu
oui
Le modèle de prédiction de la modélisation ne fait pas de distinction entre l’association causale et les autres
vrai
Quand est-ce que je privilégie la régression multiple à l’analyse stratifiée
- Lorsque j’ai plus de 2 effet confondant important / modéré
Qu’est-ce que le surajustement d’un modèle de régression
- Quand le nombre d’observations ou encore le nombre d’événements limitent les modèles (pas avoir assez de données)
- On peut se tourner vers des scores résumés pour les facteurs confondants
- Score de risque de maladie ou Score de propension
Différence entre biais d’information différentiel et non-différentiel
- Différentiel = le fait d’être malade ou non va varié l’exposition OU le fait d’être exposé ou non va varié la maladie
- Non-différentiel = le fait d’être malade ou non OU d’être exposé ou non n’a aucun impact sur l’exposition ou la maladie
Est-ce les biais d’information différentiel qui sous-estime tout le temps
- Non-différentiel
Différence entre biais de sélection et biais de confusion
- Sélection = est-ce que la population sélectionnée a des caractéristiques semblables à celle cible
- Confusion = une troisième valeur vient biaisée l’association
Les biais de rappel et de désirabilité sociale sont de quel type
- Biais d’information
quel modèle est utilisé pour la régression linéaire
- modèle additif
comment savoir s’il y a une interaction dans la régression linéaire
- voir s’il y a une différence de 10% entre valeur brute et ajustée
quel modèle est utilisé pour la régression linéaire généralisée
modèle multiplicatif
quelle transformation est faite pour la régression linéaire généralisée et pourquoi
- logarithmique
- variable dépendante peut seulement prendre des valeurs positives ou binaires
quel modèle est utilisé pour la régression logistique
modèle multiplicatif
pourquoi utilisé la régression logistique
- permet ‘avoir des rapports de cotes
- seulement pour des variables dichotomiques
quelle transformation est faites pour la régression logistique
logit