Analyse multivariée Flashcards
Rappel: Variable dépendante vs indépendante
variable dépendante = variable dont l’effet ou la valeur dépend d’autres variables
variable indépendante ou appelée encore variable explicative = une variable qui affecte le phénomène ou l’événement étudié (donc qui affecte la variable dépendante) .
Qu’est-ce qu’une regression linéaire?
- Méthode qui produit un coefficient qui donne l’amplitude du changement de la variable dépendante pour chaque unité de la varibale indépendante
- Est utilisée lorsque la variable dépendante est une variable quantitative continue
Rappel: Nommer les 3 types de biais
- Sélection
- Information
- Confusion
Rappel: Comment gérer les biais de sélection et d’informations?
- Les biais d’information et de sélection sont définitifs et impossibles à corriger au moment de l’analyse.
- Ils doivent donc être discutés avant le début de l’étude et leurs effets doivent être évalués lors de l’analyse
Rappel: Biais/facteur de confusion
= un tiers facteur qui fausse la mesure de la liaison entre l’exposition et la maladie.
- Est lié à la survenue de la maladie indépendamment de l’exposition étudiée.
- Est lié à l’exposition sans en être la conséquence
- Peut surestimer, sous-estimer ou masquer l’effet
- Il en existe 2 types de tiers facteur: facteurs de confusion et modificateurs de l’effet (aka facteur modifiant ou d’interaction)
Tiers facteur: Le facteur de confusion/confondant
= Lorsque les RR de chaque strate sont similaires, mais différents du RR brut
⇒ Il y a donc un biais
Tiers facteur: Facteur modifiant/modificateur de l’effet
= lorsque les RR entre les strates ont une différence de plus de 20% (cela signifie que la relation entre le facteur et la maladie n’est pas identique selon les strates du tiers facteur qui modifie l’association)
⇒ Sans qu’il y ait totalement un biais, l’effet est modifié par le facteur
Tiers facteur: comment gérer leur présence? (Modification vs Confusion)
Facteur de confusion: doit être évité:
- Présenter les mesures d’association spécifiques pour chacune des strates de la variable confondante (attention: pratique si juste une variable confondante, mais pas à plusieurs) ⇒ Analyse stratifiée
- Présenter une mesure d’association ajustée ⇒ Analyse multivariée
Facteur modifiant: Doit être rapporté:
- Présenter les mesures d’association spécifiques pour chacune des strates de la variable confondante (attention: pratique si juste une variable confondante, mais pas à plusieurs) ⇒ Analyse stratifiée
- Tenir compte des modifications dans l’analyse
**Pas d’analyse multivarié avec facteur modifiant, car peut faire perdre des infos précieuses
Analyse stratifiée
- Consiste à présenter l’association entre le facteur et la maladie séparément pour chaque strate du tiers facteur pris en compte
- Possibilité d’utiliser la méthode d’ajustement de Mantel-Haenszel:
- Consiste à scinder le facteur de confusion en classes, à calculer le risque entre l’exposition et la maladie pour chaque classe puis à calculer le risque ajusté de Mantel-Haenszel
- Peut être utilisée lorsqu’on désire ajuster un RR , un rapport de cotes ou rapport de taux d’incidence
- N’est utilisée qu’en analyse stratifiée et elle donc limitée par le nombre de strates pouvant être crées
Analyse multivariée: Définition & Objectifs
= outil statistique
Utilités
- Permet de mesurer l’effet simultané de plusieurs variables explicatives sur une variable dépendante
- Permet de contrôler les biais de confusion
- Svt utile dans les essais cliniques randomisés
Ce qu’elle nous permet d’obtenir:
des mesures d’association ajustées
Analyse multivariée: Quelle est l’étape préliminaire avant de se lancer dans l’analyse? Pourquoi?
- Avant de se lancer dans une analyse multivariée, il est indispensable de rechercher dans la littérature, de la façon la plus exhaustive possible, les facteurs de risque susceptibles d’être impliqués dans la genèse ou le pronostic du problème de santé étudiée.
- Une fois que ces covariables ont été identifiées, la première étape consistera toujours en une série d’analyses univariées pour sélectionner les variables qui seront introduites secondairement dans le modèle multivarié
Analyse multivariée: 3 méthodes possibles
- Chacune sur un modèle mathématique et sur un ensemble de conditions d’application
- Le modèle mathématique représente la variable dépendante en fonction de différentes variables indépendantes ⇒ sert à décrire ou prédire un phénomène
Analyse multivariée: Score de propension
Lorsque l’on utilise un modèle multivarié qui permet de remplacer un ensemble de variables indépendantes en un seule variable que l’on appelle Score de propension
**très utile lorsque le phénomène est rare**
Analyse multivariée: Régression multiple
= généralisation de la régression linéaire simple dans laquelle on considère plusieurs variables indépendantes
y = ß0 + ß1X1 + ß2X2 + …..
Interprétation
- B = coefficient de régression ⇒ nous renseigne sur l’importance de la relation entre une variable dépendante et indépendante
- R2 = coefficient de détermination multiple ⇒ indique quelle proportion de la variation de la variable dépendante est attribuable à l’ensemble des varibales indépendantes incluses dans le modèle
(Ex: Si R2 = 0.2, Les variables indépendantes incluses dans l’étude expliquent 20 % de la variation de la variable indépendante)
Analyse multivariée: Régression logistique
= technique utilisée lorsque la mesure d’association est un rapport de cote et que la variable dépendante est catégorielle et dichotomique
Plusieurs conditions doivent être respectées:
- on recommande habituellement une taille d’échantillon de 400 minimum
- On ne doit pas analyser plus de √n covariables ou variables indépendantes
Interprétation:
- Les coefficients de régression sont transformés en rapport de cote ajustés
- Le rapport de cote qui varie entre o et l’infini quantifie la force de l’association entre la variable dépendante et la variable indépendante
- Plus l’association est forte, plus le RC tend vers 0, si le facteur est protecteur, ou vers l’infini dans le cas d’un facteur de risque