Cours 10 Flashcards
Quels sont les avantages des analyses longitudinales sur les analyses transversales? (3)
- Plusieurs observations par individu, donc plus de degrés de liberté = plus de puissance 2. Capacité à isoler les variations dans la VD attribuables aux différences individuelles (séparer la variation « intra individuelle » et « inter individuelle ») 3. Capacité à étudier le changement
Comparativement aux analyses transversales, les analyses longitudinales ont (au moins) quatre défis supplémentaires. Quels sont-ils?
- La dépendance temporelle des observations : les observations ne sont plus indépendantes, mais par « grappes » ( clusters) 2. L’attrition (données manquantes) 3. Les variables confondantes qui varient temporellement 4. On peut s’intéresser au comportement du groupe (modèle marginal) ou au comportement de chaque individu (modèle « subject specific » ou conditionnel). -> L’analyste peut modéliser le point de départ ( moyen du groupe ou les points de départ de chaque individu. -> L’analyste peut modéliser la trajectoire (la pente) moyenne du groupe ou la trajectoire de chaque individu.
Si je fais une ANOVA et que je ne tiens pas compte de la dépendance temporelle des données, qu’est-ce que je fais?
C’est comme si j’avais regardé les temps comme des groupes dépendants.
Que représente cette formule?
y = valeur de la VD pour le ie sujet au je traitement u = intercept (grande moyenne) s = effet du ie sujet t = effet du je traitement e = erreur de mesure du ie sujet au je traitement
Modèle individuel qui contient un effet fixe (traitement) et un effet aléatoire (sujet). Modèle statistique (ANOVA) avec contrôle de la dépendance.
Expliquer cette table d’ANOVA en blocs aléatoires.
- *Traitement:** Effet du traitement
- *Sujet:** Effet du sujet. Variance associé à la différence individuelle (de chaque sujet), qui ramasse une partie de SC. Une autre façon de le voir c’est que la variance des sujets nous donne des info sur la dépendance des variations dans le temps. On peut séparer les influences entre ce qui est inter sujet et ce qui est intra sujet.
Quel est le parallèle entre l’ANOVA en bloc aléatoires et l’ANCOVA et de où la SCsujet provient?
La SCsujet provient de l’erreur, on réduit l’erreur (SC, ddl, puis MC et donc le F). On isole une source de variabilité de notre VI, donc c’est une forme de contrôle de la variance (pas une covariable, c’est un effet bloc). En rajoutant l’effet sujet, on a capturé la dépendance entre les cas (en isolant la variance des sujets), ce qui a augmenté notre puissance donc peut nous donner un résultat significatif où il y en avait pas avant.
Dans une ANOVA en blocs aléatoires (mesures répétées), l’estimé de variance des sujets corresponds à la […].
ans une ANOVA en blocs aléatoires (mesures répétées), l’estimé de variance des sujets corresponds à la covariance entre les temps.
Donc, si on divise la covariance par l’estimé de variance totale, on obtient la corrélation entre les temps.
- Ici, 0.59 est une forte corrélation donc ça valait la peine de la prendre en compte. Sinon on peut dire que 59% de la variance totale est dû au sujet (à voir dans les prochains cours to be sure though).*
- > Donc, avec un modèle assez simple on a pu estimer le degré de corrélation entre les temps et de l’isoler pour que mes observations ne soient plus contaminées par la dépendance des observations.
Dans l’ANOVA à mesures répétées, le contrôle de la dépendance temporelle permet de réduire le […] en isolant la variation attribuable aux différences individuelles, et permet ainsi d’augmenter la valeur du […] et ainsi la
puissance statistique.
Dans l’ANOVA à mesures répétées, le contrôle de la dépendance temporelle permet de réduire le terme d’erreur en isolant la variation attribuable aux différences individuelles, et permet ainsi d’augmenter la valeur du test statistique (F) et ainsi la
puissance statistique.
Dans l’ANOVA à mesures répétées, l’estimé de variance des participants permet de calculer la […].
Dans l’ANOVA à mesures répétées, l’estimé de variance des participants permet de calculer la corrélation entre les temps.
Dans l’ANOVA à mesures répétées, la dépendance temporelle est modélisée à l’aide d’une matrice de variance-covariance […].
Dans l’ANOVA à mesures répétées, la dépendance temporelle est modélisée à l’aide d’une matrice de variance-covariance entre les temps.
C’est une matrice symmétrique (Cov t1-2 = Cov t2-t1), la corrélation n’est pas lié à l’ordre d’entrée des paires.
Ce qui est rigide dans l’analyse de mesures répétées et l’assymétrie composée (toutes les covariances doivent être identiques et les variances doivent être identiques). Ça veut dire que la variance au temps 1 est égale au temps 2, etc.
Expliquer le postulat de symétrie composée (matrice variance-covariance) de l’ANOVA à mesures répétées.
Les corrélations (covariance) entre les paires de temps sont toutes identiques:
COVT1-T3 = COVT1-T2 = COVT2-T3
-> Mise en contexte, on va passer d’un cas avec peu de variance en pré et bcp en post ou le contraire. Donc à moins d’avoir une étude observationnelle ou il n’y a pas de manipulation, il est presqu’impossible que la variance ne bouge pas entre les temps.
Les variances pour chaque temps sont toutes identiques :
VART1 = VART2 = VART3
-> Plus le temps passe, plus les corrélations diminuent (phénomène d’auto-corrélation) OR le modèle demande que les corrélations restent inchangés indépendamment du temps.
Quelles sont les limites de l’ANOVA à mesures répétées? (3)
- Les participants avec 1+ observation manquante sont retirés ( listwise deletion). Analyse très couteuse
- Les covariables temporelles ne peuvent pas être incluses (seulement les covariables qui ne varient pas)
- Si la dépendance temporelle ne respecte pas la symétrie composée , les corrections recommandées réduisent la puissance (Huynh Feldt , Greenhouse Geisser , Box)
- Il y a des corrections proposées pour ces mesures, mais le paradoxe de ces corrections est que non seulement le modèle n’est pas très puissant mais les corrections corrigent à la baisse donc encore plus difficile de trouver des différences significatives.
Quelles sont les deux solutions ad hoc pour gérer les données manquantes de l’ANOVA à mesures répétées?
- Imputation par la dernière donnée disponible (LOCF)
- Problèmes : réduit la variance et la grandeur d’effet, augmente artificiellement les corrélations entre les temps et le nombre de degrés de liberté
- Imputation par maximum de vraisemblance (EM, MI)
- Problème : l’ajout d’observations imputées augmente artificiellement le nombre de degrés de liberté
- Moins pire que LOCF mais crée une augmentation artificielle (va avoir la puissance de 100% des données alors qu’on n’a pas 100% des données)
Les modèles linéaires mixtes constituent une approche alternative à l’ANOVA pour analyser des données selon un […] (simple, factoriel, mesures répétées, split plot, etc)
Les modèles linéaires mixtes constituent une approche alternative à l’ANOVA pour analyser des données selon un plan d’expérience (simple, factoriel, mesures répétées, split plot, etc)
VRAI ou FAUX
Un modèle mixte est une analyse de variance qui n’utilise pas les SC pour produire des rapports F.
VRAI
Un modèle mixte est une analyse de variance qui n’utilise pas les SC pour produire des rapports F.
En fait, on peut dire que le modèle mixte est une ANOVA où on relaxe certains postulats (si les postulats sont respectés, les deux approches donnent exactement les mêmes résultats)