Cours 10 Flashcards

1
Q

Quels sont les avantages des analyses longitudinales sur les analyses transversales? (3)

A
  1. Plusieurs observations par individu, donc plus de degrés de liberté = plus de puissance 2. Capacité à isoler les variations dans la VD attribuables aux différences individuelles (séparer la variation « intra individuelle » et « inter individuelle ») 3. Capacité à étudier le changement
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Comparativement aux analyses transversales, les analyses longitudinales ont (au moins) quatre défis supplémentaires. Quels sont-ils?

A
  1. La dépendance temporelle des observations : les observations ne sont plus indépendantes, mais par « grappes » ( clusters) 2. L’attrition (données manquantes) 3. Les variables confondantes qui varient temporellement 4. On peut s’intéresser au comportement du groupe (modèle marginal) ou au comportement de chaque individu (modèle « subject specific » ou conditionnel). -> L’analyste peut modéliser le point de départ ( moyen du groupe ou les points de départ de chaque individu. -> L’analyste peut modéliser la trajectoire (la pente) moyenne du groupe ou la trajectoire de chaque individu.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Si je fais une ANOVA et que je ne tiens pas compte de la dépendance temporelle des données, qu’est-ce que je fais?

A

C’est comme si j’avais regardé les temps comme des groupes dépendants.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Que représente cette formule?

A
y = valeur de la VD pour le ie sujet au je traitement
u = intercept (grande moyenne)
s = effet du ie sujet
t = effet du je traitement
e = erreur de mesure du ie sujet au je traitement

Modèle individuel qui contient un effet fixe (traitement) et un effet aléatoire (sujet). Modèle statistique (ANOVA) avec contrôle de la dépendance.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Expliquer cette table d’ANOVA en blocs aléatoires.

A
  • *Traitement:** Effet du traitement
  • *Sujet:** Effet du sujet. Variance associé à la différence individuelle (de chaque sujet), qui ramasse une partie de SC. Une autre façon de le voir c’est que la variance des sujets nous donne des info sur la dépendance des variations dans le temps. On peut séparer les influences entre ce qui est inter sujet et ce qui est intra sujet.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quel est le parallèle entre l’ANOVA en bloc aléatoires et l’ANCOVA et de où la SCsujet provient?

A

La SCsujet provient de l’erreur, on réduit l’erreur (SC, ddl, puis MC et donc le F). On isole une source de variabilité de notre VI, donc c’est une forme de contrôle de la variance (pas une covariable, c’est un effet bloc). En rajoutant l’effet sujet, on a capturé la dépendance entre les cas (en isolant la variance des sujets), ce qui a augmenté notre puissance donc peut nous donner un résultat significatif où il y en avait pas avant.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Dans une ANOVA en blocs aléatoires (mesures répétées), l’estimé de variance des sujets corresponds à la […].

A

ans une ANOVA en blocs aléatoires (mesures répétées), l’estimé de variance des sujets corresponds à la covariance entre les temps.

Donc, si on divise la covariance par l’estimé de variance totale, on obtient la corrélation entre les temps.

  • Ici, 0.59 est une forte corrélation donc ça valait la peine de la prendre en compte. Sinon on peut dire que 59% de la variance totale est dû au sujet (à voir dans les prochains cours to be sure though).*
  • > Donc, avec un modèle assez simple on a pu estimer le degré de corrélation entre les temps et de l’isoler pour que mes observations ne soient plus contaminées par la dépendance des observations.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Dans l’ANOVA à mesures répétées, le contrôle de la dépendance temporelle permet de réduire le […] en isolant la variation attribuable aux différences individuelles, et permet ainsi d’augmenter la valeur du […] et ainsi la
puissance statistique.

A

Dans l’ANOVA à mesures répétées, le contrôle de la dépendance temporelle permet de réduire le terme d’erreur en isolant la variation attribuable aux différences individuelles, et permet ainsi d’augmenter la valeur du test statistique (F) et ainsi la
puissance statistique.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Dans l’ANOVA à mesures répétées, l’estimé de variance des participants permet de calculer la […].

A

Dans l’ANOVA à mesures répétées, l’estimé de variance des participants permet de calculer la corrélation entre les temps.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Dans l’ANOVA à mesures répétées, la dépendance temporelle est modélisée à l’aide d’une matrice de variance-covariance […].

A

Dans l’ANOVA à mesures répétées, la dépendance temporelle est modélisée à l’aide d’une matrice de variance-covariance entre les temps.

C’est une matrice symmétrique (Cov t1-2 = Cov t2-t1), la corrélation n’est pas lié à l’ordre d’entrée des paires.
Ce qui est rigide dans l’analyse de mesures répétées et l’assymétrie composée (toutes les covariances doivent être identiques et les variances doivent être identiques). Ça veut dire que la variance au temps 1 est égale au temps 2, etc.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Expliquer le postulat de symétrie composée (matrice variance-covariance) de l’ANOVA à mesures répétées.

A

Les corrélations (covariance) entre les paires de temps sont toutes identiques:

COVT1-T3 = COVT1-T2 = COVT2-T3

-> Mise en contexte, on va passer d’un cas avec peu de variance en pré et bcp en post ou le contraire. Donc à moins d’avoir une étude observationnelle ou il n’y a pas de manipulation, il est presqu’impossible que la variance ne bouge pas entre les temps.

Les variances pour chaque temps sont toutes identiques :

VART1 = VART2 = VART3

-> Plus le temps passe, plus les corrélations diminuent (phénomène d’auto-corrélation) OR le modèle demande que les corrélations restent inchangés indépendamment du temps.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quelles sont les limites de l’ANOVA à mesures répétées? (3)

A
  1. Les participants avec 1+ observation manquante sont retirés ( listwise deletion). Analyse très couteuse
  2. Les covariables temporelles ne peuvent pas être incluses (seulement les covariables qui ne varient pas)
  3. Si la dépendance temporelle ne respecte pas la symétrie composée , les corrections recommandées réduisent la puissance (Huynh Feldt , Greenhouse Geisser , Box)
    1. Il y a des corrections proposées pour ces mesures, mais le paradoxe de ces corrections est que non seulement le modèle n’est pas très puissant mais les corrections corrigent à la baisse donc encore plus difficile de trouver des différences significatives.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quelles sont les deux solutions ad hoc pour gérer les données manquantes de l’ANOVA à mesures répétées?

A
  1. Imputation par la dernière donnée disponible (LOCF)
    1. Problèmes : réduit la variance et la grandeur d’effet, augmente artificiellement les corrélations entre les temps et le nombre de degrés de liberté
  2. Imputation par maximum de vraisemblance (EM, MI)
    1. Problème : l’ajout d’observations imputées augmente artificiellement le nombre de degrés de liberté
    2. Moins pire que LOCF mais crée une augmentation artificielle (va avoir la puissance de 100% des données alors qu’on n’a pas 100% des données)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Les modèles linéaires mixtes constituent une approche alternative à l’ANOVA pour analyser des données selon un […] (simple, factoriel, mesures répétées, split plot, etc)

A

Les modèles linéaires mixtes constituent une approche alternative à l’ANOVA pour analyser des données selon un plan d’expérience (simple, factoriel, mesures répétées, split plot, etc)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

VRAI ou FAUX

Un modèle mixte est une analyse de variance qui n’utilise pas les SC pour produire des rapports F.

A

VRAI

Un modèle mixte est une analyse de variance qui n’utilise pas les SC pour produire des rapports F.

En fait, on peut dire que le modèle mixte est une ANOVA où on relaxe certains postulats (si les postulats sont respectés, les deux approches donnent exactement les mêmes résultats)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quels sont les avantages du calcul des rapports F à l’aide d’une méthode par maximum de vraisemblance (Modèle linéaire mixte)? (3)

A
  1. Ne demande pas la présence de données complètes.
    1. Le maximum de vraisemblance va utiiser ce qui est dispo dans le jeu de données.
  2. Estimation plus robuste aux données extrêmes et aux petits échantillons
  3. Les conclusions sont généralisables à la population (écart types ne sont plus disponibles et sont remplacés par des erreurs standards, comme en ANCOVA
    1. On ne fait pas de données brutes sur la variabilité (écart-types), on travaille sur les marges (donc ex on à l’erreur standard, etc.)
17
Q

Le modèle linéaire mixte combine deux types d’effets, quels sont-ils?

A
  1. Un ou plusieurs effet(s) fixe(s)
  2. Un ou plusieurs effet(s) aléatoire(s)

** Effet = variable indépendante

18
Q

Qu’est-ce qu’un effet fixe dans un modèle linéaire mixte et quelles sont les conséquences de cet effet?

A

Qu’est ce qu’un effet fixe

  • Les niveaux de la variable indépendante constituent l’ensemble des niveaux d’intérêt
  • Le paramètre estimé est une constante
  • Ce sont des constantes, indépendamment de l’individu qui entre dans le modèle, je vais obtenir une constante qui ne dépend pas de la personne. L’équation va me donner ça pour tous les sujets dans l’échantillon.

Conséquence:

Chaque participant à la même valeur de l’effet fixe, qui corresponds à l’effet moyen pour l’ensemble des participants.

19
Q

Qu’est-ce qu’un effet aléatoire dans un modèle linéaire mixte et quelles sont les conséquences de cet effet?

A

Qu’est ce qu’un effet aléatoire:

  • Les niveaux de la variable indépendante constituent un sous ensemble de la population (un échantillon) des niveaux existants
  • Le paramètre estimé est une variable (qui a sa valeur et sa variance)
  • C’est un effet qui varie selon l’individu. C’est un échantillon des effets possibles.

Conséquence:
Chaque participant a une valeur individuelle de l’effet aléatoire. Il y a donc une variabilité (variance) dans ces valeurs.

20
Q

VRAI ou FAUX

Le modèle linéaire mixte a les mêmes objectifs et les mêmes résultats que les ANOVAS sur des données complètes

A

VRAI

21
Q

Le modèle linéaire mixte ne présente pas les limites des ANOVAs. Quelles sont les différences? (3)

A
  1. Les données manquantes sont possibles (selon patron MCAR ou MAR), sans besoin d’imputation
    1. On s’attend à ce que les données manquantes soient at random or completely at random au moins.
  2. Les covariables temporelles (qui varient selon le temps de mesure) sont possibles
  3. Une plus grande souplesse dans la spécification des relations temporelles (la forme de la matrice ∑)
22
Q

Dans le modèle linéaire mixte, que signifie une souplesse des relations temporelles?

A

Souplesse des relations temporelles = spécification d’une matrice ∑ (spécification de sigma) qui « capture » le patron réel de relations observées entre les paires de temps.

Sigma au carré = variance

Sigma = covariance

23
Q

Dans cette figure, quel type de matrice est associé à chaque lettre? Expliquer ces matrices.

A

A. Symétrie composée: Matrice à 4 (par exemple) temps où les variances sont mêmes et les covariances aussi.

B. Indépendante: On a seulement la variance. La covariance est de 0. Je m’attends donc à n’avoir aucune corrélation entre les temps.

C. Toeplitz: L’indice change de valeur dans cette matrice car la colonne 1 capture seulement la relation entre le temps 1 et 2, etc (ici on a 4 temps). Toutes les colones ont un “gap” d’un temps de mesure (1). Selon cette matrice, la relation dépend de la longueur de ce “gap”. Permet d’avoir une estimation pour les “gap” de 2, etc. Utile lorsqu’on croit que notre corrélation diminue avec le temps.

D. Non-structurée: Chaque corrélation et chaque variance est unique. On a donc énormément de flexibilité pour estimer la relation entre les variables. Donne énormément de paramètres.

24
Q

Que signifie ce tableau du modèle linéaire mixte?

A

Valeurs des effets fixes (intercept et temps)

Moyenne de la variable dépendante

Intercept: 18.1

Temps 1: 18.1 + 4 (comparé au temps 2)

Temps 2: 18.1 (intercept utilise temps 2 comme comparaison)

Estimation du modèle : 4.32

Changement non significatif (p = 0.94, intervale de confiance contient un 0), mais proche

25
Q

Que signifie ce tableau dans un modèle linéaire mixte? Expliquer ce que signifie les résultats

A

Tableau des variances

Variance des sujets (sigma/covariance associé au sujet, à l’extérieur de la diagonale) : 12.63

Variance résiduelle (variance de la diagonale de la matrice): 8.90

Variance totale (Matrice des temps: Sigma au carré + sigma au carré): 12.63 + 8.90 = 21.53

-> Ces résultats me disent qu’à peu près la moitié de la variance est associée aux sujets et le reste est résiduelle.

*Matrice: Ici, on parle de la matrice de symétrie composée

26
Q

Que signifie ce tableau dans un modèle linéaire mixte? Expliquer ce que signifie les résultats.

A

Valeur des moyennes ajustées

Ces moyennes utilisent l’ensemble des données disponibles et sont ajustées pour le patron des données manquantes (i.e., utilise l’information disponible pour estimer la performance attendue

Moyenne au temps 1: 22.47

Moyenne au temps 2: 18,1

Erreur standard temps 1: 2.02

Erreur standard temps 2: 2.02

-> Dans un modèle linéaire mixte, il n’y a pas d’écart-type. Ce sont des erreurs standard

27
Q

VRAI ou FAUX

Les modèles linéaires mixtes ne font pas d’ajustement au niveau des degrés de libertés, seulement au niveau des données manquantes

A

FAUX

Les modèles mixtes font des ajustements au niveau des degrés de liberté pour refléter que nous avons moins d’information que le nombre de sujets dans votre base de données. Les degrés de liberté sont donc ajustés pour le N effectif.

28
Q

Pour ajuster en fonction des données manquantes, il est possible d’utiliser la méthode […] ou des […].

Le modèle linéaire mixte fait un compromis entre les deux où il donne plus de […] à ce qui est disponible.

A

Pour ajuster en fonction des données manquantes, il est possible d’utiliser la méthode listwise (selon la moyenne des scores de changement calculé) ou des données disponibles (selon la différence entre les deux moyennes calculées sur l’ensemble des données disponibles).

Le modèle linéaire mixte fait un compromis entre les deux où il donne plus de poids à ce qui est disponible. Il pondère différement les évidences selon la qualité des informations disponibles.

29
Q

Comment est calculé l’ajustement des moyennes dans le modèle linéaire mixte?

A
  1. La moyenne de tous les scores pour les sujets complets
  2. La moyenne des scores disponibles pour les sujets non complets
  3. Ces deux moyennes sont combinées en donnant un poids à chaque moyenne selon l’inverse de la variance (1 / VAR) des données incluses dans cette moyenne

Méthode très utilisée en statistique (e.g., méta analyse). Rationnel : plus une variable a une forte variance, moins elle est fiable ” et donc plus le poids 1/VAR sera petit.

30
Q

VRAI ou FAUX

Le modèle linéaire mixte fait des imputations pour ajuster les données manquantes.

A

FAUX

Il faut se rappeler que le modèle mixte ne fait pas d’imputation (il ne remplace pas la donnée manquante par une donnée « réaliste »)

Les moyennes de chaque temps sont plutôt ajustées selon un principe similaire à l’ANCOVA(si je suis en bas de ma moyenne, je suis ajustée à la hause et vis versa).

31
Q

Le modèle linéaire mixte permet de définir la forme des relations entre […] (matrice ∑ ). On peut tester plusieurs […] pour sélectionner la « meilleure » (celle qui présente le meilleur ajustement aux données).

Cela permet d’inclure des covariables […] (varient seulement entre les sujets) et [….] (varie d’un temps à l’autre pour un même sujet)

A

Le modèle linéaire mixte permet de définir la forme des relations entre les temps de mesure (matrice ∑ ). On peut tester plusieurs formes de matrices pour sélectionner la « meilleure » (celle qui présente le meilleur ajustement aux données).

Cela permet d’inclure des covariables inter sujets (varient seulement entre les sujets) et intra sujets (varie d’un temps à l’autre pour un même sujet)

32
Q

Le modèle linéaire mixte est robuste aux données manquantes (si selon patron MCAR ou MAR). Toute l’information disponible pour chaque temps de mesure est utilisée pour produire des[…] tenant compte du patron de
[…].

L’inférence est réalisée sur les […], sans perte (listwise deletion ) ni […] (imputation).

A

Le modèle linéaire mixte est robuste aux données manquantes (si selon patron MCAR ou MAR). Toute l’information disponible pour chaque temps de mesure est utilisée pour produire des moyennes ajustées tenant compte du patron de
données manquantes.

L’inférence est réalisée sur les moyennes ajustées, (sans perte listwise deletion ) ni ajout de données (imputation).

33
Q

Le modèle linéaire mixte (MLM) a pour condition que la VD soit distribuée selon une […]

A

Le modèle linéaire mixte (MLM) a pour condition que la VD soit distribuée selon une loi normale

Toutefois, il existe une extension au MLM qui relaxe ce postulat et permet d’avoir une VD distribuée selon loi binomiale, ordinale, de Poisson, etc.

=> C’est le modèle mixte généralisé.

34
Q

Quelles sont les étapes SPSS pour un modèle linéaire mixte ? (4)

A
  1. Saisir les données en format long
  2. Établir le patron de données manquantes
  3. Réaliser un modèle linéaire mixte sur la VD. Ex = agressivité, avec deux effets fixes : non répété (sexe) et un facteur répété (âge ), et un effet aléatoire (enfant)
  4. Vérification des postulats sur les résidus (normalité, linéarité, homogénéité des variances, outliers )