Cours 12 Flashcards

1
Q

Que représente ce graphique?

A

Un modèle hiérarchique ou multi-niveaux qui tient compte de :
-> la non-indépendance des étudiants dans une même classe

-> la non-indépendance des classes dans un même école

Prédicteur 1: École

Prédicteur 2: Classe

Prédicteur 3: Élève

Donc, les caractéristiques des étudiants, des classes et de l’école peuvent influencer le résultat des étudiants

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est-ce qu’un modèle hiérarchique ou multi-niveaux?

A

Approche de régression/ANOVA qui n’exige pas le respect de l’indépendance des observations.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quelles sont les 2 erreurs d’interprétations que les modèles hiérarchiques permettent d’éviter?

A
  1. Appliquer une conclusion de groupe à un individu (ecological fallacy) : examiner les moyennes de groupe et prédire un individu
  2. Appliquer une conclusion individuelle à un groupe (atomistic fallacy/faute) : examiner les données individuelles pour inférer un comportement de groupe.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quelle est la taille d’échantillon nécessaire pour les modèle multi-niveaux?

A

Estimation par maximum de vraisemblance : >60 observations si 5 ou moins paramètres, >20 unités de niveau 2.

Puissance augmente si plus d’unités de niveau 2 et moins d’unités de niveau 1. Si on a moins d’unités de niveau 2, il faut compenser par des unités de niveau 1 (perte de puissance).

Puissance augmente avec la corrélation intra-classe (dépendance des observations dans un même unité de niveau 2).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Idéalement dans les modèles multiniveaux, on vérifie les postulats (normalité, données extrêmes, collinéarité) pour les observations de niveau […] associées à chaque unité de niveau […].

A

Idéalement dans les modèles multiniveaux, on vérifie les postulats (normalité, données extrêmes, collinéarité) pour les observations de niveau 1 associées à chaque unité de niveau 2.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

VRAI ou FAUX

Les données manquantes n’affectent pas les conclusions des modèles multi-niveaux

A

VRAI

Les données manquantes n’affectent pas les conclusions des modèles multi-niveaux. Elles sont mêmes attendues.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Comme les modèles multiniveaux transversaux, les MML utilisent la théorie des modèles […]. Donc, tous les avantages du modèle […] sont également présents dans cette analyse. Toutefois, l’emphase est sur le changement […].

Le […] est conceptualisé comme une variable continue (comparativement à l’ANOVA/modèle […], où le temps est […]). On regresse l’effet du […] sur la variable dépendante

A

Comme les modèles multiniveaux transversaux, les MML utilisent la théorie des modèles linéaires mixtes. Donc, tous les avantages du modèle mixte sont également présents dans cette analyse. Toutefois, l’emphase est sur le changement temporel.

Le temps est conceptualisé comme une variable continue (comparativement à l’ANOVA/modèle mixte, où le temps est catégoriel).

-> On regresse l’effet du temps sur la variable dépendante

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Les modèles multiniveaux longitudinal conceptualise le temps comme une variable continue. Quels sont les avantages de cela? (3)

A
  1. Les évaluations peuvent être réalisées à des moments différents pour chaque participant (usage du temps calendaire plutôt que intervalles fixes)
  2. Le nombre d’évaluations peut varier selon le participant (pas de « donnée manquante »)
  3. Il est possible d’estimer le changement attendu sur la variable dépendante par unité de temps, et de vérifier si ce changement est affecté par des variables intra-participant (niveau 1) ou inter-participant (niveau 2).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Le […] place l’emphase sur le comportement moyen des individus.

Le […] place l’emphase sur la trajectoire temporelle de chaque individu.

A

Le modèle mixte/ANOVA place l’emphase sur le comportement moyen des individus.

-> La logique est d’estimer une moyenne par temps, de comparer les moyennes et de regarder les variables affectant ces moyennes (facteurs ou covariables)

Le modèle multiniveau longitudinal place l’emphase sur la trajectoire temporelle de chaque individu.

-> La logique est d’estimer une droite de régression pour chaque individu (qui va permettre de résumer sa « trajectoire ») et de regarder le comportement général de ces droites selon des prédicteurs/covariables

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Décriver les 4 trajectoires (Pente et intercept) de ces graphiques.

A

A

Intercept: Faible variabilité

Pente: Faible variabilité

B

Intercept: Faible variabilité

Pente: Forte variabilité

C

Intercept: Forte variabilité

Pente: Faible variabilité

D

Intercept: Forte variabilité

Pente: Forte variabilité

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Expliquer ce graphique et identifier le niveau de chaque variable.

A

A. Sujet = Niveau 2

B. Yst = Niveau 1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Le modèle multi-niveaux le plus simple est un modèle avec seulement un […] (i.e., la performance moyenne varie selon l’individu)

A

Le modèle multi-niveaux le plus simple est un modèle avec seulement un intercept aléatoire (i.e., la performance moyenne varie selon l’individu)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Expliquer ce modèle pour un modèle multi niveau avec seulement un intercept aléatoire.

A

(1) Dit que chaque sujet à sa propre moyenne
(2) Dit que chaque moyenne de sujet est fonction de la grande moyenne et d’une variation de cette moyenne

(1et 2): Venir voir si l’intercept varie entre les individus. Pourquoi? Parce que s’il y a une variation, ça vient justifier l’utilisation de l’analyse multi niveau. MAIS s’il n’y a pas de variation des intercepts (chacune des variations des moyennes des individus est différents de la moyenne générale), ça ne vaut pas la peine de faire de l’analyse multi niveau

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Dans un modèle multi niveau, le fait d’avoir un intercept aléatoire permet de mesurer […] alors qu’un intercept fixe ne permettrait pas cette flexibilité là

A

Dans un modèle multi niveau, le fait d’avoir un intercept aléatoire permet de mesurer la variation de l’individu alors qu’un intercept fixe ne permettrait pas cette flexibilité là (flexibilité qui est présente avant même qu’on parle de temps de mesure)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Dans ce modèle multi niveau, il y a 3 paramètres à estimer. Quels sont-ils?

A

int = grande moyenne de toutes les observations (effet fixe)

var(int)s = variance des intercepts (effet aléatoire) = déviation de la moyenne de chaque sujet par rapport à la grande moyenne

es,t = variance résiduelle intra-sujet (effet aléatoire) = déviation de chaque observation d’un sujet par rapport à la moyenne de ce sujet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Comment peut-on interpréter ce tableau SPSS pour un modèle multiniveau avec un seul intercept aléatoire?

A
  • *On veut voir si ce modèle permet d’estimer si il y a de la variance autour de la grande moyenne pour mes sujets**.
  • *Grande moyenne** (moyenne des moyennes): 23.87 Si je prends toutes mes données, en moyenne l’agressivité est à 23.87).
  • -> Ici, ce qui m’intéresse n’est pas la grande moyenne mais la variation autour de la grande moyenne m’intéresse.*
  • -> Le test t(26.8) = 54.04, p*

Variance des intercepts (variabilité des moyennes de sujet): 3.86. Significative à .008 donc OUI il y a une variation autour de la grande moyenne, OUI il y a une variation de la distribution de mes participants autour de la grande moyenne, OUI ça vaut la peine de faire une analyse multiniveaux.

  • -> les moyennes des observations pour chaque jeune varient significativement autour de 23.88*
  • -> Autre moyen de justifier le modèle multi-niveau: si 95% confidence interval ne contient pas de 0 (ici 1.84 - 8.07), ça vaut la peine!*

Residual error/variance des erreurs: Le 4.98 me dit que les erreurs se distribuent de manière statistiquement significative autour de la grande moyenne. Mais on ne regarde pas ça pour l’instant.

-> les observations pour chaque jeune varient significativement autour de la moyenne de chaque sujet. C’est le test qui nous intéresse

IMPORTANT: DANS CE MODÈLE, ce qui nous intéresse c’est si les variations autour de la moyenne diffèrent statistiquement entre les individus.

17
Q

Comment peut-on calculer le % de variabilité explicable par les différences entre les individus (corrélation intra-classe: ICC)?

A

Degré de corrélation à l’intérieur d’une même classe

Diapo 22

18
Q

La variance des intercepts corresponds exactement à la corrélation entre les observations d’un même sujet.
Pourquoi?

A

Une part de l’erreur ne varie pas entre les observations d’un participant, ce qui explique la corrélation entre les temps (corrélation intra-sujet).

Conclusion : un modèle mixte à mesures répétées est identique à un modèle multi-niveaux avec un intercept aléatoire

19
Q

Que représente ce graphique?

A

Un modèle multi niveau avec intercepts aléatoires et un prédicteur intra-sujet de niveau 1 (âge)

20
Q

Expliquer ce modèle multiniveau avec un intercept aléatoire et un prédicteur aléatoire (niveau 1).

A

(1) Aggressivité est fonction de mon intercept et de l’âge (effet de l’âge à chaque fois) (+erreur). MAIS on a aussi une pente (Bs) qui va changer selon le sujet. Donc ici on a deux effets aléatoires, l’intercept est aléatoire ET l’âge est aléatoire. Donc pour chaque individu, je vais modéliser le point de départ (intercept) ET la pente. En régression normale, on aurait eu un intercept et une pente pour tout le monde, mais là c’est DES droites de régression qui représentent toutes les sujets.
(2) : Le Bs est fonction de la pente de tout le monde et de la variation dans les pentes face aux pentes de tout le monde (var(B)s : Variance de l’effet aléatoire de l’âge de chaque sujet).

21
Q

Quels sont les 6 paramètres à estimer dans un modèle multiniveau avec un intercept aléatoire et un prédicteur aléatoire de niveau 1?

A

Effets fixes

int = grande moyenne de toutes les observations (effet fixe) si âge = 0 (point de départ)

B ages,t = contribution de l’âge à l’agressivité (pente de la trajectoire) pour l’ensemble des sujets

Effets aléatoires

var(ints) = variance des intercepts = déviations du point de départ de chaque sujet p/r à la grande moyenne des points de départ

  • *var(B)s ages,t** = variance des pentes = déviations de la pente de chaque sujet p/r à la pente moyenne pour tous les sujets
  • *es,t** = variance résiduelle intra-sujet (même définition que pour modèle A)

-> Le 4e effet aléatoire est la covariance entre la valeur des intercepts et celle des pentes: Les résidus du niveau 1 sont univariés (est) alors que les résidus du niveau 2 (varINT et varB ) sont bivariés. On ne peut donc pas assumer leur indépendance.

22
Q

Le modèle multiniveau avec un intercept aléatoire et un prédicteur de niveau est aussi connu sous le nom de […]

A

Le modèle multiniveau avec un intercept aléatoire et un prédicteur de niveau est aussi connu sous le nom de modèle avec coefficients aléatoires (random coefficients model)

23
Q

Comment interprète-t-on ce tableau SPSS d’un modèle multiniveau avec un intercept et un prédicteur de niveau 1?

A

Intercept de la grande moyenne: 16.75

-> La moyenne d’agressivité lorsque l’âge = 0 est de 16.75, t(26.3) = 19.44, p

Pente de la grande moyenne: 0.66

-> A chaque année, l’agressivité augmente en moyenne de 0.66 unités, t(24.6) = 7.99, p

Est-ce qu’avec ce graphique je peux calculer la grande moyenne pour chaque âge? Oui, mais je dois le calculer en prenant l’intercept (16) + variation intercept (B0 = variation moyenne par rapport à la grande moyenne = 0) + Variation âge (Bage = 0.7 (0.7)*âge)) + variation [??] (0) MAIS ATTENTION CAR C’EST DE L’ESTIMATION PURE!!

Variance des intercepts: UN(1,1) = 7.60, p=.20 les points de départ des trajectoires pour chaque jeune ne varient pas autour de 16.75.

-> Est-ce que c’est normale que la variance des intercepts (7.6) soient plus grandes que celles des pentes (.08)? Indique une tendance que probablement que les agressifs restent agressifs et les non agressifs restent non agressifs. Donc plus de variabilité au point de départ mais peu de différence dans la trajectoire une fois commencée. Donc cas avec forte variabilité intercept et faible pour la pente

Variance des pentes: UN(2,2) = 0.08, p=.14 les pentes des trajectoires pour chaque jeune ne varient pas autour de 0.66.

Covariance intercept/pente: UN(2,1) = -0.57, p=.29 les pentes des sujets ne varient pas en fonction des points de départ des sujets

-> Covariance de -.57 (variance peut pas être neg mais cov oui). Négatif veut dire que l’intercept est élève moins la pente est élevée. Donc dans UN(2,1), on est dans un contexte d’intercept forte variabilité et pente forte variabilité (diapo 13 en bas à droite)

Variance résiduelle = 1.71, p=.000 Après contrôle de l’âge, les observations d’un même sujet présentent une variation non-nulle

24
Q

Comment calcule-t-on la corrélation entre l’intercept et la pente?

A

ci, donne une corrélation de -0.73 donc corrélation négative très forte. Indication qui suggère que les extrêmes sont ceux qui bougent plus et donc on peut postuler qu’il y a pt un mvt vers la moyenne.

25
Q

Quels sont les avantages de centrer les prédicteurs? (2)

A
  1. Opération simple pour faciliter l’interprétation et réduire les risques de multicolinéarité
  2. Le prédicteur devient un score de différence (une déviation) centré à zéro (facilite l’interprétation de l’intercept)

Exemples :

  • Fixer l’âge de début à zéro
  • Retirer la moyenne du sujet pour un prédicteur de niveau 1
  • Retirer la moyenne de l’échantillon pour un prédicteur de niveau 2
26
Q

VRAI ou FAUX

Lorsque l’on centre le prédicteur, tout ce qui est lié à l’intercept sera changé mais rien par rapport à la pente

A

VRAI

27
Q

Que représente ce graphique?

A

Modèle avec intercepts aléatoires et prédicteur de niveau 1 peut s’ajouter un prédicteur inter-sujet de niveau 2 (e.g., sexe).

Niveau 1: Qui varie selon les mesures

Niveau 2: Qui ne varie pas selon les observations

28
Q

Dans un modèle avec intercepts aléatoires et prédicteur de niveau 1 et de niveau 2, il y a 8 paramètres à estimer. Quels sont-ils?

A

Effets fixes:

int = grande moyenne de toutes les observations si âge = 8 et sexe = 0 (point de départ). Car on a centré notre prédicteur

-> Définition de l’intercept = moyenne VD quand tous les prédicteurs = 0

B sexes = contribution du sexe (=1) au point de départ de l’agressivité (intercept) pour age = 8

B ages,t = contribution de l’âge à l’agressivité (pente de la trajectoire) pour sexe = 0

B sexes x ages,t = ce nouveau terme estime l’interaction entre le sexe (niveau 2) et l’âge (niveau 1), afin d’établir la contribution de l’âge à l’agressivité (la pente) selon le sexe.

-> Permet de calculer une pente moyenne pour les hommes et une pour les femmes.

Effets aléatoires:

var(ints) = variance des intercepts = déviations du point de départ de chaque sujet p/r à la grande moyenne des points de départ

var(B)s ages,t = variance des pentes = déviations de la pente de chaque sujet p/r à la pente moyenne pour tous les sujets

covariance intercept/pente

es,t = variance résiduelle intra-sujet