Cours 9 Flashcards

1
Q

L’analyse de covariance (ANCOVA) est une extension de l’ANOVA qui permet d’ajuster la […] en fonction d’une ou plusieurs […]

A

L’analyse de covariance (ANCOVA) est une extension de l’ANOVA qui permet d’ajuster la VD en fonction d’une ou plusieurs covariables

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Le test d’ANCOVA porte sur des […] ajustées (mi’) et l’ajustement se fait à l’aide d’une […] entre la covariable et la VD

A

Le test d’ANCOVA porte sur des moyennes ajustées (mi’ ; donc moyenne composée) et l’ajustement se fait à l’aide d’une régression entre la covariable et la VD

Hypothèses:

Ho: m1’ = m2’ = … = mk

Ha: au moins une égalité est fausse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quelle est la différence entre l’ANCOVA et la MANOVA?

A

ANOVA compare des moyennes.
MANOVA compare plus de deux moyennes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Dans l’ANCOVA, la variable dépendante doit être sur une échelle […], la variable indépendante doit être sur une échelle […] et la covariable doit être sur une échelle […]

A

Dans l’ANCOVA, la variable dépendante doit être sur une échelle continue, la variable indépendante doit être sur une échelle catégorielle (nominale) et la covariable doit être sur une échelle continue

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

VRAI ou FAUX

Presque tous les plans d’expériences peuvent être convertis en ANCOVA sans problème

A

VRAI

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

L’ANOVA est basé sur trois sommes de carrés. Quelles sont-elles?

A

Variation totale des scores = SC totale
variation intra-groupe = SC intra
variation inter-groupes = SC inter

L’ANOVA s’intéresse à la variance (écart à la moyenne). La variance fonctionne avec le carré des écarts sinon l’addition des écarts deviendrait nulle.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Comment calcule-t-on la somme de carré total dans l’ANOVA?

A

On additione l’écart au carré pour tous les sujets et groupes.
Le 143 ici est ma variation totale par rapport à ma grande moyenne. Ensuite je vais vouloir allé voir quel partie est dû à la variance de mes groupes ou de mes sujets

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Comment calcule-t-on la somme de carré intra dans l’ANOVA?

A

SCintra = Variabilité des sujets dans les groupes.

Les sujets sont donc comparés par rapport à leur groupe (moyenne de leur groupe).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Dans un ANOVA, que signifie un SCtotal de 143 jumelé à un SCintra de 15?

A

L’essentielle de la variation (SCtotal: 143) est entre les groupes (SCinter: ?) pas entre les sujets (SCintra: 15)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Comment calcule-t-on la SCinter de l’ANOVA?

A

On fait la moyenne de chaque groupe vs la grande moyenne.

Quand je regarde des variations de moyennes, ça bouge pas mal moins vite que les variations de sujets. C’est pour ça qu’on ajoute le “n” (nombre de sujets par condition).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Dans un ANOVA, le rapport F permet de tester si la variance […]-groupes est significativement plus importante que la variance […]-groupe

A

Dans un ANOVA, le rapport F permet de tester si la variance inter-groupes (différences entre les groupes) est significativement plus importante que la variance intra-groupe (variabilité naturelle des scores)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Comment calcule-t-on les degrés de libertés dans l’ANOVA?

A
  • ddlinter: Nbr gr (p) - 1
  • ddlintra: Cb d’observation par groupe sont libres de varier et quand mçeme obtenir le même résultat?Ici, j’ai 4 sujets par groupe (3 groupes). Donc j’ai p * (n-1) : (p=nbr groupe) (n = nb de personnes par groupe) = 9
  • ddl : Combien de “sujets/groupes” peut varier pour obtenir quand même le même résultat (ex: Cb de groupes peuvent varier pour quand même obtenir 128 si j’ai 3 groupes. 2 gr) =
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quel est l’avantage de la MANOVA par rapport à l’ANOVA?

A

Généralement, quand j’ai un rapport de F non significatif c’est parce que mon intra est trop gros ou mon inter est trop petit.

Donc la MANOVA permet d’accroître la sensibilité (la puissance) des tests F de l’ANOVA en réduisant le terme d’erreur (MCINTRA)

-> Le terme d’erreur est ajusté par le retrait de la covariance entre la VD et la (les) covariable(s)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

VRAI ou FAUX

L’ANCOVA permet un ‘appariement’ statistique de façon à produire des groupes
« comparables » selon les différences individuelles présentes (en raison de l’absence de répartition aléatoire). Elle peut donc être utilisée comme substitut à la méthode expérimentale.

A

FAUX

L’ANCOVA permet un ‘appariement’ statistique de façon à produire des groupes
« comparables » selon les différences individuelles présentes (en raison de l’absence de répartition aléatoire).

Attention! Ce n’est pas un substitut à la méthode expérimentale Un ajustement statistique n’est jamais autant convaincant qu’une vrai évaluation méthodologique.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Fonctionnement de la MANOVA:

Permet d’identifier les variables qui contribuent à un effet […] significatif (analyse stepdown) On retire à tour de rôle chaque VD en la transformant en […]. Lorsqu’une VD placée en covariable élimine l’effet significatif de la VI, nous pouvons conclure que cet effet significatif affectait surtout […].

A

Fonctionnement de la MANOVA:

Permet d’identifier les variables qui contribuent à un effet multivarié significatif (analyse stepdown) On retire à tour de rôle chaque VD en la transformant en covariable. Lorsqu’une VD placée en covariable élimine l’effet significatif de la VI, nous pouvons conclure que cet effet significatif affectait surtout cette VD.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quelles sont les limites théoriques de la MANOVA et de l’ANCOVA? (5)

A
  1. Ne permet pas d’attribution causale
  2. Ne remplace pas la méthode expérimentale
  3. L’augmentation du nombre de paramètres dans le modèle provoque une diminution des degrés de liberté
  4. Le nombre de covariables devrait être restreint, et les covariables ne devraient pas être corrélées entre elles ou avec la VI
    1. Ça ne vaut pas la peine d’entrer des variables qui sont corrélées entre elles (redondance)
  5. L’interprétation de moyennes ajustées est toujours délicate (p.ex., ajusté selon sexe)
    1. Dans certains cas, l’ajustement fonctionne mais l’ajustement est bizzarement explicable de manière pratique. Un bon exemple est un ajustement pour le sexe (codé 1 2, moyenne de 1.59) qui ne représente pas la vie réelle.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Quelles sont les conditions d’utilisation de l’ANCOVA et de la MANOVA? (6)

A
  1. Taille d’échantillon
    1. 5 à 10 sujets par cellule (groupe)
    2. Il ne doit pas y avoir de donnée manquante sur la covariable, sinon l’observation au complet sera retirée (listwise deletion). Pourquoi? La covariable est un effet du modèle, qui est sous le contrôle de l’expérience (comme la variable indépendante)
  2. Normalité
  3. Absence de données extrêmes
  4. Linéarité des relations (entre VD et covariables, et les covariables entre elles)
  5. Homogénéité des variances entre les groupes (homoscédasticité)
  6. Homogénéité des pentes
18
Q

Expliquez le postulat d’homogénéité des pentes de l’ANCOVA et de la MANOVA.

A

La relation entre la VD et la covariable doit être similaire (même B) pour chaque cellule. Sinon, les moyennes de certains groupes seront sur/sous-ajustées.

Ce qui est important ici c’est que les pentes soient homogènes, pas d’importance pour l’intercept.

L’ajustement à rapport au coefficient de régression donc à la pente.On veut à peu près la même relation pour chaque pente. Donc a est positif pour chaque relation.

Pour b, les relations sont positifs ou négatifs, ça c’est problématique car dans certains groupes il va y avoir un sur et sous ajustement. L’analyse va partir comme si elle avait fait une régression sur tout groupe confondu donc si la direction des relations n’est pas similaire, on va avoir un problème.

Si ce postulat n’est pas respecté, on vient fausser nos résultats d’analyse

19
Q

Comment choisi-t-on une bonne covariable dans l’ANCOVA et la MANOVA? (4)

A
  1. Choix théorique vs. empirique
  2. Elle doit avoir une bonne fidélité (Cronbach > .80)
  3. Elle doit présenter une relation linéaire avec la VD
    1. Il arrive dans certains cas où la relation existe mais elle n’est pas linéaire. Il y a d’autres analyses à faire à la place
  4. Si plusieurs covariables, elles ne doivent pas être trop corrélées ensemble (R2 < .50)
    1. Pas de redondance!
20
Q

Expliquez ce qu’implique le choix théorique/empirique dans le choix de covariable dans les ANCOVA et MANOVA.

A

Si on se base sur la théorie et que finalement il n’y a pas de corrélation/association (ex: On inclut le sexe mais finalement ça change rien), bin l’ajustement va être nulle alors ça ne changera pas grand chose. Donc oui pour le choix théorique mais empirique peut donner une bonne idée aussi.

Si on se fie juste sur l’empirique et on rentre tout comme variable confondante bin une association peut être trouvé mais sans vrm être lié au problème.

Il faut un mix des deux. Il faut réfléchir à un fondement théorique à pourquoi ça pourrait être une variable confondante et avoir des preuves dans mon jeu de données qu’il y a une relation.

21
Q

Qu’est-ce qu’un mythe statistique? Donnez un exemple.

A

Un mythe statistique est qu’une variable différente entre les groupes doit automatiquement être incluse comme covariable.

Exemple

Si mes participants présentent un âge moyen différent selon le groupe, l’âge doit être inclus comme covariable.
FAUX : L’inclusion de l’âge comme covariable va réduire les différences confondantes entre les groupes seulement si l’âge est associé à la VD!

22
Q

VRAI ou FAUX

Variable confondante est une variable modératrice (interaction)

A

FAUX

Variable confondante N’EST PAS une variable modératrice (interaction) ou médiatrice

  • *Une variable confondante :**
    1. Doit être associée à la VI mais ne pas être une conséquence de la VI
    2. Doit être associée à la VD mais ne pas être une conséquence de la VD
23
Q

Expliquer cette image pour le choix d’une covariable en fonction de son influence sur la VD.

A

A et B: La covariable va compétitionner avec la VI

C. Exemple de médiation et non d’une covariable

D. Redondance. Je vais dénaturer mes groupes car je vais créer deux groupes (ex: deprimé vs non déprim) qui sont ajustés selon la covariable (dépression). Ça va donner deux groupes modérés après l’ajustement et donc confondre la relation

24
Q

Expliquer la mécanique de l’ajustement utilisé selon le graphique ci-joint.

A

Axe Y: Variable dépendante (ex: Stress qui va de 0 à 18)

Axe X: Covariable (ex: Âge de 0 à 20 ans)

  • *Treatment means:** Moyennes brutes
  • *Adjusted means:** Moyennes ajustée

Les gens sont répartis en trois groupes (a1, a2, a3).

La droite verticale représente les scores qu'on donné les gens à la VD (on voit que le a1 donne le plus petit score stress, le a2 moyen et le a3 le plus grand).
 Donc ici (i) on a un enfant de 3 ans qui avait un score de 8 de stress.

On constate que les trois moyennes (brutes) de la VD sont différentes. OR, on ne peut pas les comparer sans les ajuster pour l’âge (covariable). Donc on ne peut pas l’utiliser pour l’instant. Donc ici je vais ajusté pour faire en sorte que l’âge ne soit plus un facteur confondant. Pour ce faire, on centralise nos données (mettre à zéro impossible ici donc on centralise à l’âge moyen (9ans) dans l’échantillon complet).

  • > À partir de là, je vois que ma moyenne ajustée pour la VD a donc été baissée pour a3, le groupe a2 n’a pas besoin de baisser la moyene ajustée car il était déjà dans la bonne moyenne d’âge.
  • > A1 devra être augmenté car ils étaient trop jeune en moyenne. Donc la moyenne brut de stress était de 3 et la moyenne ajustée est de 4 maintenant pour ce groupe.
  • > Si je suis pire que mes collègues et je veux être ajusté en fonction que mes collègues, ma performance va être améliorée. Si je suis mieux que mes collègues, ma performance va être baissée. Si la relation entre la covariable et la VD était négative, est-ce que l’ajustement de la dernière phrase serait le même? Mon niveau final (stress) va être plus bas si je suis plus bas que mes collègues (plus jeune) lorsque j’ajuste.
25
Q

VRAI ou FAUX

Le calcul du rapport F est le même pour l’ANCOVA que pour l’ANOVA.

A

FAUX

Le calcul du rapport F est le même pour l’ANCOVA que pour l’ANOVA, mais le rapport F est calculé grâce à des SC ajustées (en conséquence de la covariable)

26
Q

Dans l’ANCOVA, la quantité d’ajustement est fonction de (a) la déviation de chaque participant sur la […] par rapport à la […] , et (b) la relation linéaire entre la […] et la covariable

A

Dans l’ANCOVA, la quantité d’ajustement est fonction de (a) la déviation de chaque participant sur la covariable par rapport à la moyenne, et (b) la relation linéaire entre la VD et la covariable

Y’ = Y - By.cov (COV - GMcov)

By.cov est le coefficient brut obtenu lors de la prédiction de la VD selon la covariable et la VI (groupes) à l’aide d’une régression multiple standard, pour l’échantillon complet. C’est la pente

Y’ : Variable ajustée

L’ajustement est fonction de mon écart par rapport à la moyenne (plus je suis désavantagé, loin de la moyenne, plus je suis compensée).

27
Q

Comment interprète-t-on cette sortie SPSS?

Mise en situation: On a 3 traitements, on a mesuré une VD. On veut comparer trois groupes en post, mais on veut tenir compte de leur score en pré (cov).

A

“Test des effets inter-sujets”: ANOVA

“Moyennes marginales estimées”: Données brutes

Je vois que ma relation entre la performance initiale vient biaiser mes résultats, donc je pars faire d’autres analyses (vers ANCOVA)

28
Q

Dans l’ANCOVA, les SC peuvent être calculées selon deux types. Quels sont-ils?

A

Type I : la SC de la covariable n’est pas ajustée pour l’effet de la VI (On ne prend pas en compte que ça peut aussi affecter la VI, pas juste la VD)

→ Les SC sont additives. C’est comme une régression hiérarchique

Type III : la SC de la covariable est ajustée pour l’effet de la VI

→ Les SC ne sont pas additives. C’est comme une régression standard

29
Q

Comment interprète-t-on cette sortie SPSS?

Mise en situation: On a 3 traitements, on a mesuré une VD. On veut comparer trois groupes en post, mais on veut tenir compte de leur score en pré (cov).

A

Comment je sais que c’est une somme de carrés de type I? Parce que c’est écrit dans la sortie (Ici écrit à côté).

SC de la covariable: 204.582

SC de la VI: 366.201

ddl de la VI: 2

Donc MC = 183.101

La covariance a permit d’augmenter la variance sur mes groupes et de trouver les effets significatifs qui se cachaient.
-> Donc où la variance a été prise? La SC de la VI est passé de 400 qque à 366. Elle a baissé de 67 unités, qui sont passées dans la covariable. Same pour l’erreur. Donc c’est un déplacement de variance, on n’en a pas créé de la nouvelle!

30
Q

Comment interprète-t-on cette sortie SPSS?

Mise en situation: On a 3 traitements, on a mesuré une VD. On veut comparer trois groupes en post, mais on veut tenir compte de leur score en pré (cov).

A

Une ANOVA normale, on se fout du type.
La SC de type III ne prend pas en compte le rôle de VI donc n’assigne pas la variance de la VI à la covariable. À ce moment là, la covariable ne sera pas ajustée avec ça et il a donc moins de chance d’être significatif (moins de variance).

Moyenne marginales estimées
Maintenant, nos moyennes sont ajustées pour la covariable. G1 n’a pas eu trop de changement donc était probablement sur la moyenne ajustée. G2 a baissé donc il devait être au dessus de la moyenne
Grande moyenne ajustée : 86.11 (en dessous du tableau)
Erreur standard : Mesure d’incertitude attaché à la moyenne estimée (ici). Ça veut dire qu’on n’a plus d’écart type.

31
Q

VRAI ou FAUX

Il n’y a pas d’écart-type dans un ANCOVA

A

VRAI

Dans une ANCOVA, on n’a plus d’écart type car il y en a pas avec les moyennes ajustées.

Un erreur standard est sur la moyenne, donc c’est beaucoup plus petit que les écart types (la moyenne bouge beaucoup moins vite que les données).

-> Erreur standard et écart-type sont des valeurs différentes (pas interchangeables)

32
Q

Quels sont les impacts de l’introduction d’une covariable dans une ANCOVA? (5)

A
  1. Réduction du terme d’erreur
    1. Si la covariable est bonne!
    2. Terme d’erreur: CMintra (estimé de variance) (SC n’est PAS un estimé de variance)
  2. Réduction du nombre de ddl du terme d’erreur (CMINTRA)
    1. Le fait d’ajouter une covariable nous fait perdre un ddl au niveau de l’erreur. OR le ddl permet de diviser le SC pour obtenir le CM. Donc si plein de covariable, j’ai une augmentation du CM. Ma réduction du terme d’erreur n’aura donc pas lieu et je vais donc aggraver l’erreur. Il sera donc plus susceptible d’être non significatif (affecte la puissance). Il faut donc seulement utiliser les covariables NÉCESSAIRES
  3. Réduction (ou non) de l’effet de la VI (selon le type de SC)
  4. Production de moyennes ajustées
    1. On a des moyennes maintenant pour une moyenne de covariable
  5. Remplacement de l’écart-type par l’erreur standard (ES) comme indice de variabilité (i.e., Erreur standard = variabilité des moyennes, alors que Écart-type = variabilité des données)
33
Q

Quelles sont les alternatives à l’ANCOVA? (4)

A
  1. Utilisation de scores de différences (cette stratégie est également limitée par les effets de plafond/plancher)
    1. Prendre les scores de différences (ex: T2-T1 = d. Si la personne avait 80 au baseline et 100 à la fin son score de différence sera 20) et les comparer entre eux.
    2. Problème: On perd l’échelle de mesure originale. L’objet d’étude devient donc le changement/amélioration, pas la performance “après la thérapie”.
  2. Pairage des sujets selon la valeur de la covariable, pour réaliser une ANOVA en blocs aléatoires
    1. On crée des blocs de participants qui se ressemblent dans mes gr existants en fonction des caractéristiques des personnes (ex: B1: Marié B2: Seul B3: Divorcé). Puis, je fais mes analyses avec les blocs et la source de variation liée à mes blocs va être isolée.
    2. C’est un genre d’équivalent d’ANCOVA sans ajuster les données. Donc les gr seront homogènes, mais on n’ajuste pas en fonction de la moyenne.
    3. Problème: Si les groupes sont débalancés, il n’y a aucune façon de faire mes blocs correctement entre les gr.
  3. Création d’une VI additionnelle selon la valeur de la covariable (utile si la relation entre la VD et la covariable n’est pas linéaire)
    1. Si trop gros débalancement, on peut entrer une nouvelle VI pour la variable débalancée (ex: j’ai mes trois groupes mais je vais créer un autre facteur (homme;femme)). Puis, tu peux faire tes analyses en tenant compte ce facteur. Donc si interaction significative, je dois prendre en compte l’interaction dans mon anlyse, sinon non.
    2. Je vois donc ici un ANOVA à plan factoriel!
  4. Effets temporels: Dans un plan à mesures répétées, l’ANCOVA ajuste uniquement les effets inter-sujets
    1. L’ANCOVA ne supporte pas par défaut les covariables qui changent selon le temps. L’analyste doit alors utiliser un modèle mixte ou une analyse multi-niveaux.
34
Q

À quoi sert ce graphique?

A

À justifier le choix d’ANCOVA :D

35
Q

Quelles sont les étapes de l’ANCOVA (SPSS)? (5)

A
  1. Vérification des données manquantes
    1. VI ou COV manquante = retrait de l’observation
  2. Normalité univariée et linéarité
  3. Données extrêmes et multicollinéarité
    1. Régression par groupe pour prédire VD en fonction des COV
    2. Calcul de la distance de Mahalanobis
    3. Calcul des indices de multicollinéarité
  4. Homogénéité des droites de régression
    1. Modèle préliminaire d’ANCOVA où on inclut une interaction entre chaque COV et la VI.
    2. Une interaction significative indique que la relation entre la COV et la VD change selon les niveaux de la VI (non-respect de l’homogénéité des pentes de régression)
  5. Modèle final
    1. Rapporter moyennes ajustées et erreurs standard
36
Q

Comment interprète-t-on ces tableaux SPSS?

A

Sert à vérifier la corrélation entre VD et covariables.

Selon ces deux analyses (ANOVA et corrélations), les covariables potentielles à retenir seraient clairement l’usage de psychotropes (r = 0.30, p < .001, différences entre les groupes significative à 5%; corrélation forte) et les symptômes physiques (r = .13, p = .007; corrélation moyenne-faible).

37
Q

Comment interprète-t-on ce tableau SPSS?

A

Les indices de colinéarité suggèrent que les deux covariables ne sont pas affectées par ce problème.

38
Q

Comment interprète-on ce tableau SPSS (Test homogénéité des pentes)?

A

Vous devez uniquement regarder les tests d’interaction pour établir si le postulat d’homogénéité des pentes est vérifié. Dans le cas présent, les deux tests étant non-significatifs, le postulat est vérifié pour les deux covariables et on peut les garder dans l’ANCOVA à venir.

Si non sign, ça nous dit qu’il n’y a pas de modération du groupe dans la relation cov-VI. Ça veut dire que l’homogénéité des pentes est respectée.

39
Q

Comment interprète-t-on ces tableaux SPSS (ANCOVA)?

A

Descriptive Statistics”: Moyennes brutes avec nos écart-types

Tests of between-Subjects effects”:
F (3 (ddleffet), 457 (ddlerreur)) = 3.01, p = .03
DONC la religion, en tenant compte des expériences passées, va significativement être lié à l’attitude face aux drogues.
-> Si on voulait être encore plus claire, il est possible de faire une ANOVA avant l’ANCOVA

** Par défaut, l’analyse utilise un SC de type II (idée que ça correspond à une régression standard ne donne pas plus de poids à la cov et la VI).

40
Q

Comment interprète-t-on ces tableaux SPSS (ANCOVA)?

A

Ici on a la moyenne ajustée
None or other: Pas eu d’ajustement pour ceux qui se disait non religieux

Catholic: On sous-estimait leur attitude face à la drogue car ils étaient prob sous la moyenne

  • *Juif:** Contraire de catholique
  • *Moyenne ajustée:** 4.92 et 3.92

*Dans un article scientifique, je rapporte les moyennes ajustées SEULEMENT. Les moyennes brutes servent ^pas à grand chose à part pour montrer le mouvement à l’ajustement.

41
Q

Comment interprète-t-on ce tableau (ANCOVA) SPSS?

A
  • *Mean difference**: Différence entre les moyennes ajustées.On sait qu’il y a des différences, mais on ne sait pas où. Ce tableau va nous le dire!
  • Donc Catho et athé ont une différence significative qui explique pk. Me permet de conclure où se trouve les différences entre les groupes.*