Cours 7 : Analyse de variance (ANOVA) Flashcards

You may prefer our related Brainscape-certified flashcards:
1
Q

Pourquoi n’est-il pas pertinent de répéter plusieurs tests de t afin de comparer les moyennes de plusieurs échantillons ?

A
  1. Le nombre de comparaisons augmente de façon géométrique

2. parce que ça augmente l’erreur de type I

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qui-suis-je? Méthode d’analyse utilisée quand on est en présence de plus que 2 échantillons?

A

Analyse de variance (ANOVA)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qu’est-ce que l’analyse de variance (ANOVA) permet de comparer?

A

des moyennes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Comment peut-on mesurer la variabilité des moyennes de plusieurs échantillons issus d’une même population?

A

Avec l’erreur standard (SE)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Vrai ou faux? « un intervalle de 2 erreurs standards autour d’une moyenne est équivalent à un intervalle de confiance à 95% autour d’une moyenne »

A

vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quelle est l’hypothèse de comparaison des moyennes de base pour l’ANOVA?

A

Si on a n échantillons indépendants, on a les hypothèses suivantes :

H0 : les moyennes sont égales ⟹μ1=μ2=⋯=μn

H1 : au moins une des moyennes est différentes des autres.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quelle est la statistique de test du test d’ANOVA

A

F (aussi appelée F-ratio)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Vrai ou faux? l’analyse des variances (ANOVA) utilise la somme des carrés comme paramètre de calcul

A

vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qui-suis-je? « Différence entre la moyenne d’un groupe et la moyenne totale »

A

Somme des carrés factorielle

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Qui-suis-je? « Différence entre chaque valeur d’un groupe avec la moyenne de son groupe »

A

Somme des carrés résiduelle

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qui-suis-je? « NOTE : (Yi,j−Yi¯), mesure l’écart entre une valeur observée et sa moyenne

A

Résidu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Qui-suis-je? « J’estime l’égalité de 2 variances en en faisant le rapport entre les variances résiduelle et factorielle »

A

F (F-ratio)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Lorsqu’on calcule le F-ratio, quelle variance est au nominateur et quelle est au dénominateur?

A

Nominateur : Factorielle (inter-groupe)

Dénominateur : Résiduelle (intra-groupe)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Vrai ou faux : si H0 est vraie, la variance factorielle tend vers 0, alors le F-ratio tend aussi vers 0.

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Comment est-ce qu’on calcule le Fcritique? (indice : commencer par les degrés de liberté)

A

on trouve la Fcritique dans une table de Fisher selon deux valeurs de degrés de liberté différents :

celui du numérateur dl factoriel = k−1
celui du dénominateur dl résiduel = n−k


k = nombre de groupes
n = nombre total de mesures.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Vrai ou faux ? Le degré de liberté résiduel est toujours plus petit que le degré de liberté factoriel.

A

Faux, il est plus grand

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Dans quelles circonstances est-ce qu’on peut rejeter H0 avec le test d’ANOVA?

A
  • si Fcalculée > Fcritique
  • si la p-value correspondante est < α
    .
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Quelle est l’utilité de calculer le R carré dans le test d’analyse de variance?

A

quantifier la contribution de la variance factorielle (entre les groupes) à la variance totale dans nos données avec la valeur de R2(R carré).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Qui-suis-je? « Valeur qui indique quelle proportion de la variabilité totale dans notre variable Y dans nos données est due aux différences entre les groupes »

A

R carré

20
Q

Vrai ou faux? « une analyse de variances (ANOVA) sert à comparer les variances de plusieurs groupes en même temps »

A

Faux

21
Q

Vrai ou faux? «le test post-hoc de Tukey-Kramer permet de comparer toutes les paires de moyennes entre les groupes, sans augmenter l’erreur de type I »

A

Vrai

22
Q

Vrai ou faux? « le test de Kruskal-Wallis est l’équivalent non-paramétrique de l’ANOVA à utiliser en cas de violation importante des conditions d’application de cette dernière »

A

Vrai

23
Q

Vrai ou faux? « Dans le test d’ANOVA, une p-value très petite indique que toutes les moyennes sont différentes »

A

Faux, indique que au moins une des moyennes est différente des autres

24
Q

Vrai ou faux? « Il faut classer les groupes de la moyenne la plus petite à la plus grande pour faire un tableau d’ANOVA »

A

Faux

25
Q

Quelles sont les 3 conditions d’application à respecter pour pouvoir faire un test d’ANOVA?

A
  1. Échantillons indépendants et aléatoires
  2. Les données de chaque groupes sont distribuées normalement
  3. Les données de chaque groupe doivent être homogènes (homéodasticité des variances)
26
Q

Pourquoi les résidus sont-ils si importants et à quoi peuvent-ils servir dans le déroulement d’une ANOVA? (3)

A
  1. Permettent de savoir si les données sont distribuées normalement.
  2. Permettent de comparer visuellement l’homogénéité des variances entre les groupes.
  3. Permettent de tester avec un test de Bartlett l’homogénéité des variances entre les groupes.
27
Q

Vrai ou faux? « Le test d’ANOVA ne permet de répondre qu’à une seule question : “ Est-ce qu’au moins une des moyennes est différente des autres ? “ »

A

Vrai

28
Q

À quelles questions peut-on répondre avec le test post-hoc de Tukey?

A
  1. Quelle(s) moyenne(s) est (sont) différente(s) ?

2. Quelle est l’amplitude de la différence (effect size) ?

29
Q

Vrai ou faux? « les tests que l’on fait après l’ANOVA sont toujours post-hoc »

A

Vrai, « qui s’effectue a posteriori, c’est-à-dire après avoir fait le test d’ANOVA »

30
Q

Qui-suis-je? « Probablement le test le plus puissant, car il est le plus à même de rejeter H0 si H0 est fausse, tout en n’augmentant pas le risque d’erreur de type I »

A

Test de post-hoc de Tukey HSD (honest significant difference)

31
Q

Qui-suis-je? « Un facteur à ____ ____ si les groupes qu’il forme sont prédéfinis, répétables et d’intérêt majeur pour l’étude.

A

effet fixe

32
Q

Donnez des exemples de facteurs à effet fixe.

A
  • Différents traitements médicaux alternatifs dans un essai clinique;
  • Des doses fixes de toxines;
  • Les différentes hauteurs du cycle de marée sur le littoral;
  • Les groupes d’individus par sexe, catégories d’âge, etc.
33
Q

Avec quel type de facteur est-ce qu’on utilise le test d’ANOVA de type I?

A

facteur à effet fixe

34
Q

Quelle est le facteur à tenir en compte lorsqu’on fait un ANOVA de type I ?

A

On ne peut pas généraliser les résultats obtenus (parce que les groupes sont fixés par l’expérimentateur)

35
Q

Qui-suis-je? « Un facteur est dit à ____ _____ si les groupes formés ne peuvent pas être prédéfinis ou répétés. »

A

effet aléatoire

36
Q

Donnez des exemples de facteurs à effets aléatoires.

A
  • Des familles dans une étude épidémiologique;
  • Les individus dans une étude impliquant des mesures répétées;
  • Des bancs de poissons.
37
Q

Avec quel type de facteur est-ce qu’on utilise le test d’ANOVA de type II?

A

facteur à effet aléatoire

38
Q

Vrai ou faux? « le test d’ANOVA de type II permet de généraliser les résultats obtenus »

A

Vrai, parce que les groupes sont formés de façon aléatoire

39
Q

Qui-suis-je? « les écarts entre chaque valeur et la moyenne de son groupe »

A

Résidus

40
Q

Vrai ou faux? « on doit tester que les conditions d’applications pour le test d’ANOVA sont respectées avant de faire le test. »

A

Faux, on doit vérifier après avoir fait le test

41
Q

Comment pouvons-nous vérifier la normalité des données (2) et l’homéodasticité des données (2) ?

A

Normalité :

  1. Graphiquement ; si les quartiles sont relativement symétrique.
  2. Test de Shapiro-Wilk

Homéodasticité :

  1. Graphiquement ; si la moyenne des groupe de résidus est autour d’une valeur x, on considère que les moyennes sont semblables.
  2. Test de levene
42
Q

Vrai ou faux? « L’ANOVA est particulièrement robuste aux violations de conditions d’applications »

A

Vrai, grâce au théorème central limite

43
Q

Vrai ou faux? « l’ANOVA peut tolérer des différences de variances d’un facteur ≈ 10 »

A

Vrai

44
Q

Qui-suis-je? « Méthode non parmétrique permettant de tester si différents échantillons proviennent de la même population. Plus précisemment, il compare les médianes des k échantillons »

A

le test de Kruskal-Wallis

45
Q

Quelles sont les 3 conditions que la distribution doit respecter pour pouvoir faire un test de kruskal-wallis?

A
  1. Relativement symétrique,
  2. Unimodale,
  3. Même médiane (ce qu’on veut valider avec le test de Kruskal-Wallis)
46
Q

Comment est formulée l’hypothèse statistique du test de Kruskal-Wallis?

A

Si on a k échantillons à comparer, on aura les hypothèses suivantes:

H0 : les médianes des k distributions sont égales;

H1: les médianes ne sont pas égales.

47
Q

Vrai ou faux? « un nombre de données insuffisant par groupe (< 10) est une raison suffisante pour faire un test non-paramétrique. »

A

Vrai