Cours 7 : Analyse de variance (ANOVA) Flashcards
Pourquoi n’est-il pas pertinent de répéter plusieurs tests de t afin de comparer les moyennes de plusieurs échantillons ?
- Le nombre de comparaisons augmente de façon géométrique
2. parce que ça augmente l’erreur de type I
Qui-suis-je? Méthode d’analyse utilisée quand on est en présence de plus que 2 échantillons?
Analyse de variance (ANOVA)
Qu’est-ce que l’analyse de variance (ANOVA) permet de comparer?
des moyennes
Comment peut-on mesurer la variabilité des moyennes de plusieurs échantillons issus d’une même population?
Avec l’erreur standard (SE)
Vrai ou faux? « un intervalle de 2 erreurs standards autour d’une moyenne est équivalent à un intervalle de confiance à 95% autour d’une moyenne »
vrai
Quelle est l’hypothèse de comparaison des moyennes de base pour l’ANOVA?
Si on a n échantillons indépendants, on a les hypothèses suivantes :
H0 : les moyennes sont égales ⟹μ1=μ2=⋯=μn
H1 : au moins une des moyennes est différentes des autres.
Quelle est la statistique de test du test d’ANOVA
F (aussi appelée F-ratio)
Vrai ou faux? l’analyse des variances (ANOVA) utilise la somme des carrés comme paramètre de calcul
vrai
Qui-suis-je? « Différence entre la moyenne d’un groupe et la moyenne totale »
Somme des carrés factorielle
Qui-suis-je? « Différence entre chaque valeur d’un groupe avec la moyenne de son groupe »
Somme des carrés résiduelle
Qui-suis-je? « NOTE : (Yi,j−Yi¯), mesure l’écart entre une valeur observée et sa moyenne
Résidu
Qui-suis-je? « J’estime l’égalité de 2 variances en en faisant le rapport entre les variances résiduelle et factorielle »
F (F-ratio)
Lorsqu’on calcule le F-ratio, quelle variance est au nominateur et quelle est au dénominateur?
Nominateur : Factorielle (inter-groupe)
Dénominateur : Résiduelle (intra-groupe)
Vrai ou faux : si H0 est vraie, la variance factorielle tend vers 0, alors le F-ratio tend aussi vers 0.
Vrai
Comment est-ce qu’on calcule le Fcritique? (indice : commencer par les degrés de liberté)
on trouve la Fcritique dans une table de Fisher selon deux valeurs de degrés de liberté différents :
celui du numérateur dl factoriel = k−1
celui du dénominateur dl résiduel = n−k
où
k = nombre de groupes
n = nombre total de mesures.
Vrai ou faux ? Le degré de liberté résiduel est toujours plus petit que le degré de liberté factoriel.
Faux, il est plus grand
Dans quelles circonstances est-ce qu’on peut rejeter H0 avec le test d’ANOVA?
- si Fcalculée > Fcritique
- si la p-value correspondante est < α
.
Quelle est l’utilité de calculer le R carré dans le test d’analyse de variance?
quantifier la contribution de la variance factorielle (entre les groupes) à la variance totale dans nos données avec la valeur de R2(R carré).