ANOVA Flashcards
Lorsqu’il y a plus de deux groupes d’échantillon, pourquoi ne peut-on pas comparer chacun des groupes deux à deux (faire plusieurs t-test)?
1-Le nombre de comparaisons augmente de façon géométrique
2-Augmenter le nombre de tests augmente le risque α
Comment peut-on corriger alpha et ainsi pouvoir faire des t-test à répétition?
correction de Bonferroni:
αi = αN /N.
Quels sont les hypothèses de l’ANOVA?
H0: Les échantillons sont issus d’une même population =toutes les moyennes sont égales.
H1: Les échantillons ne sont pas….
Sur quoi se base l’ANOVa? à quoi s’intéresse-t-elle?
Elle s’intéresse à la variabilité des valeurs au sein de chaque échantillon et a la variabilité entre les moyennes des échantillons.
Savez-vous comment mesurer la variabilité des moyennes de plusieurs échantillons issus d’une même population (H0) ?
Avec l’erreur standard (SE)
Qu’est-ce que la variance totale?
C’est la variance entre les valeurs et la moyenne générale (celle de tous les groupes).
Qu’est-ce que la variance factorielle?
C’est la variance entre les moyennes des groupe et la moyenne générale (celle incluant tous les groupes)
Qu’est-ce que la variance résiduelle?
C’est la variance entre les valeurs d’un groupe et sa moyenne.
Comment calculer une somme des carrés des écarts? Pour une variance factorielle? Pour une variance résiduelle?
Factorielle: En faisant la sommation de tous les groupes de la (moyenne du groupe - la moyenne générale)^2 X le nombre d’observation pour le groupe.
Résiduelle: En faisant la sommation entre tous les groupe de la variance X le nombre d’observation total-1
Comment calculer un carré moyen? Pour une variance factorielle? Pour une variance résiduelle?
En divisant le SCE par le degré de liberté
Factorielle= nb de groupes -1
Résiduelle:nb d’observation total - nb de groupes
Qu’est-ce que le f-ratio et comment se calcule-t-il?
c’est l’égalité entre deux variance sous forme de ratio.
Il se calcule en divisant la CMf/CMr
Comment trouver le F-critique?
Dans une table de Fisher: on utilise les dI du numérateur (factorielle) (=nb de groupe -1) et du dénominateur (résiduelle) (= nb d’observation - nb de groupes)
Qu’est-ce que R^2 et comment se calcule-t-il?
Pourcentage dans la variabilité de nos donnés qui est due aux différences entre les groupes.
R^2= SCEf/SCEt
Qu’utilise-t-on généralement après l’ANOVA?
Un test post-hoc afin de voir quelles moyennes sont différentes et quelle est l’amplitude de cette différence.
Dans un résultats d’un test post-hoc de Turkey HSD, que veut dire une p-value inférieure à 0.05?
Pour se couple, la différence entre les moyenne est significative.
Qu’est-ce qu’un design équilibré?
Le nombre d’observation est le même dans chaque groupe.
Attention: il ne faut jamais enlever des observation pour l’obtenir.
Qu’est-ce qu’un effet fixe? aléatoire?
Fixe: Facteur dont les groupes formés à partir de lui sont prédéfinis, répétable et d’intérêt majeur. ANOVA de type 1
Aléatoire: Les groupe ne sont pas prédéfinis ou répétés. ANOVA de type II. Peut être généralisé à toute la population.
Quels sont les conditions d’application de l’ANOVA?
- L’échantillonnage est indépendant et aléatoire
- Chaque variable échantillonnée est distribuée normalement dans sa population.
- Les variances de chaque échantillons sont similaires (homoscédasticité des variances).
Comment peut-on s’assurer de la normalité des observation?
Avec un box plot ou un test de Shapiro
Comment peut-on s’assurer de l’homogénéité des variances des données?
Avec le box plot, un test de Bartlett ou un test de Levene (si pas normal. Moins puissant)
Que faire si il y a violation des conditions d’application?
1-Ignorer (ANOVA robuste. Les données doivent être symétriques, sans valeurs extrême, nombreuse et à peu près égale entre les groupes)
2-Transformer (faire les transfo sur tous les groupes)
3-Kruskal-Wallis (donné un rang à chaque valeur, un degrés de liberté doit être considéré pour chaque groupe, sinon utiliser chi-carré)