COURS 8- L'analyse bivariée: l'analyse de variance (ANOVA) Flashcards
Quelle est la fonction de l’analyse de variance et du test t et quelle est leur différence?
L’analyse de variance et le test t ont la même fonction (quelle est la signification statistique), mais l’analyse de variance compare plus de 2 moyennes alors que le test t compare 2 moyennes.
Quel test utiliser pour déterminer si les moyennes de deux groupes sont significativement différentes?
Le test t (test de différence de moyenne).
Quel test utiliser pour déterminer si les moyennes de plus de deux groupes sont significativement différentes?
Le ratio F (test d’analyse de variance).
En quoi le test t et le ratio F sont semblables?
Ils permettent tous deux d’évaluer la signification statistique de différence entre des moyennes d’échantillon.
Pourquoi n’est-il pas préférable de prendre le test t comme moyen d’évaluer la signification statistique de différences de plus de deux moyennes?
Il y a rapidement trop de comparaisons à faire.
Il y a cumul des risques d’erreur de type 1. (ERREUR D’INFÉRENCE)
Plus il y a de moyennes à comparer, plus il y a de chance de faire des erreurs de type 1
Quelle est la différence entre une erreur de type 1 et une erreur de type 2? Laquelle est la plus problématique?
Faire une erreur de type 1 c’est rejeter une hypothèse nulle qui est vraie, donc rejeter une hypothèse nulle alors qu’il n’y a pas de relation dans la population.
Faire une erreur de type 2 c’est de ne pas rejeter une hypothèse nulle qui est fausse.. C’est donc conclure qu’il n’y a pas de relation dans la population alors qu’il y en a.
L’erreur de type 1 est plus problématique.
Qu’est-ce que l’ANOVA?
Un seul test qui évalue la signification statistique de différences entre plusieurs moyennes d’échantillons. Il garde toujours le même alpha de 0,05, c’est-à-dire que le risque de faire une erreur de type reste toujours le même, contrairement au test t dont l’alpha est cumulatif.
Évalue la probabilité que toutes les moyennes de groupes de l’échantillon proviennent d’une population où les moyennes de groupes sont identiques - donc, quelles sont les chances d’avoir trouvé ce qui a été trouvé, si on considère qu’il n’y a pas de relation dans la population.
À quoi peuvent être comparées les observations de l’analyse de variance?
Les valeurs des observations peuvent être comparées à la moyenne totale.
Les valeurs des observations peuvent être comparées à la moyenne de leur groupe respectif.
Les moyennes de groupes peuvent être comparées entre elles et à la moyenne totale.
Qu’est-ce que la variance intergroupe?
Mesure de la variance entre les moyennes de groupes et entre celles-ci et la moyenne
- plus ou moins de différence entre valeurs.
S’il y a forte variance intergroupe plus il y a de chance de conclure qu’il y a des différences significatives dans la population.
S’il y a faible variance intergroupe, moins il y a de chance de conclure qu’il y a des différences significatives dans la population
Comment ANOVA analyse les données?
Analyser toute la variance.
Classer la variance en catégories et comparer les catégories. (inter et intra-groupes)
Qu’est-ce que la variance intra-groupe?
Mesure de la variance entre les observations et leur moyenne de groupe. Est-ce que les différents scores ressemblent aux moyennes des groupes.
S’il y a faible variance intra-groupe, plus fortes sont les chances d’avoir une relation significative.
S’il y a forte variance intra-groupe, beaucoup de scores ne ressembles pas à leur moyenne et il y a moins de chances d’avoir une relation significative.
Si le ratio F n’a pas de seuil de signification, comment interpréter son résultat?
Avec la table ANOVA (faite par SPSS) qui inclue le ratio F et une case signification.
On cherche un F élevé, mais un résultat inférieur à 0,05 dans la table ANOVA
Il y a alors moins de 0,05 de chance d’avoir trouvé une signification dans la population
Comment interagissent le F et l’ANOVA?
Si le F est assez grand, la signification sera inférieure au seuil 0,05. Donc, la probabilité de trouver un tel lien en assumant que les moyennes sont identiques dans la population est suffisamment petite.
Si le F est trop petit, la signification sera supérieure au seuil 0,05. La probabilité de trouver un tel lien en assumant que les moyennes sont identiques dans la population n’est pas suffisamment petite.
Comment interpréter ANOVA s’il est inférieur à 0,05?
On peut alors rejeter l’hypothèse nulle.
On peut conclure que les moyennes de l’échantillon sont significativement différentes.
On peut conclure que les moyennes dans la population sont probablement différentes.
On peut conclure qu’il y a probablement une association statistique entre les deux variables dans la population.
Comment interpréter ANOVA s’il est supérieur à 0,05?
On ne peut pas rejeter l’hypothèse nulle.
On ne peut pas conclure que les moyennes de l’échantillon sont significativement diffé.
On ne peut pas conclure que les moyennes dans la pop. sont probablement différentes.
On ne peut pas conclure qu’il y a probablement une association statistique entre les deux variables dans la population