analyse de variance (5) Flashcards
utilité du test student T
comparer 2 groupes indépendants
condition pour pouvoir utiliser le test student
homogénéité des variances (égalité)
suppositions du test student (4)
- normalité des moyennes (on veut distribution normale)
- homogénéité des variances
- indépendance des observations
- indépendance des échantillons
hypothèses du test student
H0 : deux moyennes sont égales (µo = µ1)
H1 : deux moyennes sont différentes (test bilatéral)
dans quel cas utiliser le test ANOVA
lorsqu’on a plus que 2 moyennes à évaluer
que signifie analyse de variance
variabilité totale est décomposée en plusieurs composantes (somme de carrés) selon le modèle utilisé.
à quoi s’applique anova
mesure d’une ou plusieurs variables discrètes explicatives (indep) dont les différentes modalités sont appelées niveaux et influencent la distribution d’une variable continue à expliquer (dép)
dans quel cas anova est = au test T?
lorsqu’on veut comparer 1 facteur à 2 niveaux
anova 1 facteur : que représente i et j
i : niveau de tx (a)
j : individu (n)
hypothèse qu’on cherche à rejetter
H0
anova : unique source de variabilité
groupe de tx
anova : méthode pour décomposer la variabilité totale et mesurer la variabilité globale des données
somme de carrés
différence entre Yi et Yi (avec barre)
Yi : somme des groupes
Yi avec barre : moyenne des groupes
variabilité totale vs inter-groupe vs intra-groupe
- totale : distance de chq observation p/r à la moy globale
- inter-groupe : compare les moyennes des groupes avec la moyenne globale
- intra-groupe : compare les valeurs à l’intérieur de chq groupe p/r à la moy du groupe
que fait la somme de carrés due au facteur A
compare les moyennes ds tx entre elles
cmt sera la somme des carrés si les moyennes diffèrent bcp
grande (donc le facteur aura un effet)
que fait la somme de carrés résiduels
mesure ampleur des erreurs aléatoires (à quel point les données sont variables dans chaque groupe)
degré de liberté
nbr de valeurs dans le calcul final d’une statistique qui ne sont pas fixes. si on connait la valeur d’une statistique, c’est le nbr de valeurs requises pour connaitre toutes les valeurs
statistique de test F
degrés de liberté associés aux sommes de carrés avec lesquels on peut construire les carrés moyens puis la statistique du test