COURS 9 ; ANOVA Flashcards
pour quoi si nous avons plus que 2 groupes on utilise une ANOVA et pas un test t?
Trop laborieux. Nombre de comparaisons = c.
et surtout, cause une distorsion de l’erreur alpha ou cumul de l’erreur.
erreur de type 1 augmente bcp
la variance intergroupe et intragroupe sert à quoi quand o parle de calcul et tout
permet de déterminé le F soit que F= S^2 inter/ S^2 intra
LA taille d’effet permet de savoir
est ce que la difference est dû a cause d’une réelle difference ou si c’est de la poubelle et c’est du au nombre d’observation ou autre
quel sont les 3 étapes général pour calculer une ANOVA?
1- est ce que significatif?
2- taille effet –> différence ou plutot juste mathématique
3- post-hoc
quand on calcul une ANOVA qu’est ce que serais la VI et la VD
VI:caracteristique qui définis les groupes (variable nominal)
VD: mesure lequel compare groupe
degres de liberté on le fait car on sait que …
l’échantillon ne sera jamais comme la population
dans une ANOVA quel serait la variance inter-sujet et intra sujet?
INTERGROUPE: calculer la differnce moyenne de chaque groupe et la différence entre elle. + difference est grande, + le S^2 est grand.
INTRAGROUPE: jusqu’à quel pt. personne d’un groupe varie entre elle
que signifie le denomintauer du calcul du F observé?
+ tu as de monde (n ), tu as de chance d’avoir de la variance,
c’est la variabilité auquel on devrait s’attendre –> doit mettre tout le monde
–> c’est le S^2 intragroupe
que signifie le nominateur du calcul du F observé?
V ouF :une fois avoir calculer le F observé celui-ci nous permet de savoir si la différence est assez significative
Faux, nous avons besoin de le comparer au F Critique.
le F observé nous donnes combien de fois plus grande que la différence que si les 2 groupes venait de la même pop.
que nous donne comme info le F observé. dans l,ANOVA?
le F observé nous donnes combien de fois plus grande que la différence que si les 2 groupes venait de la même pop.
Quand est ce que l’on rejette le H0 dans l’ANOVA?
Quand F observé > F critique
à quoi sert la taille de l’effet?
determiner à quoi est du la différence significative trouvé
quel est le calcul de la taille de l’effet pour le test t?
w^2 = (t^2 - 1)/ t^2 + n1 +n2 -1
quel est le calcul de la taille de l’effet pour l’ANOVA?
n^2 = (SC inter )/ SC intra + SCinter
à quoi sert le test post-hocs?
savoir quel groupe vrm diffère, parce que avant savait pas c’était quel
qu’est ce que le test de Scheffé
un test post hoc
Qu’est ce que la variation intergroupe et intra groupe?
.
que permet de conclure l’ANOVA?
si un ou des groupes « n’appartient(nent) pas » à la même population (H0 vs H1) en tenant compte du risque d’erreur alpha.
les échantillons viennent de la même population on doit alors …(hypothèse)
rejet H0
V ou F: Le type d’ANOVA que nous allons couvrir présume que les groupes sont indépendants.
vrai
le problème du cumul d’erreur alpha:
En comparant 10 groupes, le cumul de l’erreur alpha devient 0,90 ! Nous avons 90 % de chance de commettre au moins une erreur alpha (a = 0,05).
- En concluant au rejet de H0 pour ces deux groupes le risque d’erreur n’est pas de 5 %, mais bien de 90 % !
- Alors en concluant H0, une erreur alpha est très probable
quel est la solution au cumul d’erreur alpha?
correction bonferroni, c’est quoi?
Formule : alpha / nombre de comparaisons
Donc, si 8 tests t sont réalisés : 0,05 /8, le nouvel alpha sera de 0,006.
que permet de diminuer la correction de bonferroni?
La correction diminue le risque de commettre une erreur de type I, mais elle devient trop stricte lorsque beaucoup de comparaisons sont réalisées. Il est alors risqué de faire une erreur de type II.
Quel sont les différence entre L’ANOVA et le test t?(3)
sur le cumul erreur
nbr groupe
échantillons
▫ L’ANOVA ne cause pas de problème de cumul de l’erreur
d’inférence, tous les groupes sont comparés en même temps;
▫ L’ANOVA ne limite pas le nombre de groupes qui peuvent être comparés;
▫ L’ANOVA peut être utilisée avec des échantillons de presque toutes les tailles.
- L’ANOVA devient progressivement instable lorsque les échantillons sont très petits (n < 10) et/ou trop hétérogènes (la taille des échantillons diffère trop).
quelle est la différence de se que calcul le test t et l’ANOVA?
▫ Le test t
- Calcule la différence entre deux groupes.
- Calcule l’erreur type de la différence.
- Calcule le rapport entre ces deux éléments (tobservé).
▫ L’ANOVA
- Calcule la différence entre les groupes (s2inter).
- Calcule l’erreur type de la différence entre les groupes (s2intra).
- Calcule le rapport entre ces deux éléments (Fobservé).
exemple ou on pourrait utiliser ANOVA
Nous désirons savoir si un médicament est efficace.
▫ Nous sélectionnons aléatoirement trois groupes de patients.
- Groupe 1: reçoit le médicament.
- Groupe 2: reçoit un placébo.
- Groupe 3: ne reçoit ni médicament ni placébo.
OU
▫ Nous désirons connaître si le climat de travail dans une organisation est stable, ou semblable dans toutes les unités administratives.
▫ Nous sélectionnons aléatoirement un groupe d’employés dans chaque unité administratives.
- Groupe 1: département des ventes.
- Groupe 2: département de l’approvisionnement.
- Groupe 3: département de l’administration.
- Groupe 4: département des ressources humaines.
- (Etc.)
QU’EST ce que la VI
et la VD
La VI = la caractéristique qui définit les niveaux (groupes). Possède un seul continuum conceptuel divisé en « niveaux » discrets. En d’autres mots, la VI doit être une variable nominale ou ordinale.
La VD = la mesure sur laquelle nous comparons les groupes.
quelle est la limite du nombre de niveau de VI
aucune
quel variable est
-Variable à intervalles ou de rapport / ratio.
à intervalles ou de rapport / ratio. = VD
on va utiliser le H0 et Le H1 lorsque ….
▫ H0 : ΧA = ΧB = ΧC (les trois Χ sont égales).
- La différence entre les Χ n’est pas assez grande ou attribuable au hasard.
- La note moyenne obtenue par les trois groupes d’étudiants sera semblable.
▫ H1 : ΧA, ΧB, ΧC ≠ (une Χ ou plus est différente des autres).
- La différence entre les Χ est plus grande que celle attribuable au hasard.
- La note moyenne obtenue par au moins un groupe d’étudiants sera
significativement différente.
variance intra-groupes fait référence à
Les notes des étudiants de chaque groupe varient.
Le degré avec lequel les notes des étudiants dans chaque groupe diffère est, conceptuellement « la variance intra groupe » ou s2intra. La s2intra est l’erreur type de la différence entre les Χ !
on utilise la varaition intragroupe et extra groupes car…
?
(Pour l’analyse de ANOVA on doit…), il f établir le rapport entre la variance « inter » et la variance « intra » (s2inter / s2intra).
Plus grand est ce rapport, plus il est probable que les groupes__________________ population (« __________ de H0 ».)
les groupes ne proviennent pas de la même population (« rejet de H0 ».)
on calcul le SC intra à partir de quoi?
La SCintra est calculée à partir de la somme des différences
entre les observations x et leurs propres groupes, (xi - Χ). Cela implique que plus nous avons d’observations, plus grande sera la taille de la SCintra.
Le SCinter est calculer à partir de …
La SCinter est calculée a partir de la somme des différences
entre les observations Χj et la grande moyenne, (Χj – ΧG). Cela implique que plus nous avons de groupes, plus grande sera la quantité SCinter.
faut tu faire une correction poursur les SCinter et intra?
oui
quel est la correction sur la SC inter et intra?
étant respectivement affectées par le nombre de groupe (K) et le nombre d’observations (x), nous corrigeons en calculant leurs moyennes.
▫ SCΧ inter = SCinter/le nombre de groupe K.
▫ SCΧ intra= SCintra/le total des observations (de tous les groupes).
à quelle taille le F est-il assez grand pour être
« significatif » ? (ANOVA )
Pour répondre a la question il faut se référer a la distribution de la statistique F.
distribution statistique F
▫ Développée comme la distribution z ou t.
▫ Il faut démarrer avec une population normale d’observations (donc ayant une seule moyenne).
▫ Tirer un nombre infini de deux échantillons de la même taille n.
▫ Pour chaque paire d’échantillons, calculer la statistique F (Fobservé = SCΧinter /SCΧintra).
▫ Permet de construire une distribution des Fobservé .
▫ Répéter la procédure pour créer des distributions séparées avec plus d’échantillons (K = 3, 4…10 etc…) et pour différents nombre d’observations (n = 5,10,300 etc…). Ceci est semblable à la distribution t.
50
Moins de 5 % des échantillons extraits de la même population auront une statistique F égale ou plus grande que le Fcritique. Ceci correspond à quel risque ?
au risque que nous prenons de commettre une erreur de type I.
Il faut rejeter H0 lorsque…
Fobservé est ≥ que le Fcritique. Cela implique que
moins de 5 % des groupes provenant de la même population obtiennent
un tel Fobservé.
Le Fcritique est plus petit lorsque :
a : le seuil alpha est plus grand (0,05 au lieu de 0,01). Nous acceptons un risque plus grand d’erreur a).
n : un grand n et/ou (un grand n produit une erreur-type de la différence plus petite).
K : beaucoup de niveaux de la VI (plus nous avons de groupes, il est plus probable qu’au moins un groupe sera différent).
complète:
plus petit est le F critique, plus probable le ______ de H0
rejet
signification pratique VS statistique
▫ La signification statistique indique si les groupes diffèrent significativement. (Ne fait que nous indiquer le risque d’erreur de conclure que les échantillons ne proviennent) pas de la même population.
▫ La signification pratique est un jugement porté sur l’importance de la différence.
le rejet de H0 est-il fortement influencé par n?
oui
Le t ou le F significatif est–il alors attribuable à une grande différence entre les Χ ou bien à un grand n?
explique moi pour la moyenne
ou bien grand échantillons
- Si c’est la différence entre les Χ qui « cause » la différence cela pourrait être un résultat « important » (plus d’implications pratiques).
- Si c’est le fait que nous avons un grand échantillon, la différence pourrait être moins intéressante (i.e. moins d’implications pratiques).
qu’est ce que la taille d’effet?
▫ La taille de l’effet chiffre la taille de la différence
statistiquement significative (0 % a 100 %). Elle estime la taille de la différence entre les deux ou plusieurs Χ.
▫ La taille de l’effet est toujours de zéro si la différence n’est pas statistiquement significative.
calcul taille effet
Les statistiques comparent les Χ : la différence « inter »
groupe.
La somme de ces deux éléments est le total de toutes les différences. Le rapport inter/total est la taille de l’effet.
taille d’effet grande ou petite ou moyenne quand …. (%)
- 0,01 – 0,05 (1 à 5 %) au moins = petite taille d’effet.
- 0,06 - 0,139 (6 à 14 %) = taille d’effet de taille
moyenne. - 0,14 et plus = grande taille d’effet.
De toutes les différences qui existent dans nos données, quelle
est la proportion de ces différences attribuable à la différence
entre les groupes?
calcul?
- La différence entre les groupes = SCinter.
- La différence entre les individus= Scintra.
- Toutes les différences = SCtotal= SCinter + SCintra
Il faut donc établir le rapport entre SCinter et SCtotale (éta au carré (h2)).
à quoi sert le test post-hoc?
Un résultat d’ANOVA statistiquement significatif indique qu’au moins un groupe est différent des autres. MAIS QUEL GROUPES?
–> permet de déterminer lequel
exemple de test post-hoc?
Scheffé
explique moi le résultat si j’obtiendrais un F de 5,18:
la différence entre les moyennes est de 5,18 fois + grande que la différence que si tous les groupe aurait été de la même population
f critique plus petit quand:
pour le ; alpha, n et k
a : le seuil alpha est plus grand (0,05 au lieu de 0,01). Nous acceptons un risque plus grand d’erreur a).
n : un grand n et/ou (un grand n produit une erreur-type de la différence plus petite).
K : beaucoup de niveaux de la VI (plus nous avons de groupes, il est plus probable qu’au moins un groupe sera différent).