ANOVA et comparaisons ou tests multiples Flashcards

1
Q

Qu’est ce que l’ANOVA ?

A

Analyse de variance permet de comparer plusieurs groupes entre eux afin de voir s’ils différent. Basé sur comparaison de la variance inter-groupes à la variance intra-groupes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quels sont les conditions d’application de l’ANOVA ?

A

Homogénéité des variances (homoscédasticité): peut être vérifier avec test de Levene ou O’Brien
Normalité: Variabilité des individu (erreur) explique pq scores pas tous sur moyenne, donc quand même normal
Indépendance des observations

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quel est la logique de l’analyse de l’ANOVA ?

A
  1. Variance inter-groupe: Selon le TCL, il existe un rapport entre la variance de la population et la
    variance d’une distribution (s2x=o2e/n) d’échantillonnage de la moyenne
  2. Variance intra-groupe: La variance de chaque échantillon peut aussi
    être utilisée comme une estimation de la variance de la population (o2e)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quels sont les principes de base de l’ANOVA ?

A
  1. Calcul variance qui tient compte de la vraiabilité individuelle (E) ET de la contribution du groupe (T) donc (E+T)
  2. Calcul variance qui tient compte de la variabilité individuelle seulement (E)
  3. On compare les deux: F=T+E/E
    SI les groupes sont égaux(T=0) alors F=1
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Comment on rapporte un ANOVA à plan simple ?

A

F([dlinter], [dlintra]) = [valeur p], n2= [valeur eta au carré]

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Résumé ANOVA

A

On souhaite comparer plusieurs échantillons (groupes).
On est capables d’estimer la variance de la population d’appartenance de ces échantillons (groupes) de deux manières (1. tient compte de l’influence de l’appartenance aux groupes, 2. exclue l’influence de l’appartenance aux groupes)
Si l’appartenance aux groupes n’a aucune répercussion sur les données observées, ces deux manières d’estimer la variance devraient donner des résultats équivalents.
Si l’appartenance au groupe a des répercussions sur les données observées, ces deux manières
d’estimer la variance ne devraient pas donner des résultats équivalents

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qu’est ce que les comparaisons multiples ?

A

Tests qui permet de savoir quelles moyennes diffèrent les unes des autres (nécessaire car ANOVA dit juste si il existe au moins un différence mais ne précise pas)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qu’est ce que le problème et la solution des comparaisons multiples ?

A

P: Plus on rend des décisions statistiques, plus on a de chances de faire des erreurs de type I (conclure à un effet alors qu’il n’y en a pas).
Il est logique de souhaiter éviter de conclure à un effet alors qu’il n’y en a pas!
S: On va donc tenter d’utiliser diverses procédures qui permettent de limiter les probabilités de faire une erreur de type I. On les appelle des procédures de contrôle du taux d’erreur (multiplicity control).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Dans quels contextes veut-on faire des comparaisons multiples ?

A
  1. Vérification du niveau de base : pour tester que deux groupes sont égaux sur
    plusieurs caractéristiques, dans avant de commencer une étude.
  2. Multiples groupes ou multiples mesures : Pour vérifier s’il existe des différences
    entre plusieurs groupes sur un certain nombre de mesures
  3. Certaines procédures statistiques : les régressions multiples et ANOVAs factorielles
    (prochain cours) produisent simplement plusieurs valeurs p
  4. « Data peeking » (mauvaise pratique) : faire des analyses pour voir si on doit recruter
    des participants de plus pour atteindre des résultats significatifs. La bonne pratique
    est de calculer la taille d’effet requise pour avoir une bonne puissance avant l’étude.
  5. Analyses intérimaires : des analyses sont planifiées avant la fin de l’étude afin de voir
    si on devrait la terminer plus tôt.
  6. Expéditions de pêche : recherche non planifiée de différences entre groupes, ou
    analyses de sous-groupes non planifiées.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quels sont les types de stratégies de contrôle du taux d’erreur ?

A

Par comparaison: ANOVA et c’est tout
Par famille: Comparaisons pour chaque groupes
Par expérience: Autre test statistique quelconque sur une autre variable dans cette même étude. Vous
venez les probabilités de faire une erreur dans l’expérience

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Devrait-on contrôle le taux d’erreur ?

A

Certains auteurs disent oui, d’autres non. Impossible de prouver qu’une manière de faire est miuex que l’autre. Si on fait tests u=multples non planifiés, on devrait utiliser stratégie de contrôle du taux d’erreur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Qu’est ce que le contrôle de taux d’erreur de l’ensemble EE ?

A

Quand on souhaite contrôler le taux d’erreur de type I que l’on risque de faire si on compare plusieurs moyennes à la suite d’une ANOVA significative.
Par ailleurs, on va demeurer flexible et on admet aussi qu’il est possible qu’il y ait plus d’un ensemble par étude

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quelles sont les stratégies de contrôle du taux d’erreur ?

A

Test t multiples
Bonferroni (méthode de Dunn)
Sidak-Bonferroni
Homl-Bonferroni
Benjamini-Hochberg
Test de Scheffé
Test de Tukeu (HSD)
Test de Newman-Keuls
Procédure de Ryan (REGWQ)
Fisher’s LSD

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qu’est ce que le test t multiples ?

A

Méthode
On fait une série de test-t (on compare les moyennes par paires)
On ne fait aucune correction du seuil alpha et on justifie cela par
le fait qu’on n’a qu’un petit nombre de comparaisons choisies à
l’avance (à priori) et/ou justifiées théoriquement.
Type de contrôle du taux d’erreur
Par comparaison

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est ce le test Bonferroni (méthode de Dunn)

A

Méthode
* On fait une série de tests statistiques (p. ex. tests-t)
* Et on utilise un seuil alpha plus petit pour chacun de ces tests (!”).
* On obtient ce seuil en divisant le taux EE maximum souhaité par le nombre de tests-t qu’on a fait (k).
Type de contrôle du taux d’erreur
* De l’ensemble
Inconvénients
* Peut produire des seuils alpha très petits si on fait beaucoup de
tests (très conservateur).
* Encore plus conservateur si les mesures sont corrélées les unes
aux autres.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qu’est ce que le Sidak-Bonferroni ?

A

Méthode
* Simplement une modification du Bonferroni.
Type de contrôle du taux d’erreur
* De l’ensemble
Inconvénients
* À peine moins conservateur que Bonferroni

17
Q

Quels méthodes ont été développées en réponse aux méthodes parfois trop strictes de contrôle du taux d’erreur ?

A

Contrôle du taux de fausses découvertes
Méthodes de contrôle du taux d’erreur par autoamorçage (bootstrapping)

18
Q

Qu’est ce que le test Holm-Bonferroni ?

A

Méthode
* On fait une série de tests statistiques (p. ex. tests-t)
* Et on utilise un seuil variable pour chacun de ces tests
* On obtient ce seuil ainsi :
* On classe les valeurs p obtenues par ordre croissant
* On compare la plus petite valeur p à a/k
Type de contrôle du taux d’erreur
* Taux de fausses découvertes

19
Q

Qu’est ce que le test Benjamini-Hochberg ?

A

Méthode
* On fait une série de tests statistiques (p. ex. tests-t)
* Et on utilise un seuil variable pour chacun de ces tests
* On obtient ce seuil ainsi :
* On classe les valeurs p obtenues par ordre DÉCROISSANT
* On compare la plus grande valeur p à a
* Si sig., on arrête car toutes les suivantes le seront aussi.
* Sinon, on compare la seconde plus petite à a/2, et on continue
ainsi de suite (tant qu’on n’obtient pas de résultats sig.) avec
des valeurs a de plus en plus petites
Type de contrôle du taux d’erreur
* Taux de fausses découvertes