Stats 5 Flashcards
Associer les tests avec la situation :
Test de comparaison des moyennes de 2 échantillons indépendants
Test de comparaison des moyennes pour des données appariées
Test de comparaison des moyennes pour plusieurs groupes
Test de comparaison des proportions pour tableau 2x2
Test de comparaison des proportions pour tableau 2x2 avec n < 5
Test de comparaison des proportions pour tableaux c x r
Test de comparaison des proportions pour tableau c x r avec n < 5
Test de comparaison des moyennes de 2 échantillons indépendants : t-test
Test de comparaison des moyennes pour des données appariées : t-test apparié
Test de comparaison des moyennes pour plusieurs groupes : ANOVA
Test de comparaison des proportions pour tableau 2x2 : test d’hypothèse pour différence de proportion (z) ou chi-carré
Test de comparaison des proportions pour tableau 2x2 avec n < 5 : Fisher exact
Test de comparaison des proportions pour tableaux c x r : chi-carré
Test de comparaison des proportions pour tableau c x r avec n < 5 : test non paramétrique ou chi-carré mais analyse non fiable
Pour quelles types de variables et situations fait-on des analyses non paramétriques ? (2 variables + 2 situations)
Variables qualitatives ordinales
Variables quantitatives
Quand on soupçonne un très grand écart entre les distributions étudiées et la distribution normale
Quand n < 30
Vrai ou faux : on émet des hypothèses sur la distribution des variables lorsqu’on fait des tests non-paramétriques
FAUX
se sont des tests distribution free c-a-d que les résultats ne dépendent pas de la distribution de la variable sous-jacente à priori
Comment appelle-t-on aussi les tests non paramétriques ?
statistiques de rang
2 classes de tests non paramétriques
- échantillons indépendants
- échantillons dépendants/appariés
Nommer les 3 tests non paramétriques pour échantillons indépendants
Test de Wilcoxon pour échantillons indépendants
Test U de Mann-Whitney
Test du H de Kruskall-Wallis
Nommer les 3 tests non paramétriques pour échantillons appariés
Test des signes
Test des rangs de Wilcoxon
ANOVA de Friedman
Quel est le test non paramétrique équivalent au test t de Student pour échantillons indépendants ?
Test de Wilcoxon pour échantillons indépendants
Quelles sont les hypothèses pour le test de Wilcoxon pour échantillons indépendants ?
H0 : les 2 distributions de la variable dans les populations X et Y sont identiques.
–> Mx = My
Ha : les deux distribution de la variable dans les populations X et Y sont différentes
–> Mx pas égale à My
Comment fait-on un test de Wilcoxon pour des échantillons indépendants ?
- Hypothèses du test
- Classer en ordre les valeurs des observations pour chaque population
- Déterminer le rang de chaque observation.
Si on a 3 valeurs identiques = alors on fait la moyenne de leur rang pour déterminer le rang qui s’applique à toutes ces valeurs - Faire la somme des rangs pour chaque échantillon
- Prendre l’échantillon avec le plus petit échantillon
- consulter le tableau des valeurs critiques et trouver les 2 valeurs
- ne pas rejeter H0 si la somme des rangs est dans l’intervalle des 2 valeurs.
Qu’est-ce qu’on obtient avec le tableau des valeurs critiques pour le test de Wilcoxon (échantillons indépendants) ?
On obtient 2 valeurs :
1ère valeur : somme des rangs aussi (ou encore plus) petite que la première valeur
2e valeur : somme des rangs aussi (ou encore plus) grande que la deuxième valeur
Donne la probabilité de certaines valeurs de somme des rangs du plus petit échantillon
Les résultats du test U de Mann et Whitney sont algébriquement identiques à quel test non paramétrique ?
Test de Wilcoxon pour échantillons indépendants
Comment fait-on un test U de Mann-Whitney ? (Étapes , pas la formule)
- Écrire les hypothèses
- Combiner les deux groupes et attribuer un rang aux observations (1 = 1ère observation)
- Comparer ensuite chaque membre d’un échantillon avec chaque membre de l’autre échantillon, à tour de rôle
- Pour chaque observation, attribuer le score qui compte pour le nombre de fois ou elle a été dépassée dans l’autre échantillon
5.Calculer les nombres totaux de score de chaque groupe (« statistiques U ») - Se référer au nombre de score auxquels on peut s’attendre sous H0.
Ou on peut utiliser une formule.
Quelle est la méthode avec la formule pour le test de U de Mann-Whitney
On calcule les U de chaque échantillon. On prend le plus petit des 2 U et on le compare à celui du tableau de Mann-Whitney.
Plus le U calculé est petit, plus le p-value sera petit et plus la différence sera stat. significative.
Quelle est la formule pour calculer un U de Mann-Whitney ?
U2 = n1xn2 + (n2(n1+1)/2) - S2
U1 = n1xn2 + (n1(n2+1)/2) - S1
S = somme des rangs
n = taille d’échantillons
Le test du H de Kruskall-Wallis est la généralisation à plusieurs populations de quel test ?
Test de la somme des rangs de Wilcoxon-Man-Whitney bilatéral
Que teste le test du H de Kruskall-Wallis ?
L’hypothèse selon laquelle toutes les populations ont la même médiane (même position).
Pas de supposition par rapport à la distribution (normalité)
Quelles sont les étapes d’un test H de Kruskall-Wallis ?
- Combiner toutes les observations de tous les groupes
- Ordonner de la plus petite (rang 1) à la plus grande (rang n1 + n2 + · · · ). Si plusieurs observations ont la même valeur = on fait la moyenne
- On fait ensuite la somme des rangs de chaque groupe (Si) ainsi que la moyenne des rangs de chaque groupe (Si/n1).
- On calcule également la moyenne globale de tous les rangs (Sglob)
- Il est possible de calculer l’analogue non-paramétrique du SST dans l’ANOVA
(on l’appelle SSTNP)
De quelle fonction est la statistique H (K-W) ?
SSTNP
Inteprétation du test SSTNP :
Si/ni à peu près équivalents dans les 2 échantillons
H0 est vraie. Les 2 populations/échantillons ont environ la même position.
SSTNP est relativement petite
Quand les ni sont assez grands (> 5), que peut-on démontrer avec la statistique H (K-W) ?
Quand les ni sont assez grands (> 5), on peut démontrer que la statistique H suit une distribution du X^2 avec k-1 degrés de liberté (k étant le nombre de groupes comparés).
Il est donc possible d’utiliser cette distribution (X^2) pour connaître la probabilité d’obtenir un H égal (ou plus grand) que celui obtenu si l’hypothèse nulle est vraie (p-value).
Quelles sont les hypothèses d’un test des signes?
Probabilité que D > 0
H0 : il y a un nombre égal de différences dans chaque direction (1/2 vs 1/2)
Ha : il n’y a pas un nombre égal de différences dans chaque direction (pie = pas 1/2)
Que regarde le test des signes ?
Le sens de l’écart entre les paires de valeurs. Pas l’importance de la valeur.
Pour quels types de variables peut-on utiliser un test des signes?
quantitatives, ordinales, binaire.
Quel est l’homologue paramétrique du test des signes ?
Test t de Student pour échantillons appariés
Quelle est la statistique pour le test de signes ?
S est la statistique naturelle
Quelles sont les valeurs de delta possible avec le test des signes ?
0 si < 0 ou 1 si > 0
Quelle loi suit la statique S si H0 est vraie ?
Quelle loi suit la statistique S quand n est > 30 ?
Sous H0, S suit une loi binomiale b(n, 1/2).
Si n > 30, S suit une loi normale de moyenne n/2 et de variance n/4
Quelle est la différence entre le test de signes et le test des rangs signés de Wilcoxon ?
Le test de Wilcoxon utilise l’importance relative des écarts lors de la définition de la statistique du test.
Le test des signes d’intéresse à la direction de la différence uniquement.
Quelles sont les hypothèses du test des rangs signés de Wilcoxon ?
H0: La médiane des differences entre les paires dans la population sous-jacente est de 0
Ha : la mediane des differences entre les paires est differentes de 0
Quelles sont les étapes d’un test de rangs signés de Wilcoxon ?
- On ignore le sens des di fférences (le signe) et on les classe de la plus petite à la plus grande. Les di fférences de 0 sont éliminées de l’analyse.
- On attribue ensuite un signe au rang, en fonction du signe de la di fférence.
- On fait la somme des rangs positifs et celle des rangs négatifs.
- Pour un test bidirectionnel, on retient la plus petite des deux sommes.
Pour le test unidirectionnel, le choix de la somme dépend de la direction de l’hypothèse alternative. - On consulte la table de Wilcoxon pour échantillons pairés. Cette table fournit les probabilités associées à l’obtention de certaines sommes de rangs (ou de sommes inférieures) quand les distributions sont les mêmes (sous H0).
Quelle table utiliser pour le test des rangs de Wilcoxon quand n est assez grand ?
La table de la loi normale
Si les données sont distribuées normalement, quels tests sont plus puissants ? (paramétriques vs non paramétriques)
Paramétriques
Quels tests sont plus faciles à interpréter (paramétriques vs non paramétriques) ?
paramétriques
Quand fait-on un ANOVA de Friedman ?
Quand on a plusieurs échantillons appariés (K>2 , donc 3)
Quelle est la statistique d’un ANOVA de Friedman ?
Coefficient F de Friedman
ANOVA de Friedman :
Quand K est inférieur à 6 ou N est inférieur à 14, à quoi compare-t-on F ?
Quand K est supérieur à 5 ou N est supérieur à 13, F suit quelle loi de probabilité?
On compare F à la valeur critique issue de la table de Friedman
F suit la loi de probabilité du X^2 à (K-1) degrés de liberté.
Quel est l’équivalent paramétrique du Test de Kruskall-Wallis ?
ANOVA (analyse de variance)