cours 5 - ANOVA, tests non paramétriques et test d'indépendance du khi carré Flashcards
- Vrai ou Faux? J’effectue un test d’ANOVA à une voie. À l’obtention d’un résultat significatif (p<0.05), je peux conclure que les moyennes entre mes groupes sont inégales. Justifiez votre réponse
Vrai ou faux?, car si ma valeur de p est < 0.05, je rejette mon Ho (il n’existe pas de différence entre les moyennes de mes groupes) au profit de Ha (il existe une différence de moyenne ENTRE AU MOINS un des groupes)
- Quels sont les paramètres principaux qui permettent d’estimer la distribution des observations ?
la moyenne, l’écart-type et la variance (utilisé dans les tests paramétriques comme t et anova)
- Un chercheur avance l’hypothèse que le nombre de crimes commis diffère selon le type de crime dont il est question. Il compare alors les meurtres, les agressions sexuelles, les vols et les enlèvements. Il décide de tester son hypothèse à l’aide d’un test ANOVA à une voie et trouve un résultat significatif pour son modèle. Peut-on conclure qu’il existe une différence du nombre de crimes commis entre les meurtres et les vols ? Si oui, expliquez comment. Sinon, expliquez que faire pour explorer cette différence.
Non - on sait qu’il existe une différence significative entre au moins deux types de crimes mais on ne sait pas quelles paires de groupes. Pour déterminer lesquels, il faut procéder à des tests post hoc afin de déterminer quelles paires spécifiques de moyennes sont significativement différentes c’est-à-dire calculer l’effet de taille. On utilise Tukey si la taille est semblable et Scheffe si non. On ne connait pas la taille?
- Qu’est-ce qu’un test de khi carré permet de démontrer quant aux effectifs observés (EO) et aux effectifs théoriques (ET) d’une distribution de données? Répondez tout en expliquant ce que sont les EO et les ET.
ET est la proportion des unités statistiques s’il n’y avait aucun lien entre les variables
EO les proportions de ce qui est observé dans l’échantillon.
On compare les écarts entre ET et EO et s’ils sont semblables, on peut attribuer les écarts au hasard de l’échantillonnage. si les écarts sont élevés on peut conclure qu’il existe un lien entre les variables
- Que signifie le terme « un test omnibus »?
Le terme “test omnibus” un test statistique qui indique si le modèle est significatif dans l’ensemble et donc s’il existe au moins une des moyennes qui est différentes des autres. il faut continuer avec des tests post hoc.
- Qu’est-ce que le test de Shapiro et expliquez quand et pourquoi il est nécessaire de l’utiliser?
Le test de Shapiro est un test de normalité qui indique si les données dans les échantillons sont distribuées normalement (si les données proviennent d’une population qui suit une loi normale) et il est important de l’utiliser afin de savoir quel test paramétrique ou non paramétrique utilisé.
- Lorsque je fais le test d’indépendance du khi carré, est-ce que c’est important de prendre en considération les valeurs aberrantes ou non? Pourquoi?
Non car le test du khi carré est seulement pour les variables catégorielles, sur qui les valeurs aberrantes ont moins d’impact puisque le test se base sur les fréquences observées et les classements de variables.
- Est-ce que le fait d’avoir une valeur aberrante dans le test de Wilcoxon-Mann-Whitney va nuire aux résultats? Justifiez votre réponse.
Non car c’est un test de rang (donc il se base sur les classements des observations et non les valeurs brutes des observations) et utilise la médiane comme paramètre (qui est peu ou pas influençable par une valeur aberrante comparé à la moyenne et l’écart type) et est non paramétrique.
- Après avoir réalisé un test du khi carré et conclu qu’il était significatif, nous souhaitons nous interroger quant à la taille de l’effet trouvé. Pour ce faire, quelle mesure devons-nous utiliser?
Le résultat de celle-ci est de 0,2793, que pouvons-nous conclure quant à la force de la relation entre nos deux variables ?
Nous devons utiliser le V de cramer afin de connaître la force de la relation. 0.2793 indique un effet de taille moyen, donc nous pouvons nous demander s’il existe vraiment un lien entre les deux variables catégorielles. On doit tout de même prendre en compte le contexte spécifique.
- Vrai ou faux ? Dans le test d’indépendance du khi carré, si la valeur de p est inférieure au niveau de signification choisie (par exemple, α = 0,05), cela signifie qu’il y a une relation causale entre les variables étudiées. Justifiez votre réponse.
Faux, le test ne permet pas d’établir une relation causale (juste de dire s’il existe une dépendance statistique entre deux variables catégorielles sans savoir la direction ni la causalité): il faut calculer l’effet de taille si on trouve que p > 0.05 avec le V de cramer (trouver la force de la relation entre les deux variables). Plus la valeur est proche de 1 et plus la valeur statistique est réellement forte.
- Est-il possible de faire le test Wilcoxon-Mann-Whitney avec uniquement des variables catégorielles? Si oui, expliquer pourquoi. Le cas échéant, expliquer quel test serait préférable et la manière de présenter les données pour les évaluer.
Non, le postulat du test de Wilcoxon-Mann indique seulement des variables continue ou ordinales pour les deux groupes. Le test préférable serait le test d’indépendance du khi carré avec un tableau de contingence.
- Dans quelles situations devons-nous utiliser un test non paramétrique ? 2 raisons
lorsque les données ne suivent pas une distribution normale ou que les échantillons appariés sont de petites tailles (<30)
- Nous savons que les tests non paramétriques effectuent de l’inférence statistique sans supposer quoi que ce soit sur la distribution des échantillons. Sur quel paramètre se basent plusieurs de ces tests ? Pourquoi considère-t-on ce paramètre comme étant une mesure non paramétrique?
la médiane est une mesure non-paramétrique puisqu’elle ne donne pas d’information sur la distribution sous-jacente des observations
- Avec des données distribuées non normalement et un petit échantillon, quel test pouvons-nous alors faire?
Un test non paramétrique comme le Wilcoxon-Mann Whitney qui permet de comparer deux échantillons de petite taille qui ne sont pas distribués normalement. Un test du khi doit avoir un min de 5 observations par catégorie (80% des cellules)
- Expliquez pourquoi une haute valeur de F, lors d’un test ANOVA à une voie, augmente la probabilité de rejeter H0
Plus la statistique de F est grande, plus le test est significatif et plus le test est significatif, plus on a de chances de rejeter Ho parce qu’il y a une différence entre les moyennes.