Chapitre 13 : L'analyse paramétrique et l'analyse catégorielle Flashcards

1
Q

Qu’est-ce que les analyses paramétriques?

A
  • Elles servent à estimer des paramètres (alors reliés à une population) à partir d’un échantillon.
  • Nous nous servons de statistiques (Χ, s, rxy) provenant d’échantillons afin d’estimer les paramètres (m, s, r) de la population.
  • Servent aussi à prendre différentes décisions relatives à deux ou plusieurs variables, lorsque leurs postulats sont respectés:
  • -> Liens entre des variables continues : corrélation de Pearson.
  • -> Prédiction du score d’une VD à partir du score d’une VI : régression simple.
  • -> Différence entre deux moyennes ou plus : test t, ANOVA (et MANOVA).
  • Les inférences (vérification d’hypothèses et tests de signification) présument des populations normalement distribués.
  • -> Même si notre échantillon ne se distribue pas normalement en raison de sa taille (ex. test t sur des petits échantillons), nous pouvons faire une analyse paramétrique lorsque nous savons que théoriquement, nos variables se distribueraient normalement avec un plus grand échantillon ou dans la population.
  • Les probabilités sont calculés à partir de la courbe normale (ou à l’aide d’autres distributions dérivées de la courbe normale: t, F).
  • Utiles pour les variables(VD) à intervalle ou de rapport / ratio.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est-ce que les statistiques non paramétriques?

A
  • Ne présument pas que nous voulons estimer les paramètres de la population, d’où l’appellation «non paramétrique».
  • Ne présument pas que les populations relatives aux variables à l’étude sont normalement distribuées.
  • Utilisables lorsque les postulats, au-delà de la normalité, des analyses paramétriques ne sont pas respectés (linéarité, homogénéité des variances, valeurs extrêmes, etc.).
  • Aussi utilisable pour des variables catégorielles (nominales, ordinales), donc non continues.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quelles sont les différences entre les stats paramétriques et non paramétriques?

A
  • VD :
  • -> Para : Rapport/intervalle
  • -> Non-para : Nominale/ordinale et Rapport/intervalle
  • Normalité :
  • -> Para : Oui
  • -> Non-para : Non
  • Inférence :
  • -> Para : Moyenne (X/m)
  • -> Non-para : Fréquence
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quelles sont les équivalences des tests paramétriques et non-paramétriques?

A
  • Lien/relation :
  • -> Para : Pearson
  • -> Non-para : Spearman, khi-carré
  • Différence 2 groupes indépendants :
  • -> Para : t (indépendants)
  • -> Non-para : Mann-Whitney (U), khi carré
  • Différence 2 groupes pairés :
  • -> Para : t (pairés)
  • -> Non-para : Wilcoxon (Z)
  • Différence 1 VI K groupes indépendants :
  • -> Para : ANOVA simple
  • -> Non-para : Kruskal-Wallis (H)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Qu’est-ce que le test khi carré?

A
  • Le khi-carré analyse la différence entre la taille des fréquences pour des variables nominales et leurs fréquences «attendues». Est-ce que cette différence est aléatoire ou témoigne-t-elle d’une association entre les deux variables ?
  • L’analyse réponds à la question suivante : est-ce qu’il existe une relation/association entre les fréquences appartenant à différents niveaux de variables catégorielles?
  • Il faut mettre à l’épreuve l’hypothèse d’indépendance entre les variables.
  • Pour y arriver, il faut vérifier la distribution conjointe des variables (tableau de contingence /tableau croisé).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Le khi carré indique-t-il une association ou une différence entre les variables?

A

C’est plutôt quand on interprète les résultats qu’il y en a qui vont plutôt isoler une différence

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quel est le jeu d’hypothèse pour le khi-carré?

A
  • H0 : les variables ne sont pas associées / la répartition entre les catégories des variables est aléatoire.
  • H1 : il y a une association entre les variables / la répartition entre les catégories des variables est différente de ce qui serait théoriquement attendu (s’il n’y avait pas de lien).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Comment peut-on conclure au rejet ou non rejet de H0?

A
  • Il faut calculer la répartition entre les catégories comme ce qu’il serait attendu théoriquement (aucune association / aucune variance entre les catégories): fréquence attendue: fa.
  • Il faut ensuite comparer les fa aux données / fréquences observées: fo et calculer les différences.
  • La décision (H1 vs H0) dépends de la taille de la différence entre les fo et les fa.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Comment calcule-t-on la fréquence attendue?

A

fa = total de rangée * total colonne / n

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Comment calcule-t-on X²?

A

X² = Somme(fo −fa)²/fa

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Comment peut-on interpréter le lien entre le rapport fa/fo et X²?

A
  • Il faut comparer la différence entre la fo et la fa relative à la fa.
  • Plus grand est ce rapport, plus élevé sera le khi-carré.
  • Si fa = fo, c2 = 0.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Comment calcule-t-on les d.l. pour le khi carré?

A
  • Pour le X², il faut comparer la taille des fréquences entre les niveaux des variables catégorielles (colonnes et rangées).
  • Comme pour les moyennes, si nous connaissons N, ainsi que le nombre d’observations dans chaque catégories sauf une, nous pouvons quand même inférer le nombre d’observations de cette dernière –> n’est donc pas indépendante et faut retirer d.l.
  • **dl = (rangées -1) * (colonnes – 1)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Comment peut-on conclure au rejet ou non rejet de H0 avec la valeur de X²?

A

Si X² observé > ou = X² critique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qu’est-ce que la taille de l’effet du khi carré?

A
  • La taille de l’effet suite à un X² statistiquement significatif (2 x 2) peut être calculée avec le coefficient phi (f).
    Ce coefficient s’exprime en % : (f = .10 = 10 % de variance expliquée).
    f = √(X²/𝑛)
  • Si taille d’effet trop faible, on peut être face à un effet/différence statistique ou à cause de la taille de l’échantillon
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est-ce que le V de Cramer?

A
  • Nous savons que la taille du X² est déterminée d’une part par la différence entre la taille des fréquences, mais aussi par le nombre de catégories.
  • La taille de l’effet doit alors distinguer ces deux influences (lorsque nous avons un devis autre que 2 x 2).
  • Le V de Cramer aide à produire cette distinction.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Comment procède-t-on à un X² à une rangée?

A
  • Chi carré de différence : souvent ce genre de problème là
  • Exemple : dé truqué
  • -> H1 : Le dé est truqué, il ne respectera pas les probabilités
  • -> H0 : Le dé est normal, il respectera les probabilités
  • fa = n / nombre de cases ou possibilités
  • X² = Somme (fo−fa)²/fa
17
Q

Quelle est une étape recommandée de faire avant de vérifier les postulats?

A

Avant de vérifier les postulats, Field suggère de chercher les valeurs extrêmes ou “outliers”.
Ces valeurs affectent les stats qui se servent de la moyenne (les valeurs extrêmes vont faire “gonfler” artificiellement les mesures de dispersion)

18
Q

Quelles sont les questions à se poser avant d’éliminer ou remplacer les données?

A
  • Est-ce possible que ce soit des erreurs de mesure?
  • Est-ce que cette mesure est possible et réelle?
  • Est-ce que cette mesure, quoique réelle, m’empêche de répondre à ma question?
19
Q

Quelles sont les étapes primordiales avant de vérifier les postulats?

A
  • Vérifier la linéarité des variables. L’ensemble des stats para que nous avons étudié sont des stats linéaires.
  • Pour des variables non-linéaires, il est idéal d’utiliser les analyses non-linéaires appropriées (pas apprise)
20
Q

Quelles sont les conditions pour utiliser ou ne pas utiliser les analyses paramétriques?

A
  • Normalité :
  • -> En raison du théorème de la limite centrale, on se soucie moins de la normalité pour les grands échantillons (ce sont les valeurs extrêmes qui les affecte davantage)
  • -> Dans des plus petits échantillons, si nous faisons des tests d’hypothèse, des intervalles de confiance ou tentons d’estimer des paramètres, le postulat de normalité est plus important.
21
Q

Qu’est-ce que le test de Mann-Whitney?

A
  • Le U de Mann-Whitney est un test de différences de moyennes, pour deux groupes indépendants.
  • À utiliser lorsque la distribution des groupes à comparer est très asymétrique ou lorsque l’on doute fortement de la normalité de la population
  • Pour réaliser ce test, il doit être possible de mettre en rang les résultats obtenus sur la variable dépendante, pour les deux groupes
22
Q

Quelle est la logique derrière la Mann-Whitney?

A
  • Tout d’abord, nous placer en ordre toutes les observations, de 1 à n, peu importe leur groupe respectif.
  • Selon la logique, il devrait y avoir autant d’individus (ou d’observations) détenant un rang élevé et faible dans les deux groupes.
  • Si l’on additionne les rangs attribués aux deux groupes, les deux sommes devraient être identiques lorsqu’il n’y a pas de différence.
23
Q

Quelle est la formule pour le U de Whitney?

A

𝑈= 𝑛1𝑛2+ (𝑛1 (𝑛1+1))/2 − 𝑅1
où R1 = somme des rangs du groupe 1
n = nombre de rangs dans un groupe

24
Q

Quelles sont les hypothèses H0 et H1 pour le Mann-Whitney?

A

H0 : Les deux groupes sont similaires

H1 : Il existe une différence significative entre les deux groupes

25
Q

Comment peut-on conclure au rejet ou non rejet de H0?

A
  1. Calculer erreur type de la moyenne (SEu) qu’on calcule avec cette formule :
    𝑆𝐸𝑈= √𝑛1𝑛2 (𝑛1+𝑛2+1)/12
  2. Calculer z du U de Mann-Whitney avec cette formule :
    𝑧𝑈= (𝑈 −[(n1 ∗ n2) / 2])/𝑆𝐸𝑈
  3. Si Zu est plus grand ou égale (?) au seuil de signification choisi (souvent p = 0,05 et z = 1,96), on conclure au rejet de H0.
26
Q

Quelle est la taille d’effet pour le Mann-Whitney?

A

La taille d’effet pour le Mann-Whitney est le r, qu’on peut calculer ainsi :
𝑟= Zu /(√𝑁)

27
Q

Qu’est-ce que le test de Wilcoxon?

A
  • Le test de Wilcoxon est un test de différences de moyennes, mais pour des groupes appariés (équivalent test t pairé)
  • Sa logique est la même que celle du test Mann-Whitney, à l’exception que c’est la différence entre les scores des deux conditions appariées qui est mise en rang.
  • Pour répondre au test d’hypothèse, la standardisation est aussi utilisée
  • La taille d’effet se calcule de la même manière que pour le U de Mann-Whitney
28
Q

Qu’est-ce que le test de Kruskal-Wallis?

A
  • Le test se base sur la même logique que et est une extension du Mann-Whitney, de la même manière que l’ANOVA est une extension du test t.
  • La mise en rang permet de calculer la statistique H
  • Pour répondre au test d’hypothèse, la valeur Hobservée sera comparée à un Hcritique obtenu avec la même table que celle utilisée pour le khi-carré.
29
Q

Comment calcule-t-on le H de Kruskal-Wallis? Et comment calcule-t-on les d.l. de Kruskal-Wallis?

A
𝐻= ( (Somme 𝑅²/𝑛) /(𝑁(𝑁+1)/12) )−3(𝑁+1) 
d.l. = K - 1
30
Q

Quels sont les tests post-hoc et la taille d’effet pour le Kruskal-Wallis?

A
  • Pour les tests post-hoc, la première option est de réaliser des tests Mann-Whitney avec chaque paires de groupes **Attention au cumul de l’erreur alpha! Il faut alors utiliser la correction de Bonferroni.
  • Pour la taille d’effet, calculez la taille d’effet de chacun des U réalisés à titre de tests post-hoc.
31
Q

Pourquoi utilise-t-on des analyses non-paramétriques?

A

Tous les tests non paramétriques sont fait pour avoir infos/preuves sur échantillons et non pour généraliser sur toute la population, ne nous permettent pas de généraliser sur la population