Chapitre 13 : L'analyse paramétrique et l'analyse catégorielle Flashcards
Qu’est-ce que les analyses paramétriques?
- Elles servent à estimer des paramètres (alors reliés à une population) à partir d’un échantillon.
- Nous nous servons de statistiques (Χ, s, rxy) provenant d’échantillons afin d’estimer les paramètres (m, s, r) de la population.
- Servent aussi à prendre différentes décisions relatives à deux ou plusieurs variables, lorsque leurs postulats sont respectés:
- -> Liens entre des variables continues : corrélation de Pearson.
- -> Prédiction du score d’une VD à partir du score d’une VI : régression simple.
- -> Différence entre deux moyennes ou plus : test t, ANOVA (et MANOVA).
- Les inférences (vérification d’hypothèses et tests de signification) présument des populations normalement distribués.
- -> Même si notre échantillon ne se distribue pas normalement en raison de sa taille (ex. test t sur des petits échantillons), nous pouvons faire une analyse paramétrique lorsque nous savons que théoriquement, nos variables se distribueraient normalement avec un plus grand échantillon ou dans la population.
- Les probabilités sont calculés à partir de la courbe normale (ou à l’aide d’autres distributions dérivées de la courbe normale: t, F).
- Utiles pour les variables(VD) à intervalle ou de rapport / ratio.
Qu’est-ce que les statistiques non paramétriques?
- Ne présument pas que nous voulons estimer les paramètres de la population, d’où l’appellation «non paramétrique».
- Ne présument pas que les populations relatives aux variables à l’étude sont normalement distribuées.
- Utilisables lorsque les postulats, au-delà de la normalité, des analyses paramétriques ne sont pas respectés (linéarité, homogénéité des variances, valeurs extrêmes, etc.).
- Aussi utilisable pour des variables catégorielles (nominales, ordinales), donc non continues.
Quelles sont les différences entre les stats paramétriques et non paramétriques?
- VD :
- -> Para : Rapport/intervalle
- -> Non-para : Nominale/ordinale et Rapport/intervalle
- Normalité :
- -> Para : Oui
- -> Non-para : Non
- Inférence :
- -> Para : Moyenne (X/m)
- -> Non-para : Fréquence
Quelles sont les équivalences des tests paramétriques et non-paramétriques?
- Lien/relation :
- -> Para : Pearson
- -> Non-para : Spearman, khi-carré
- Différence 2 groupes indépendants :
- -> Para : t (indépendants)
- -> Non-para : Mann-Whitney (U), khi carré
- Différence 2 groupes pairés :
- -> Para : t (pairés)
- -> Non-para : Wilcoxon (Z)
- Différence 1 VI K groupes indépendants :
- -> Para : ANOVA simple
- -> Non-para : Kruskal-Wallis (H)
Qu’est-ce que le test khi carré?
- Le khi-carré analyse la différence entre la taille des fréquences pour des variables nominales et leurs fréquences «attendues». Est-ce que cette différence est aléatoire ou témoigne-t-elle d’une association entre les deux variables ?
- L’analyse réponds à la question suivante : est-ce qu’il existe une relation/association entre les fréquences appartenant à différents niveaux de variables catégorielles?
- Il faut mettre à l’épreuve l’hypothèse d’indépendance entre les variables.
- Pour y arriver, il faut vérifier la distribution conjointe des variables (tableau de contingence /tableau croisé).
Le khi carré indique-t-il une association ou une différence entre les variables?
C’est plutôt quand on interprète les résultats qu’il y en a qui vont plutôt isoler une différence
Quel est le jeu d’hypothèse pour le khi-carré?
- H0 : les variables ne sont pas associées / la répartition entre les catégories des variables est aléatoire.
- H1 : il y a une association entre les variables / la répartition entre les catégories des variables est différente de ce qui serait théoriquement attendu (s’il n’y avait pas de lien).
Comment peut-on conclure au rejet ou non rejet de H0?
- Il faut calculer la répartition entre les catégories comme ce qu’il serait attendu théoriquement (aucune association / aucune variance entre les catégories): fréquence attendue: fa.
- Il faut ensuite comparer les fa aux données / fréquences observées: fo et calculer les différences.
- La décision (H1 vs H0) dépends de la taille de la différence entre les fo et les fa.
Comment calcule-t-on la fréquence attendue?
fa = total de rangée * total colonne / n
Comment calcule-t-on X²?
X² = Somme(fo −fa)²/fa
Comment peut-on interpréter le lien entre le rapport fa/fo et X²?
- Il faut comparer la différence entre la fo et la fa relative à la fa.
- Plus grand est ce rapport, plus élevé sera le khi-carré.
- Si fa = fo, c2 = 0.
Comment calcule-t-on les d.l. pour le khi carré?
- Pour le X², il faut comparer la taille des fréquences entre les niveaux des variables catégorielles (colonnes et rangées).
- Comme pour les moyennes, si nous connaissons N, ainsi que le nombre d’observations dans chaque catégories sauf une, nous pouvons quand même inférer le nombre d’observations de cette dernière –> n’est donc pas indépendante et faut retirer d.l.
- **dl = (rangées -1) * (colonnes – 1)
Comment peut-on conclure au rejet ou non rejet de H0 avec la valeur de X²?
Si X² observé > ou = X² critique
Qu’est-ce que la taille de l’effet du khi carré?
- La taille de l’effet suite à un X² statistiquement significatif (2 x 2) peut être calculée avec le coefficient phi (f).
Ce coefficient s’exprime en % : (f = .10 = 10 % de variance expliquée).
f = √(X²/𝑛) - Si taille d’effet trop faible, on peut être face à un effet/différence statistique ou à cause de la taille de l’échantillon
Qu’est-ce que le V de Cramer?
- Nous savons que la taille du X² est déterminée d’une part par la différence entre la taille des fréquences, mais aussi par le nombre de catégories.
- La taille de l’effet doit alors distinguer ces deux influences (lorsque nous avons un devis autre que 2 x 2).
- Le V de Cramer aide à produire cette distinction.