Données catégorielles et khi-carré Flashcards
Pourquoi est-il important de bien identifier les variables?
Parce que cela permet de bien choisir le test d’hypothèse approprié
*C’est l’étape la plus importante!!!
Que devons-nous décider au départ du test d’hypothèse et qui demeurera tout le long?
Si le test est unilatéral ou bilatéral!!
Quelles sont les étapes du test d’hypothèse?
- Identifier l’échelle et les niveaux de chaque variable
- Choix du test d’hypothèse
- Formuler les hypothèses H0 et H1 (uni/bilatérales)
- Vérification des postulats de l’analyse
- Calculer la valeur du test
- Trouver la valeur critique du test selon le nombre de degrés de liberté et le seuil de signification (uni/bilatéral)
- Prise de décision (rejet ou non de H0)
- Interprétation et rédaction de la notation statistique
Quels sont les trois types de khi-carré?
Khi-carré d’ajustement
Khi-carré d’indépendance
Khi-carré d’homogénéité
Qu’est-ce que le khi-carré d’ajustement?
Lorsqu’on a une seule variable catégorielle (nominale): vérifie la différence entre les fréquences observées et les fréquences attendues
- DONC permet de savoir si répartition suit le hasard ou si due à une théorie
- *Plus rare en psycho!
Qu’est-ce que le khi-carré d’indépendance?
Lorsqu’on veut connaître le lien ou l’absence de lien (indépendance) entre 2 VARIABLES NOMINALES
Quelles sont les hypothèses du khi-carré d’indépendance?
H0: Il n’y a pas de lien entre les 2 variables (les 2 variables se distribuent de façon indépendante)
H1: Il y a un lien entre les 2 variables (les 2 variables ne se distribuent pas de façon indépendante)
Quel est le calcul du khi-carré d’indépendance?
Total ligne X total colonne / N total
Qu’est-ce que le khi-carré d’homogénéité?
Même procédure que le khi-carré d’indépendance mais vise à montrer le contraire: On cherche plutôt à conserver H0 (qui correspond à l’homogénéité/absence de différence)
Quelles sont les hypothèses du khi-carré d’homogénéité?
H0: Les gens des X niveaux de la variable se répartissent au hasard dans les niveaux de la variable B
H1: Les gens des X niveaux de la variable ne se répartissent pas au hasard dans les niveaux de la variable B
Quelles sont les conditions nécessaires à l’utilisation rigoureuse des analyses du khi-carré? ARRANGER
- Taille des fréquences attendues:
- Fréquence attendue minimale > 1
- Moins de 20% des cellules dont la fréquence attendue est inférieure à 5 - Indépendance des observations : ne peut croiser des variables qui s’interinfluencent (ex: mère/fille, couple, prétest/posttest)
- Inclusion des non-occurrences: Inclure les gens qui disent “non” (ex: nbr de divorces et prendre en compte le nbr de gens qui ne sont pas divorcés)
Comment est la distribution du khi-carré?
Unidirectionnelle avec asymétrie positive
*forme varie en fonction du degré de liberté/selon le nombre de catégories qu’on a (plus de catégories = plus de variance)
Qu’est-ce que les fréquences observées et les fréquences attendues?
FO: Vrai pourcentage
FA: Fréquences auxquelles on peut s’attendre si H0 est vrai ou si hasard (si ne suit pas théorie)
À quoi ressemblent les hypothèses du khi-carré d’ajustement?
H0: Les gens se distribuent au hasard dans les groupes
H1: Les gens ne se distribuent pas au hasard dans les groupes
Qu’est-ce que la valeur critique?
valeur dans la table qui correspond à la limite de la surface de rejet, donc l’aire sous la courbe 5 %
À quoi correspond le degré de liberté pour le khi-carré d’ajustement?
dl= k (nombre de catégories) -1
Pourquoi est-il important de calculer le bon degré de liberté?
Parce que le nombre indique la position où on doit lire la valeur critique dans la table!
Vrai ou faux: plus la valeur de X2 augmente, plus le p diminue?
Vrai! car se décale encore plus vers la droite
Comment comparons-nous la valeur critique au X2 observé pour le khi-carré d’ajustement?
Si valeur observée > valeur critique : Rejet H0
Si valeur observée < valeur critique : Non-rejet H0
Vrai ou faux: le khi-carré d’ajustement est uniquement appliqué à une variable nominale dichotomique?
Faux! Peut aussi être associé à une variable nominale discrète
À quoi sert le tableau de contingence pour le khi-carré d’indépendance?
Il sert à représenter les fréquences observées pour faire le calcul des fréquences attendues et pouvoir utiliser la formule du khi-carré
À quoi correspond le degré de liberté du khi-carré d’indépendance?
dl = (L-1) (C-1)
Quelle est la particularité de l’interprétation de khi-carré d’indépendance?
Il faut présenter les % dans les cellules et montrer où se situe la différence/lien
Quel est l’objectif du khi-carré d’homogénéité?
L’objectif est de montrer que la répartition est équivalente
Ex: montrer que les patients du groupe témoin et du groupe expérimental se répartissent de la même façon dans les 4 types d’occupation professionnelle
*Rarement le but de l’étude, + en analyse préliminaire
Pourquoi la fréquence attendue doit-elle être plus grande que 1?
Le khi-carré est uniquement valide si il y a la possibilité d’avoir toutes les catégories
Pourquoi la fréquence attendue doit-elle être plus grande que 1?
Le khi-carré est uniquement valide si il y a la possibilité d’avoir toutes les catégories
Quelle est la solution lorsque la taille des fréquences n’est pas rencontrées?
Regrouper des catégories pour augmenter la fréquence attendue! MAIS perte de précision
*Test exact de Fisher si juste 2 catégories ou petit N, car ne peut pas regrouper
Qu’est-ce que la grandeur de l’effet?
Dire à quel point la signification est importante ou non
Comment trouver la grandeur de l’effet du khi-carré?
Choisir la mesure d’association Phi ou V de Cramér et la mettre au carré = % de variance commune
- Phi (2 x 2 seulement)
- V de Cramér (autre)
Quel est la barème pour la grandeur de l’effet?
Petit effet: 9% et moins
Moyen effet: 9 à 25%
Grand effet: 25% et plus
Le test du khi-carré est-il unilatéral ou bilatéral?
À la base, la distribution est unilatérale (seulement valeurs positives)
MAIS en considérant le calcul du khi-carré, il s’agit plutôt d’un test bilatéral à 5%!
DONC formuler hypothèses bilatérales
Quoi faire si nous sommes certains du sens (unilatéral) de notre test khi-carré?
On utilise alors un seuil de (0,05 x 2 = 0,10)
*On augmenterait l’erreur de type 1 pour diminuer l’erreur de type 2
Quelle est la notation statistique du khi-carré?
x2(dl, N = 40) = x2 observé, p < 0,05)
À quoi correspond le degré de liberté du khi-carré d’homogénéité?
dl = (C-1) (l-1)