Cours 3: Données catégorielles et Khi-Carré Flashcards
Quel type de données le test de khi-carré requiert-il et pourquoi est-il approprié dans ce contexte ?
Données qualitatives (catégorielles), car le khi-carré nécessite des nombres entiers pour calculer les fréquences et les écarts par rapport aux valeurs attendues.
Le Khi-Carré peur référer à _ ou à_
Une distribution mathématique
Un test statistique
Quel(s) est(sont) le(s) paramètre(s) de la distribution du Khi-carré?
k, qui correspond au degré de liberté
Qu’est-ce qu’une donnée catégorielle? Comment se nomme l’autre catégorie de données?
Catégorielle: qualitative (ex: note en côte, réponse binaire)
Autre catégorie: données de mesures quantitatives (score à un test, note à un examen)
Montre les 2 façon de faire référence aux degrés de liberté dans une distribution du khi-carré
VOIRNOTES
V/F La forme de la courbe de densité du khi-carré change selon le nb d’observations
FAUX, elle change selon le nb de degré de liberté
La moyenne de la distribution du khi-carré =
La variance de la distribution du khi-carré=
La moyenne de la distribution du khi-carré = k
La variance de la distribution du khi-carré= 2k
Quand k augmente, la distribution du khi-carré est plus _____.
Symétrique
Quand k augmente, la variance ____ et la moyenne ____.
augmente et augmente
Quel est l’objectif principal du test Khi-carré d’ajustement?
Déterminer si les valeurs observées diffèrent significativement de celles attendues (celles qu’on aurait obtenues au hasard)
Quelle est la formule du khi-carré? Explique son principe
X2= E (o-A)^2/A
Calculer la différence entre les fréquences observées et attendues dans des catégories, en pondérant par la fréquence attendue, pour évaluer si les écarts entre ces fréquences peuvent être attribués au hasard. (En gros, on veut savoir à quel point les données qu’on observe s’éloignent de ce qu’on observerait au hasard)
Dans le contexte d’un test du Khi-carré, pourquoi divise-t-on par la fréquence attendue ?
Pour contextualiser la magnitude des écarts observés. (En d’autres termes, un écart important par rapport à une valeur attendue faible est jugé plus significatif qu’un écart identique par rapport à une valeur attendue élevée.)
Si un test du Khi-carré d’ajustement pour 5 groupes produit une valeur de 10.35, que peut-on conclure à propos de la différence entre les fréquences observées et attendues (alpha = .05)?
Donne la DÉMARCHE TYPE
i. Nombre de degrés de liberté : dl = nb de groupes – 1 = 5 – 1 = 4
ii. Dans une table du khi carré, regarder la ligne avec 4 dl, à la colonne alpha = .05 pour trouver la valeur critique de 9.49
iii. Comparer la valeur critique avec la valeur observée : 9.49 < 10.35.
iv. Rejet de H0
Conclusion: La différence entre les fréquences observées et attendues est suffisamment grande pour suggérer que les écarts pourraient ne pas être dus au hasard.
Rapporte un résultat du khi-carré avec la bonne notation
X2 (dl, N= nb d’observations) = X2, p < a
Quelles sont les conditions d’utilisations du khi-carré?
- Indépendance des observations: chaque observation n’a contribué qu’une fois au tableau (exposé une fois à une seule condition)
- Inclusion de non-occurence (inclue la catégorie “non, j’ai pas x”).
- Donnés catégorielles
- autre recommandation:
table 2x2: valeurs attendues> 5 dans chaque cellules
Plus grandes tables: valeurs attendues> 5 dans 80% des cellules et 0 cellules avec plus petit que 1