Cours 3: Données catégorielles et Khi-Carré Flashcards

1
Q

Quel type de données le test de khi-carré requiert-il et pourquoi est-il approprié dans ce contexte ?

A

Données qualitatives (catégorielles), car le khi-carré nécessite des nombres entiers pour calculer les fréquences et les écarts par rapport aux valeurs attendues.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Le Khi-Carré peur référer à _ ou à_

A

Une distribution mathématique
Un test statistique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quel(s) est(sont) le(s) paramètre(s) de la distribution du Khi-carré?

A

k, qui correspond au degré de liberté

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’est-ce qu’une donnée catégorielle? Comment se nomme l’autre catégorie de données?

A

Catégorielle: qualitative (ex: note en côte, réponse binaire)
Autre catégorie: données de mesures quantitatives (score à un test, note à un examen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Montre les 2 façon de faire référence aux degrés de liberté dans une distribution du khi-carré

A

VOIRNOTES

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

V/F La forme de la courbe de densité du khi-carré change selon le nb d’observations

A

FAUX, elle change selon le nb de degré de liberté

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

La moyenne de la distribution du khi-carré =
La variance de la distribution du khi-carré=

A

La moyenne de la distribution du khi-carré = k
La variance de la distribution du khi-carré= 2k

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quand k augmente, la distribution du khi-carré est plus _____.

A

Symétrique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quand k augmente, la variance ____ et la moyenne ____.

A

augmente et augmente

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quel est l’objectif principal du test Khi-carré d’ajustement?

A

Déterminer si les valeurs observées diffèrent significativement de celles attendues (celles qu’on aurait obtenues au hasard)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quelle est la formule du khi-carré? Explique son principe

A

X2= E (o-A)^2/A

Calculer la différence entre les fréquences observées et attendues dans des catégories, en pondérant par la fréquence attendue, pour évaluer si les écarts entre ces fréquences peuvent être attribués au hasard. (En gros, on veut savoir à quel point les données qu’on observe s’éloignent de ce qu’on observerait au hasard)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Dans le contexte d’un test du Khi-carré, pourquoi divise-t-on par la fréquence attendue ?

A

Pour contextualiser la magnitude des écarts observés. (En d’autres termes, un écart important par rapport à une valeur attendue faible est jugé plus significatif qu’un écart identique par rapport à une valeur attendue élevée.)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Si un test du Khi-carré d’ajustement pour 5 groupes produit une valeur de 10.35, que peut-on conclure à propos de la différence entre les fréquences observées et attendues (alpha = .05)?

Donne la DÉMARCHE TYPE

A

i. Nombre de degrés de liberté : dl = nb de groupes – 1 = 5 – 1 = 4
ii. Dans une table du khi carré, regarder la ligne avec 4 dl, à la colonne alpha = .05 pour trouver la valeur critique de 9.49
iii. Comparer la valeur critique avec la valeur observée : 9.49 < 10.35.
iv. Rejet de H0
Conclusion: La différence entre les fréquences observées et attendues est suffisamment grande pour suggérer que les écarts pourraient ne pas être dus au hasard.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Rapporte un résultat du khi-carré avec la bonne notation

A

X2 (dl, N= nb d’observations) = X2, p < a

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Quelles sont les conditions d’utilisations du khi-carré?

A
  1. Indépendance des observations: chaque observation n’a contribué qu’une fois au tableau (exposé une fois à une seule condition)
  2. Inclusion de non-occurence (inclue la catégorie “non, j’ai pas x”).
  3. Donnés catégorielles
  • autre recommandation:
    table 2x2: valeurs attendues> 5 dans chaque cellules
    Plus grandes tables: valeurs attendues> 5 dans 80% des cellules et 0 cellules avec plus petit que 1
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quelle est la différence entre le test Khi-carré d’ajustement et l’analyse de tables de contingence ?

A

Les deux tests sont utilisés pour comparer des fréquences observées aux fréquences attendues de variables catégorielles, mais le test d’ajustement le fait en classant les variables selon un seul facteur alors que l’analyse des tables de contingence le fait en classant les variables selon deux facteurs.

17
Q

Comment calcule t-on les valeurs attendues dans l’analyse de tables de contingence?

A

Aij = (LiXCi)/N

18
Q

Comment calcule t-on le nb de dl dans l’analyse de tables de contingence?

A

dl = (L-1) (C-1)

19
Q

Quel est l’objectif de la correction de continuité de Yates lors de l’utilisation du test du Khi-carré?

A

Compenser la présence d’un biais, particulièrement dans les tables 2x2 avec un total d’échantillons inférieur à environ 40.

20
Q

En quoi consiste la correction de continuité de Yates lors de l’utilisation du test du Khi-carré?

A

Soustraire 0,5 au calcul du khi-carré

E ((O-A)-0,5)^2/A

21
Q

Quelle mesure de taille d’effet est spécifiquement conçue pour être utilisée avec des tables de contingence 2x2?

A

Phi (Φ)

22
Q

Quand est-il judicieux d’utiliser le V de Cramér?

A

Pour les tables plus grandes que 2x2 (extension de phi)

23
Q

Qu’est-ce que le test exact de Fisher?

A

Fisher a proposé de considérer toutes les tables 2x2 possibles et de déterminer la proportion de ces tables qui ont des résultats aussi extrêmes ou plus extrêmes que ceux qu’on observe dans nos données. Ne peux pas être utilisé sans modification dans les tables plus grandes plus grandes que 2x2.

24
Q

Quelle est la principale force du test exact de Fisher?

A

L’avantage principal du test exact de Fisher est sa précision, en particulier pour les petites tailles d’échantillon ou lorsque les fréquences attendues dans certaines cellules de la table sont très faibles, où l’approximation du Khi-carré pourrait ne pas être fiable. Le test utilise les totaux marginaux de la table (le total des lignes et des colonnes) pour calculer la probabilité d’observer la distribution des fréquences obtenue, ainsi que toutes les distributions plus extrêmes, sous l’hypothèse nulle. Le “exact” dans le nom du test vient du fait qu’il calcule la probabilité exacte de la distribution observée, sans s’appuyer sur une approximation qui devient moins précise avec de petits échantillons.

25
Q

Quel est le nom du troisième test du khi-carré possible (non-abordé en classe)?

A

Test de rapports de vraisemblance