Cours 3 - Données catégorielles et khi-carré Flashcards

1
Q

Donne des exemples de données quantitatives

A

Note à un examen en %
Score à un test psychométrique 0 à 21

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Donne des exemples de données qualitatives

A

Note à un examen en cote (A+, B+…)
Rémission ou pas après un traitement (rémission, non-rémission)
Consommation d’alcool ou pas (oui, non)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Pour quel type de données utilise-t-on le khi-carré ?

A

Qualitatives

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

À quoi peut référer le khi-carré ?

A
  1. Une distribution mathématiques
  2. Un test statistique
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quel est le seul paramètre de la distribution mathématique du Khi-carré ?

A

k
tous les autres termes sont des constantes ou la valeur de X2 pour laquelle on souhaite trouver l’ordonnée f(X2)
Diapo 8 formule

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

À quoi correspond le k ?

A

Aux degrés de liberté (dl)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quelles sont les 2 manières de faire référence aux degrés de liberté ?

A

Diapo 9 !!! VA VOIR LA DIAPO
X 2 sur K
X2(k)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

La forme de la courbe de densité change selon :

A

Nb de degrés de liberté

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quelle est la moyenne d’une distribution ?

A

k

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quelle est la variance d’une distribution ?

A

2k

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Que se passe-t-il avec la distribution quand k augmente ?

A

Elle devient plus symétrique
La moyenne et la variance augmentent (donc distribution s’applatit et élargit)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quels sont les tests statistiques du khi-carré ?

A

Test khi-carré d’ajustement (goodness-of-fit chi-square test)
Analyse de table de contingence (contingency chi-square)
Test des rapports de vraisemblance (likelihood ratio chi-square test)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Que permet le test du khi-carré d’ajustement ?

A

Déterminer si les valeurs que l’on observe sont assez différentes de celles qu’on obtiendrait par hasard pour que l’on rejette l’idée qu’elles ont été obtenues par hasard

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Quelle est la formule standard du khi-carré ?

A

X^2 = sommation ((O-A)^2)/A)
Où O est la fréquence observée lors de l’expérimentation et A est la fréquence attendue

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Si un phénomène est dû au hasard, qu’en est-il alors de la différence entre la fréquence observée et attendue ?

A

Elle est minime
Cette différence n’a du sens que si elle est mise en rapport avec ce qui est attendu, c’est pourquoi on divise par A

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Étapes pour interpréter les résultats du khi-carré :

A
  1. Trouver le bon nb de dl
  2. Trouver le bon niveau alpha
  3. La valeur critique se trouve à l’intersection dans la table (intersection dl et alpha) –> on trouve le X^2 (dl)
17
Q

Dans le khi-carré d’ajustement, comment trouve-t-on le nombre de dl ?

A

dl = nb de catégories - 1

18
Q

Comment trouve-t-on le X^2 obtenu ?

A

Par la formule X^2 (voir les diapos 27 à 30 pour un exemple)

19
Q

Que permet l’analyse de tables de contingence du khi-deux ?

A

De faire un test du khi-carré pour des variables classées selon plus d’une dimension

20
Q

Calcul des dl dans les tables de contingence du khi 2 ?

A

dl = (L-1)(C-1)
L= lignes
C= colonnes
Ne pas compter totaux

21
Q

Formule du calcul des valeurs attendues dans tables de contingence:

A

Aij = (Li*Cj) / N
Aij: fréquence attendue cellule ij
Li: total marginal ligne i
Cj: total marginal colonne j

Calculer pour chaque case dont on veut trouver fréquence
Diapo 39 à 45

22
Q

Quelles sont les valeurs attendues pour une table de contingence 2x2 ?

A

Valeurs attendues > 5 dans chaque cellule
Pour les grandes tables, valeurs attendues >5 dans au moins 80% des cellules et aucune cellule n’a une valeur de moins de 1

23
Q

Que fait-on après avoir calculé toutes les valeurs attendues dans la table de contingence ?

A

On utilise la formule du khi 2 et on plug dedans les A (pour chaque case), le résultats sera notre X^2 obtenu

24
Q

Conclusion du khi 2 tables de contingence:

A

X^2(dl, N = taille d’échantillon) = valeur du X^2, p = valeur p
Voir diapos 49-50

25
Q

Quelles sont les conditions d’application du khi-2 ?

A
  1. Indépendance des observations: Est-ce que chacune des observations revient plus d’une fois au tableau ? si non, pas indépendant
  2. Inclusion des non-occurences : condition ou il y a absence (ex: absence de tx, ne pas habiter en campagne…)
26
Q

À quoi sert la correction de continuité de Yates ?

A

Prévenir la surestimation des résultats obtenus
Quand le n d’une table 2x2 est plus petit que 40

27
Q

Comment applique-t-on la correction de continuité de Yates ?

A

Soustraire 0.5 à la valeur absolue du numérateur avant de le mettre au carré
Numérateur = [|(O-A)|-0.5] ^2

28
Q

Comment peut-on calculer les tailles d’effet dans la famille des r (corrélation) ?

A

Phi
- seulement applicable aux tables 2x2
- Formule: phi= racine (X^2/N)

V de Cramér
- Extension de phi, applicable à des tables plus grande
V= racine ( X^2/(N(k-1)) )

29
Q

Comment fonctionne le test exact de Fisher pour tailles d’effet ?

A

Considérer toutes les tables 2x2 qu’il est possible de former avec les totaux marginaux
Et déterminer la proportion de ces tables qui ont des résultats aussi ou plus extrêmes encore que ceux observés dans nos données