Cours 3 - Données catégorielles et khi-carré Flashcards
Donne des exemples de données quantitatives
Note à un examen en %
Score à un test psychométrique 0 à 21
Donne des exemples de données qualitatives
Note à un examen en cote (A+, B+…)
Rémission ou pas après un traitement (rémission, non-rémission)
Consommation d’alcool ou pas (oui, non)
Pour quel type de données utilise-t-on le khi-carré ?
Qualitatives
À quoi peut référer le khi-carré ?
- Une distribution mathématiques
- Un test statistique
Quel est le seul paramètre de la distribution mathématique du Khi-carré ?
k
tous les autres termes sont des constantes ou la valeur de X2 pour laquelle on souhaite trouver l’ordonnée f(X2)
Diapo 8 formule
À quoi correspond le k ?
Aux degrés de liberté (dl)
Quelles sont les 2 manières de faire référence aux degrés de liberté ?
Diapo 9 !!! VA VOIR LA DIAPO
X 2 sur K
X2(k)
La forme de la courbe de densité change selon :
Nb de degrés de liberté
Quelle est la moyenne d’une distribution ?
k
Quelle est la variance d’une distribution ?
2k
Que se passe-t-il avec la distribution quand k augmente ?
Elle devient plus symétrique
La moyenne et la variance augmentent (donc distribution s’applatit et élargit)
Quels sont les tests statistiques du khi-carré ?
Test khi-carré d’ajustement (goodness-of-fit chi-square test)
Analyse de table de contingence (contingency chi-square)
Test des rapports de vraisemblance (likelihood ratio chi-square test)
Que permet le test du khi-carré d’ajustement ?
Déterminer si les valeurs que l’on observe sont assez différentes de celles qu’on obtiendrait par hasard pour que l’on rejette l’idée qu’elles ont été obtenues par hasard
Quelle est la formule standard du khi-carré ?
X^2 = sommation ((O-A)^2)/A)
Où O est la fréquence observée lors de l’expérimentation et A est la fréquence attendue
Si un phénomène est dû au hasard, qu’en est-il alors de la différence entre la fréquence observée et attendue ?
Elle est minime
Cette différence n’a du sens que si elle est mise en rapport avec ce qui est attendu, c’est pourquoi on divise par A
Étapes pour interpréter les résultats du khi-carré :
- Trouver le bon nb de dl
- Trouver le bon niveau alpha
- La valeur critique se trouve à l’intersection dans la table (intersection dl et alpha) –> on trouve le X^2 (dl)
Dans le khi-carré d’ajustement, comment trouve-t-on le nombre de dl ?
dl = nb de catégories - 1
Comment trouve-t-on le X^2 obtenu ?
Par la formule X^2 (voir les diapos 27 à 30 pour un exemple)
Que permet l’analyse de tables de contingence du khi-deux ?
De faire un test du khi-carré pour des variables classées selon plus d’une dimension
Calcul des dl dans les tables de contingence du khi 2 ?
dl = (L-1)(C-1)
L= lignes
C= colonnes
Ne pas compter totaux
Formule du calcul des valeurs attendues dans tables de contingence:
Aij = (Li*Cj) / N
Aij: fréquence attendue cellule ij
Li: total marginal ligne i
Cj: total marginal colonne j
Calculer pour chaque case dont on veut trouver fréquence
Diapo 39 à 45
Quelles sont les valeurs attendues pour une table de contingence 2x2 ?
Valeurs attendues > 5 dans chaque cellule
Pour les grandes tables, valeurs attendues >5 dans au moins 80% des cellules et aucune cellule n’a une valeur de moins de 1
Que fait-on après avoir calculé toutes les valeurs attendues dans la table de contingence ?
On utilise la formule du khi 2 et on plug dedans les A (pour chaque case), le résultats sera notre X^2 obtenu
Conclusion du khi 2 tables de contingence:
X^2(dl, N = taille d’échantillon) = valeur du X^2, p = valeur p
Voir diapos 49-50
Quelles sont les conditions d’application du khi-2 ?
- Indépendance des observations: Est-ce que chacune des observations revient plus d’une fois au tableau ? si non, pas indépendant
- Inclusion des non-occurences : condition ou il y a absence (ex: absence de tx, ne pas habiter en campagne…)
À quoi sert la correction de continuité de Yates ?
Prévenir la surestimation des résultats obtenus
Quand le n d’une table 2x2 est plus petit que 40
Comment applique-t-on la correction de continuité de Yates ?
Soustraire 0.5 à la valeur absolue du numérateur avant de le mettre au carré
Numérateur = [|(O-A)|-0.5] ^2
Comment peut-on calculer les tailles d’effet dans la famille des r (corrélation) ?
Phi
- seulement applicable aux tables 2x2
- Formule: phi= racine (X^2/N)
V de Cramér
- Extension de phi, applicable à des tables plus grande
V= racine ( X^2/(N(k-1)) )
Comment fonctionne le test exact de Fisher pour tailles d’effet ?
Considérer toutes les tables 2x2 qu’il est possible de former avec les totaux marginaux
Et déterminer la proportion de ces tables qui ont des résultats aussi ou plus extrêmes encore que ceux observés dans nos données