Cours 3 Khi carré et données catégorielles Flashcards
Quelles sont les caractéristiques des données catégorielles?
- Données non numériques
- Données qualitatives
- Pas de statistiques descriptives ou de variabilité
- Seulement l’analyse des FRÉQUENCES des catégories
Ex: Couleur de cheveux, présence de pathologie
Qu’est-ce qu’un événements?
C’est une chose qui arrive et qui produit un résultat. Ces résultats forment des catégories (succès/échec, choix d’un participant, etc)
Quel est le seul type de statistiques possible lors de données catégorielles?
Le khi carré
Quelles sont les utilités du khi carré?
- Distribution mathématique permettant de calculer des probabilités –> distribution khi carré est une distribution de densité, comme la distribution normales
- Test statistiques qui est basé sur la distribution khi carré
Qu’est-ce que la distribution khi carré?
C’est une distribution mathématique qui donne une densité et permet de calculer des probabilités (aires sont la courbes)
Quel est le seul paramètre qu’utilise la distribution khi carré?
k (degré de liberté) –> correspond au nombre de CATÉGORIE
Qu’est-ce que la fonction gamma?
r(n) = n-1
La fonction gamma permet de calculer l’équivalent des factoriels pour des nombres qui ne sont pas entiers
La distribution khi carré à … paramètre … qui correspond aux … du test khi carré
La distribution khi carré à un seul paramètre k qui correspond aux dl du test khi carré
Qui suis-je?
J’influence la forme de la distribution khi carré. Plus mon nombre est grand, plus la distribution prend la forme d’une normale et plus mon nombre est petit et plus je prend la forme de exponentielle.
Les dl
Quelles la moyenne et la variance de la distribution khi carré? Qu’est-ce qui les différencie de la distribution normale?
Moyenne = k, Variance = 2k
Ces 2 paramètres ne sont pas indépendants comme dans la distribution normales
Que permet la distribution khi carré?
Elle permet de trouver une valeur critique associée à une probabilité
Quels sont les dl pour les tables de contingence?
dl = (L-1) (C-1)
Quels sont les dl pour la classification à un facteur (test d’ajustement)?
dl = C-1
Pour les tables …, la valeur du test khi carré aurait tendance à être trop …, ce qui accroît la probabilité d’erreur de Type …
Pour les tables 2x2, la valeur du test khi carré aurait tendance à être trop grande, ce qui accroît la probabilité d’erreur de Type 1
En quoi consiste la correction de continuité de Yates?
Consiste à réduire la valeur du test et obtenir un test plus conservateurs