Cours 3 Flashcards
Qu’est-ce qu’une données catégorielles?
1) Données non numériques
a) Données numériques, qui représentent quelque chose de non numérique, mais souvent sont représentées comme numérique dans nos données (par un nombre qui qualifie)
2) Données qualitatives
3) Pas de statistiques descriptives de localisation (moyenne, médiane) ou de variabilité (étendue, variance, écart-type)
4) Seulement l’analyse des fréquences des catégories
Donnez 2 exemples de données catégorielles
1) Couleur de cheveux
2) Statut de consommation de cannabis ou d’alcool
Les résultats des événements forment des […]
-> S’il y a plusieurs résultats, on peut s’interroger sur l’[…] des résultats
Les résultats des événements forment des catégories
-> S’il y a plusieurs résultats, on peut s’interroger sur l’indépendance des résultats
Quels sont les questions que l’on doit se poser lors de statistiques inférentielles?
1) Est-ce que les résultats dépendent du hasard?
2) Est-ce que les fréquences observées dans chacune des catégories se répartissent au hasard?
3) Est-ce que les résultats peuvent s’expliquer pas autre chose?
Quelle est la question qu’on se pose lors d’un Khi carré?
Est-ce que les fréquences qu’on observe sont celles attendues ou quelque chose d’autre joue?
Quelles sont les deux significations du Khi-carré?
1) Distribution mathématique permettant de calculer des probabilités - c’est une distribution de densité (comme la distribution normale)
2) Test statistique qui est basé sur la distribution khi-carré
Qu’est-ce que la distribution khi-carré?
Distribution mathématique qui donne une densité et permet de calculer des probabilités
-> Elle a un seul paramètre K
C’est une mesure de distance entre les données si elles sont dues au hasard et les données qu’on observe
LA fonction gamma permet de calculer l’équivalent des […] pour des nombres qui ne sont pas entiers
LA fonction gamma permet de calculer l’équivalent des factoriels pour des nombres qui ne sont pas entiers
La distribution khi-2 (carré) a un seul paramètre k qui correspond aux […] du test khi-carré
La distribution khi-2 (carré) a un seul paramètre k qui correspond aux degrés de liberté du test khi-carré
La distribution khi carré permet de trouver une valeur critique associée à une […]
La distribution khi carré permet de trouver une valeur critique associée à une probabilité
Dans les test du khi-carré, l’hypothèse nulle (absence d’effet, réponses au […]) est rejeté si la valeur khi carré est plus […] que la valeur critique
Dans les test du khi-carré, l’hypothèse nulle (absence d’effet, réponses au […]) est rejeté si la valeur khi carré est plus grande que la valeur critique
La valeur critique du khi-carré associée à une probabilité (p.e. […]) est obtenue en regardant dans une […]
La valeur critique du khi-carré associée à une probabilité (p.e. a =0.05) est obtenue en regardant dans une table
Quand on ne sait pas comment calculer quelque chose, on utilise le […]
Quand on ne sait pas comment calculer quelque chose, on utilise le khi-carré
Le khi-carré est une mesure de distance entre les données si elles sont dues au hasard et les données qu’on observe.
- > Plus l’espace est large, plus on va dire que c’est quelque chose d’autre que le […] qui joue
- > Plus le khi carré est petit et s’approche de 0, plus il y a de chances que c’est du au […]
Le khi-carré est une mesure de distance entre les données si elles sont dues au hasard et les données qu’on observe.
- > Plus l’espace est large, plus on va dire que c’est quelque chose d’autre que le hasard qui joue
- > Plus le khi carré est petit et s’approche de 0, plus il y a de chances que c’est du au hasard
Quels sont les hypothèses alternatives du test khi-carré?
H0: Le […] est aléatoire
H1: Le […] n’est pas dû au hasard - [explication]
Le test du khi-carré permet de comparer les fréquences […] ou fréquences […] à des fréquences […]
Le test du khi-carré permet de comparer les fréquences théoriques ou fréquences attendues à des fréquences observées
Quelles sont les questions associées au test du khi-carré avec deux variables de classification?
1) Y a-t-il un lien entre deux variables catégorielles
2) Est-ce que la distribution de fréquences d’une variable dépend de la distribution des fréquences de l’autre variable?
Qu’est-ce qu’une table de contingence/tableau croisé?
Une table de contingence présente la distribution d’une variable à chaque niveau d’une autre
-> Le test khi-carré est aussi un test d’homogénéité des tableaux
Pour calculer un khi-carré pour deux variables, il faut déterminer les fréquences […] dans chacune des cellules de la table de contingence avant de faire le test khi-carré.
-> C’est la différence entre un khi-carré à une et deux variables
Pour calculer un khi-carré pour deux variables, il faut déterminer les fréquences attendues dans chacune des cellules de la table de contingence avant de faire le test khi-carré.
-> C’est la différence entre un khi-carré à une et deux variables
Pour les tableaux croisés de 2 variables par 2 variables, la valeur du test khi-carré aurait tendance a être trop […], ce qui […]la probabilité d’erreur de Type […] (rejeter erronément H0)
-> Variables dichotomiques
Pour les tableaux croisés de 2 variables par 2 variables, la valeur du test khi-carré aurait tendance a être trop grande, ce qui accroit la probabilité d’erreur de Type I (rejeter erronément H0)
La correction de continuité de Yates consiste à […] la valeur du test et obtenir un test plus […]
La correction de continuité de Yates consiste à réduire la valeur du test et obtenir un test plus conservateur
Le test exact de Fisher fournit un test plus conservateur que le khi-carré
Le test exact de Fisher fournit un test plus […] que le khi-carré
La famille des […] : tests similaires à un coefficient de
corrélation
La famille des r : tests similaires à un coefficient de
corrélation
La famille des […] : permet de calculer des rapports
de risques et des tailles d’effet
La famille des d : permet de calculer des rapports
de risques et des tailles d’effet