Cours 3 - Données catégorielles et Khi-Carré Flashcards

1
Q

C’est quoi dans le fond une donnée catégorielle

A

Une donnée non numérique qui ne peut pas faire de statistique descriptive et qui permet seulement l’analyse des fréquences des catégories (couleur de cheveux, présence d’une pathologie, etc.)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Événement avec les données catégorielles

A

Une chose arrive va produire un résultat qui vont ensuite former des catégories (succès ou échec par exemple). Si on a plusieurs réponses possibles, on peut s’interroger sur l’indépendance des résultats comparé aux données binomiales

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Le Khi-Carré, c’est quoi dans lfond (2)

A
  • Une distribution mathématique permettant de calculer des probabilités (distribution de densité)
  • C’est un test statistique qui est basé sur la distribution du khi-carré
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

C’est quoi la distribution du khi-Carré?

A

Fait référence au khi carré de pearson, permet d’avoir une densité et de calculer des probabilités. Un seul paramètre ; k (genre les degrés de liberté du test khi-2)

Concrètement, elle permet de trouver une valeur critique associée à une probabilité

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

C’est quoi la fonction gamma?

A

Fonction qui permet de calculer l’équivalent des factoriels pour des nombres pas entiers

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Valeur de la moyenne et de la variance de la distribution khi carré

A

Moyenne = k, Variance = 2k

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Est-ce que le test khi-carré est non-paramétrique?

A

Oui, il est non-paramétrique. On a des données catégorielles sans moyenne, c’est donc très difficile de se référer à une distribution normale.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

H0 et H1 avec khi-carré = ?

A

H0 = Aucun lien
H1 = Y’a un lien

Avec le test du khi carré, on va venir voir si la valeur dépasse le khi critique, ce qui confirme H1.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Comment expliquer si H0 est respectée avec khi-carré?

A

S’il n’y a aucun lien entre les variables (ce que H0 défend), il y a une énorme chance que le Khi-carré calculé soit faible, au point qu’il ne dépasse pas le khi-carré critique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Comment expliquer si H1 est confirmée?

A

C’est si peu probable que le Khi-carré calculé dépasse le Khi-carré critique que si jamais ça arrive, il doit avoir un lien entre les deux variables

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Que permet concrètement le test du Khi-Carré?

A

Comparer des fréquences théoriques aux fréquences attendues/observées

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Deux variables de classification ; quel type de variable sont-elles?

A

Les deux variables seraient catégorielles, on pose donc la question d’indépendance entre les deux. Est-ce que la distribution de fréquence d’une variable dépend de la distribution des fréquences de l’autre?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Que présente un tableau de contigence?

A

La distribution des fréquences d’une variable pour chaque niveau d’une autre variable

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Comment calculer le khi-carré pour 2 variables?

A

1 - Calcul de chaque fréquence attendue pour chaque donnée de la table
2 - Calcul du khi-carré = (Obs - Att) au carré / Att
3 - Calcul des dl = (Ligne - 1) * (Colonne - 1)
4 - Trouver la valeur du khi critique selon dl et alpha avec le tableau
5 -Vérifier si le khi calculé est plus grand que le khi critique, si oui on rejette H0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est-ce que la correction de continuité de Yates?

A

Réduction de la valeur du test pour obtenir un test plus conservateur car dans les tables 2x2, la valeur du test khi-carré tend à être trop grand (erreur de type 1 plus fréquent)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qu’est-ce que fait le test de Fisher?

A

Fournit un test plus conservateur que le khi-carré

17
Q

Condition qui explique l’utilisation de la correction de Yates ou le test de Fisher

A
  • Les fréquences attendu ne doivent pas être inférieur ou = à 1
  • Il doit y avoir au moins 5 fréquences (chiffre de 5 comme nombre) ; par exemple si on avait que 4 rats pour colonnes dans les fréquences attendues ça ne fonctionne pas
18
Q

Qu’est-ce que le rapport de vraisemblance?

A

Une autre façon de calculer le khi-carré qui est plus juste pour les échantillons de petite taille (donne même résultat pour grand N). La vraisemblance est à calculer après le test et sert à évaluer s’il faut conserver H0

19
Q

Indices R pour khi-carré ; 2 exemples et leur utilité

A

Fonctionne un peu comme des coefficient de corrélation
- V de cramer et phi (recommandé d’utiliser Cramer si ce n’est pas une table 2x2 car il peut prendre en compte des plus grandes tables de contingence. Phi peut avoir des valeurs qui dépassent.)

20
Q

Indices D pour khi-carré : utilité

A

Permet de calculer des rapports de risques / de cotes et des tailles d’effets

21
Q

Exemple de rapport des résultats

A

Afin de tester l’hypothèse selon laquelle il existe une
association entre l’aspirine et la survenu d’une crise
cardiaque, un test du Khi-carré d’indépendance a été
effectué. Les résultats suggèrent qu’il existe une association
significative entre le type de médicament (placebo
ou aspirine) et la présence de crise cardiaque (non
présente/présente), X2(1, N = 22071) = 25,014, p <
.001.