Cours 3 Khi carré et données catégorielles Flashcards

1
Q

Quelles sont les caractéristiques des données catégorielles?

A
  1. Données non numériques
  2. Données qualitatives
  3. Pas de statistiques descriptives ou de variabilité
  4. Seulement l’analyse des FRÉQUENCES des catégories

Ex: Couleur de cheveux, présence de pathologie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est-ce qu’un événements?

A

C’est une chose qui arrive et qui produit un résultat. Ces résultats forment des catégories (succès/échec, choix d’un participant, etc)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quel est le seul type de statistiques possible lors de données catégorielles?

A

Le khi carré

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quelles sont les utilités du khi carré?

A
  1. Distribution mathématique permettant de calculer des probabilités –> distribution khi carré est une distribution de densité, comme la distribution normales
  2. Test statistiques qui est basé sur la distribution khi carré
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Qu’est-ce que la distribution khi carré?

A

C’est une distribution mathématique qui donne une densité et permet de calculer des probabilités (aires sont la courbes)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quel est le seul paramètre qu’utilise la distribution khi carré?

A

k (degré de liberté) –> correspond au nombre de CATÉGORIE

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qu’est-ce que la fonction gamma?

A

r(n) = n-1

La fonction gamma permet de calculer l’équivalent des factoriels pour des nombres qui ne sont pas entiers

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

La distribution khi carré à … paramètre … qui correspond aux … du test khi carré

A

La distribution khi carré à un seul paramètre k qui correspond aux dl du test khi carré

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qui suis-je?

J’influence la forme de la distribution khi carré. Plus mon nombre est grand, plus la distribution prend la forme d’une normale et plus mon nombre est petit et plus je prend la forme de exponentielle.

A

Les dl

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quelles la moyenne et la variance de la distribution khi carré? Qu’est-ce qui les différencie de la distribution normale?

A

Moyenne = k, Variance = 2k

Ces 2 paramètres ne sont pas indépendants comme dans la distribution normales

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Que permet la distribution khi carré?

A

Elle permet de trouver une valeur critique associée à une probabilité

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quels sont les dl pour les tables de contingence?

A

dl = (L-1) (C-1)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quels sont les dl pour la classification à un facteur (test d’ajustement)?

A

dl = C-1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Pour les tables …, la valeur du test khi carré aurait tendance à être trop …, ce qui accroît la probabilité d’erreur de Type …

A

Pour les tables 2x2, la valeur du test khi carré aurait tendance à être trop grande, ce qui accroît la probabilité d’erreur de Type 1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

En quoi consiste la correction de continuité de Yates?

A

Consiste à réduire la valeur du test et obtenir un test plus conservateurs

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

En quoi consiste le test exact de Fisher?

A

Il fournit un test plus conservateur que le khi carré

17
Q

Qu’est-ce que le rapport de vraisemblance?

A
  1. Il fournit une autre façon de calculer un test khi carré
  2. Fournit un test plus juste pour des échantillons de petites taille
  3. La vraisemblance est un concept statistique associé à un modèle ou à une hypothèse
  4. Le rapport de vraisemblance sert à évaluer s’il faut conserver Ho

Les rapports de vraisemblance est une approche alternative visant à analyser les données catégorielles. Les deux test sont équivalents pour les échantillons de grandes tailles, mais pour les échantillons de petites tailles, on pense que le khi carré est mieux approximé par la distribution exacte du khi2 que le khi2 du rapport de vraisemblance.

18
Q

Quels sont les divers indices d’associations et à quoi servent-ils?

A

Ils permettent de quantifier la grandeur de l’effet

  1. La famille des r : tests similaire à un coefficient de corrélation
  2. La famille des d : permets de calculer des rapports de risques et des tailles d’effet
19
Q

S’il y a plusieurs résultats possibles, on peut s’interroger sur l’indépendance des résultats. Donnez un exemple.

A

Je remarque que dans mon groupe, j’ai plus de femme que d’homme. Est-ce le fruit du hasard que j’aille plus de femme que d’homme, ou il y a autre choses qui en est la cause (par exemple : est-ce que mon annonce est genrée ?) –> Le khi carré peut répondre à ces questions

20
Q

Qui suis-je?

Je suis le seul type de statistique possible lors de données catégorielles.

A

Les fréquences

21
Q

Données des exemples d’hypothèse de khi carré.

A
  1. Est-ce que la répartition des CATÉGORIES d’emploi (service, vente, santé) est la même pour les hommes et les femmes
  2. Est-ce qu’il y a un LIEN entre les verdicts des tribunaux et la responsabilité alléguée de la victime
  3. Les rats dans un labyrinthe choisissent-ils une porte de sortie au hasard?
22
Q

Quels sont les deux tests que permet le Khi-carré?

A
  1. Classification à un facteur –> test khi carré d’ajustement
  2. Deux variables de classification –> analyse des tables de contingences
23
Q

Qu’est-ce que le test d’ajustement?

A

C’est un test qui examine si les données (fréquences observées) et la théorie (fréquence attendues) sont bien ajustées.
Ex: L’expérience de Tolman sur des rats qui trouvent leur chemin dans un labyrinthe

Ce test permet la comparaison entre les fréquences observées et les fréquences attendues.

24
Q

Dans l’exemple de Tolman, nous obtenons un X2 obs de 9.25 et un X2critique de 7.82. Quelle est la conclusion?

A

Nous rejetons Ho car X2 crit < X2 obs. Nous en concluons que les valeurs observées DIFFÈRENT des valeurs attendues. Donc, la variation entre les fréquences attendue et observée ne révèle pas du hasard

25
Q

Qu’est-ce que l’analyse des tables de contingence?

A

On fait ce test lorsque les données sont classées selon deux variables ou plus. Il est aussi intéressant de se demander si ces variables sont indépendantes d’une de l’autre. En effet, une table de contingence illustre la distribution d’une variable à chaque niveau de l’autre.

On peut notamment penser à l’étude de Pugh sur les décision prises dans des cas de viols

26
Q

Dans l’exemple de Pugh, nous trouvons un X2 obs de 35.93 et un X2 critique de 3.84. Quelle conclusions peut-on tirer?

A

Comment Khi2 obs est plus grand que khi2 critique, nous rejetons Ho qui stipule que les variables sont indépendantes l’une de l’autre. Donc, nous concluons que le jugement de culpabilité prononcé à l’égard d’un prévenue DÉPEND en partie du fait que l’avocat de la défense présente oui ou non la victime comme étant en tort.

27
Q

Dans quelle circonstance doit-on utiliser la correction de continuité de Yates?

A

Pour les tables 2x2

28
Q

Vrai ou faux

Le test exacte de Fisher rend la correction de Yates superflue

A

Vrai

29
Q

Qu’implique le test exacte de Fisher?

A

Implique de prendre en compte toutes les tables 2x2 qu’il est possible de former au départ. Il faut ensuite déterminer la proportion de ces tables. Si cette proportion est inférieur à ‘‘a’’, nous rejetons Ho disant que les deux variables sont indépendante et concluons qu’il existe une relation statistiques significative entre les deux variables qui composent notre table

30
Q

Qui suis-je?

Je présente la distribution des fréquences d’une variables pour chaque niveau d’une autre variable

A

La table des contingences

31
Q

Comment calculé khi2 pour deux vairables? Quels sont les dl?

A

Il faut déterminer les fréquences attendues dans chacune des cellules de la table de contingence (Dans le tableau, mettre entre parenthèse la valeur attendue).

Ensuite, faire la sommes des différences entre valeur observer et valeur attendu au carré divisé par la valeur attendue –> permet de calculé khi2

Avec dl = (L-1) (C-1)

32
Q

Quelle est Ho lorsqu’on travaille avec Khi2 table de contingences?

A

Ho : La variable x est indépendante de la variable y

33
Q

Quelle est Ho lorsqu’on travaille avec test ajustement de Khi2?

A

Ho : Il n’y a pas de différence entre les fréquences attendues et les fréquences observées