Cours 5 : Comparaison & relations entre variables qualitatives = tests du chi-carré Flashcards

1
Q

Qui-suis-je? « fraction de la population qui présente une caractéristique particulière »

A

proportion

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

vrai ou faux? il est possible d’estimer une proportion dans la population à partir d’un échantillon et de calculer son intervalle de confiance.

A

vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quels sont les 6 critères nécessaires pour qu’on puisse utiliser la Loi binomiale?

A
  1. L’échantillonnage est aléatoire et indépendant;
  2. Les valeurs ne peuvent appartenir qu’à 2 catégories seulement;
  3. On échantillonne un nombre fixe n de valeurs;
  4. La probabilité d’appartenir à la catégorie 1 = p
  5. La probabilité d’appartenir à la catégorie 2 = 1−p
  6. La probabilité d’appartenir à l’un (p) ou l’autre (1−p) des groupes est la même pour chaque élément de l’échantillon.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

comment peut-on estimer la vraie proportion d’une catégorie de la population?

A
  • définir formellement la moyenne attendue
  • définir l’erreur standard d’une variable aléatoire

dans les deux cas, il faut suivre une loi de probabilité binomiale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Qui-suis-je? « variable aléatoire X
suivant une loi binomiale d’effectif n
et de probabilité individuelle p »

A

erreur standard

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Vrai ou faux : l’erreur standard diminue en proportion de la racine carrée de l’effectif n.

A

Vrai, ainsi plus la taille d’échantillon n

sera grande, plus vos estimations seront précises.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qui-suis-je? « intervalle de confiance entourant notre estimation de la « vraie » proportion dans la population qui diminue plus on augmente le nombre d’observations n. »

A

intervalle de confiance autour de P

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

nommez la méthode permettant d’estimer un intervalle de confiance autour d’une proportion.

A

Intervalle de confiance de Wald

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qui-suis-je? « test qui permet d’appliquer les propriétés de la distribution binomiale pour tester la significativité statistique d’une proportion (= différence par rapport à l’effet du hasard). »

A

test binomial

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quelles conditions doivent être respectées pour pouvoir faire un test binomial?

A
  1. Il faut que les valeurs échantillonnées ne puissent prendre que deux valeurs : succès ou échec.
  2. On cherche à déterminer si la fréquence relative du succès dans la population (p) est conforme à une valeur nulle (p0).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qui-suis-je? « Loi qui décrit la distribution de probabilité de la somme de carrés de variables aléatoires continues indépendantes qui suivent chacune une loi Normale centrée réduite. »

A

Loi du chi-carré ( χ2)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Vrai ou faux : les valeurs de χ2

sont toujours positives et la fonction de densité de probabilité résultante n’est pas symétrique

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Vrai ou faux : comme la loi de student, la loi du chi-carré a recourt à l’utilisation de degrés de liberté.

A

vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Comment est-ce qu’on calcule le degré de liberté d’un test de chi-carré?

A

dl = nombre de catégories − 1 − nombre de paramètres estimés

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

À quel moment la valeur seuil de chi-carrée peut-elle aussi être nommée la valeur critique?

A

Lorsqu’elle délimite le seuil de significativité α.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qui-suis-je? « extension généralisée du test binomial à la comparaison de proportions de variables qualitatives pour lesquelles il y a plus de 2 catégories possibles. On m’appelle aussi test d’adéquation »

A

Test d’ajustement du chi-carré

17
Q

Sur quels types de variables pouvant nous faire un test d’ajustement du chi-carré?

A
  • les variables qualitatives

- les variables quantitatives discrètes.

18
Q

Vrai ou faux?

Si on fait la somme de ces carrés des écarts normalement distribués, on obtient par définition une variable aléatoire qui suit une loi du χ2

19
Q

Quelles sont les conditions à respecter pour pouvoir utiliser le test d’ajustement de chi-carré?

A
  1. Aucune des catégories ne devrait avoir une fréquence attendue < 1;
  2. Pas plus de 20% des catégories ne devraient avoir une fréquence attendue < 5.
  3. L’échantillonnage doit être aléatoire et indépendant

** la condition 3 s’applique à tous les test de statistique

20
Q

Qui-suis-je? « loi de probabilité très utile pour étudier les variables discrètes, distribution de probabilité permettant de décrire le comportement du nombre d’événements se produisant dans un intervalle de temps (d’espace) fixé. »

A

Loi de Poisson

21
Q

Quelles sont les deux conditions nécessaires pour pouvoir utiliser la loi de Poisson?

A

1 .Il faut que ces événements arrivent indépendamment les uns des autres
2. Évènements homogènes dans le temps (l’espace), c.-à-d. qu’ils aient chacun la même probabilité de se réaliser indépendamment les uns des autres.

22
Q

Vrai ou faux? Dans une loi de Poisson, la variance est égale à la moyenne λ

23
Q

Si dans notre échantillon la variance < moyenne, alors les évènements sont :

A

Surdispersés, les évènements arrivent trop régulièrement

24
Q

Si au contraire la variance > moyenne, alors les évènements sont :

A

Regroupés, les évènements arrivent par paquets.

25
Vrai ou faux : l’usage principal de la distribution de Poisson en biologie est de tester si l’occurrence d’un événement de nature spatiale ou temporelle est aléatoire.
Vrai
26
Vrai ou faux : on peut faire un test d'ajustement du chi-carré à la loi de poisson.
Vrai, quand on cherche à savoir si tel évènement arrive de façon aléatoire dans le temps par exemple
27
Qui-suis-je? « Je permet d’évaluer la dépendance entre 2 variables qualitatives (facteurs) »
Tableau de contingence
28
Qui-suis-je? « Je permet de détecter les dépendances entre des caractéristiques qualitatives binaires mesurées sur les individus d’une population. »
Tableau de contingence (encore) c'est juste une définition différente
29
Qui-suis-je? « Test le plus commun pour tester la relation entre deux variables qualitatives ou quantitatives discrètes (= facteurs). »
Test d'indépendance du chi-carré
30
Pourquoi le test d'indépendance du chi-carré s'appelle-t-il ainsi?
car son hypothèse nulle est l’indépendance des variables (= absence de relation).
31
Vrai ou faux? le test d’indépendance du χ2 | n’est finalement qu’un test d’ajustement dont la distribution nulle est l’indépendance des variables.
Vrai
32
Comment est-ce qu'on calcule le degré de liberté pour un test d'indépendance du chi-carré?
dl = (lignes-1) × (colonnes-1)
33
Vrai ou faux : il faut rejeter l'hypothèse nulle quand la valeur de chi-carré calculée est supérieure à la valeur critique de chi-carré.
Vrai
34
Vrai ou faux : Le test d’indépendance du χ2 | est limité à des facteurs qui ne prennent que 2 valeurs possibles.
Faux!
35
Vrai ou faux : On peut calculer la contribution relative de chaque écart d’indépendance, afin de déterminer quelle(s) catégorie(s) est principalement responsable de ce manque d’indépendance.
Vrai, donné par (Fréquence attendue/chi-carré calculé) x 100
36
Qui-suis-je? « Je varie entre 0 et 1 et je quantifie la force de la relation entre deux facteurs »
Coefficient de contingence
37
Vrai ou faux : plus le coefficient de contingence s'approche de 1, moins l'intensité de la relation entre deux facteurs est grande.
Faux, plus le facteur de contingence s'approche de 1, plus la relation est forte