Cours 5 : Comparaison & relations entre variables qualitatives = tests du chi-carré Flashcards

You may prefer our related Brainscape-certified flashcards:
1
Q

Qui-suis-je? « fraction de la population qui présente une caractéristique particulière »

A

proportion

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

vrai ou faux? il est possible d’estimer une proportion dans la population à partir d’un échantillon et de calculer son intervalle de confiance.

A

vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quels sont les 6 critères nécessaires pour qu’on puisse utiliser la Loi binomiale?

A
  1. L’échantillonnage est aléatoire et indépendant;
  2. Les valeurs ne peuvent appartenir qu’à 2 catégories seulement;
  3. On échantillonne un nombre fixe n de valeurs;
  4. La probabilité d’appartenir à la catégorie 1 = p
  5. La probabilité d’appartenir à la catégorie 2 = 1−p
  6. La probabilité d’appartenir à l’un (p) ou l’autre (1−p) des groupes est la même pour chaque élément de l’échantillon.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

comment peut-on estimer la vraie proportion d’une catégorie de la population?

A
  • définir formellement la moyenne attendue
  • définir l’erreur standard d’une variable aléatoire

dans les deux cas, il faut suivre une loi de probabilité binomiale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Qui-suis-je? « variable aléatoire X
suivant une loi binomiale d’effectif n
et de probabilité individuelle p »

A

erreur standard

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Vrai ou faux : l’erreur standard diminue en proportion de la racine carrée de l’effectif n.

A

Vrai, ainsi plus la taille d’échantillon n

sera grande, plus vos estimations seront précises.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qui-suis-je? « intervalle de confiance entourant notre estimation de la « vraie » proportion dans la population qui diminue plus on augmente le nombre d’observations n. »

A

intervalle de confiance autour de P

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

nommez la méthode permettant d’estimer un intervalle de confiance autour d’une proportion.

A

Intervalle de confiance de Wald

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qui-suis-je? « test qui permet d’appliquer les propriétés de la distribution binomiale pour tester la significativité statistique d’une proportion (= différence par rapport à l’effet du hasard). »

A

test binomial

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quelles conditions doivent être respectées pour pouvoir faire un test binomial?

A
  1. Il faut que les valeurs échantillonnées ne puissent prendre que deux valeurs : succès ou échec.
  2. On cherche à déterminer si la fréquence relative du succès dans la population (p) est conforme à une valeur nulle (p0).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qui-suis-je? « Loi qui décrit la distribution de probabilité de la somme de carrés de variables aléatoires continues indépendantes qui suivent chacune une loi Normale centrée réduite. »

A

Loi du chi-carré ( χ2)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Vrai ou faux : les valeurs de χ2

sont toujours positives et la fonction de densité de probabilité résultante n’est pas symétrique

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Vrai ou faux : comme la loi de student, la loi du chi-carré a recourt à l’utilisation de degrés de liberté.

A

vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Comment est-ce qu’on calcule le degré de liberté d’un test de chi-carré?

A

dl = nombre de catégories − 1 − nombre de paramètres estimés

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

À quel moment la valeur seuil de chi-carrée peut-elle aussi être nommée la valeur critique?

A

Lorsqu’elle délimite le seuil de significativité α.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qui-suis-je? « extension généralisée du test binomial à la comparaison de proportions de variables qualitatives pour lesquelles il y a plus de 2 catégories possibles. On m’appelle aussi test d’adéquation »

A

Test d’ajustement du chi-carré

17
Q

Sur quels types de variables pouvant nous faire un test d’ajustement du chi-carré?

A
  • les variables qualitatives

- les variables quantitatives discrètes.

18
Q

Vrai ou faux?

Si on fait la somme de ces carrés des écarts normalement distribués, on obtient par définition une variable aléatoire qui suit une loi du χ2

A

vrai

19
Q

Quelles sont les conditions à respecter pour pouvoir utiliser le test d’ajustement de chi-carré?

A
  1. Aucune des catégories ne devrait avoir une fréquence attendue < 1;
  2. Pas plus de 20% des catégories ne devraient avoir une fréquence attendue < 5.
  3. L’échantillonnage doit être aléatoire et indépendant

** la condition 3 s’applique à tous les test de statistique

20
Q

Qui-suis-je? « loi de probabilité très utile pour étudier les variables discrètes, distribution de probabilité permettant de décrire le comportement du nombre d’événements se produisant dans un intervalle de temps (d’espace) fixé. »

A

Loi de Poisson

21
Q

Quelles sont les deux conditions nécessaires pour pouvoir utiliser la loi de Poisson?

A

1 .Il faut que ces événements arrivent indépendamment les uns des autres
2. Évènements homogènes dans le temps (l’espace), c.-à-d. qu’ils aient chacun la même probabilité de se réaliser indépendamment les uns des autres.

22
Q

Vrai ou faux? Dans une loi de Poisson, la variance est égale à la moyenne λ

A

Vrai

23
Q

Si dans notre échantillon la variance < moyenne, alors les évènements sont :

A

Surdispersés, les évènements arrivent trop régulièrement

24
Q

Si au contraire la variance > moyenne, alors les évènements sont :

A

Regroupés, les évènements arrivent par paquets.

25
Q

Vrai ou faux : l’usage principal de la distribution de Poisson en biologie est de tester si l’occurrence d’un événement de nature spatiale ou temporelle est aléatoire.

A

Vrai

26
Q

Vrai ou faux : on peut faire un test d’ajustement du chi-carré à la loi de poisson.

A

Vrai, quand on cherche à savoir si tel évènement arrive de façon aléatoire dans le temps par exemple

27
Q

Qui-suis-je? « Je permet d’évaluer la dépendance entre 2 variables qualitatives (facteurs) »

A

Tableau de contingence

28
Q

Qui-suis-je? « Je permet de détecter les dépendances entre des caractéristiques qualitatives binaires mesurées sur les individus d’une population. »

A

Tableau de contingence (encore) c’est juste une définition différente

29
Q

Qui-suis-je? « Test le plus commun pour tester la relation entre deux variables qualitatives ou quantitatives discrètes (= facteurs). »

A

Test d’indépendance du chi-carré

30
Q

Pourquoi le test d’indépendance du chi-carré s’appelle-t-il ainsi?

A

car son hypothèse nulle est l’indépendance des variables (= absence de relation).

31
Q

Vrai ou faux? le test d’indépendance du χ2

n’est finalement qu’un test d’ajustement dont la distribution nulle est l’indépendance des variables.

A

Vrai

32
Q

Comment est-ce qu’on calcule le degré de liberté pour un test d’indépendance du chi-carré?

A

dl = (lignes-1) × (colonnes-1)

33
Q

Vrai ou faux : il faut rejeter l’hypothèse nulle quand la valeur de chi-carré calculée est supérieure à la valeur critique de chi-carré.

A

Vrai

34
Q

Vrai ou faux : Le test d’indépendance du χ2

est limité à des facteurs qui ne prennent que 2 valeurs possibles.

A

Faux!

35
Q

Vrai ou faux : On peut calculer la contribution relative de chaque écart d’indépendance, afin de déterminer quelle(s) catégorie(s) est principalement responsable de ce manque d’indépendance.

A

Vrai, donné par (Fréquence attendue/chi-carré calculé) x 100

36
Q

Qui-suis-je? « Je varie entre 0 et 1 et je quantifie la force de la relation entre deux facteurs »

A

Coefficient de contingence

37
Q

Vrai ou faux : plus le coefficient de contingence s’approche de 1, moins l’intensité de la relation entre deux facteurs est grande.

A

Faux, plus le facteur de contingence s’approche de 1, plus la relation est forte