Cours 5 : Comparaison & relations entre variables qualitatives = tests du chi-carré Flashcards
Qui-suis-je? « fraction de la population qui présente une caractéristique particulière »
proportion
vrai ou faux? il est possible d’estimer une proportion dans la population à partir d’un échantillon et de calculer son intervalle de confiance.
vrai
Quels sont les 6 critères nécessaires pour qu’on puisse utiliser la Loi binomiale?
- L’échantillonnage est aléatoire et indépendant;
- Les valeurs ne peuvent appartenir qu’à 2 catégories seulement;
- On échantillonne un nombre fixe n de valeurs;
- La probabilité d’appartenir à la catégorie 1 = p
- La probabilité d’appartenir à la catégorie 2 = 1−p
- La probabilité d’appartenir à l’un (p) ou l’autre (1−p) des groupes est la même pour chaque élément de l’échantillon.
comment peut-on estimer la vraie proportion d’une catégorie de la population?
- définir formellement la moyenne attendue
- définir l’erreur standard d’une variable aléatoire
dans les deux cas, il faut suivre une loi de probabilité binomiale
Qui-suis-je? « variable aléatoire X
suivant une loi binomiale d’effectif n
et de probabilité individuelle p »
erreur standard
Vrai ou faux : l’erreur standard diminue en proportion de la racine carrée de l’effectif n.
Vrai, ainsi plus la taille d’échantillon n
sera grande, plus vos estimations seront précises.
Qui-suis-je? « intervalle de confiance entourant notre estimation de la « vraie » proportion dans la population qui diminue plus on augmente le nombre d’observations n. »
intervalle de confiance autour de P
nommez la méthode permettant d’estimer un intervalle de confiance autour d’une proportion.
Intervalle de confiance de Wald
Qui-suis-je? « test qui permet d’appliquer les propriétés de la distribution binomiale pour tester la significativité statistique d’une proportion (= différence par rapport à l’effet du hasard). »
test binomial
Quelles conditions doivent être respectées pour pouvoir faire un test binomial?
- Il faut que les valeurs échantillonnées ne puissent prendre que deux valeurs : succès ou échec.
- On cherche à déterminer si la fréquence relative du succès dans la population (p) est conforme à une valeur nulle (p0).
Qui-suis-je? « Loi qui décrit la distribution de probabilité de la somme de carrés de variables aléatoires continues indépendantes qui suivent chacune une loi Normale centrée réduite. »
Loi du chi-carré ( χ2)
Vrai ou faux : les valeurs de χ2
sont toujours positives et la fonction de densité de probabilité résultante n’est pas symétrique
Vrai
Vrai ou faux : comme la loi de student, la loi du chi-carré a recourt à l’utilisation de degrés de liberté.
vrai
Comment est-ce qu’on calcule le degré de liberté d’un test de chi-carré?
dl = nombre de catégories − 1 − nombre de paramètres estimés
À quel moment la valeur seuil de chi-carrée peut-elle aussi être nommée la valeur critique?
Lorsqu’elle délimite le seuil de significativité α.
Qui-suis-je? « extension généralisée du test binomial à la comparaison de proportions de variables qualitatives pour lesquelles il y a plus de 2 catégories possibles. On m’appelle aussi test d’adéquation »
Test d’ajustement du chi-carré
Sur quels types de variables pouvant nous faire un test d’ajustement du chi-carré?
- les variables qualitatives
- les variables quantitatives discrètes.
Vrai ou faux?
Si on fait la somme de ces carrés des écarts normalement distribués, on obtient par définition une variable aléatoire qui suit une loi du χ2
vrai
Quelles sont les conditions à respecter pour pouvoir utiliser le test d’ajustement de chi-carré?
- Aucune des catégories ne devrait avoir une fréquence attendue < 1;
- Pas plus de 20% des catégories ne devraient avoir une fréquence attendue < 5.
- L’échantillonnage doit être aléatoire et indépendant
** la condition 3 s’applique à tous les test de statistique
Qui-suis-je? « loi de probabilité très utile pour étudier les variables discrètes, distribution de probabilité permettant de décrire le comportement du nombre d’événements se produisant dans un intervalle de temps (d’espace) fixé. »
Loi de Poisson
Quelles sont les deux conditions nécessaires pour pouvoir utiliser la loi de Poisson?
1 .Il faut que ces événements arrivent indépendamment les uns des autres
2. Évènements homogènes dans le temps (l’espace), c.-à-d. qu’ils aient chacun la même probabilité de se réaliser indépendamment les uns des autres.
Vrai ou faux? Dans une loi de Poisson, la variance est égale à la moyenne λ
Vrai
Si dans notre échantillon la variance < moyenne, alors les évènements sont :
Surdispersés, les évènements arrivent trop régulièrement
Si au contraire la variance > moyenne, alors les évènements sont :
Regroupés, les évènements arrivent par paquets.
Vrai ou faux : l’usage principal de la distribution de Poisson en biologie est de tester si l’occurrence d’un événement de nature spatiale ou temporelle est aléatoire.
Vrai
Vrai ou faux : on peut faire un test d’ajustement du chi-carré à la loi de poisson.
Vrai, quand on cherche à savoir si tel évènement arrive de façon aléatoire dans le temps par exemple
Qui-suis-je? « Je permet d’évaluer la dépendance entre 2 variables qualitatives (facteurs) »
Tableau de contingence
Qui-suis-je? « Je permet de détecter les dépendances entre des caractéristiques qualitatives binaires mesurées sur les individus d’une population. »
Tableau de contingence (encore) c’est juste une définition différente
Qui-suis-je? « Test le plus commun pour tester la relation entre deux variables qualitatives ou quantitatives discrètes (= facteurs). »
Test d’indépendance du chi-carré
Pourquoi le test d’indépendance du chi-carré s’appelle-t-il ainsi?
car son hypothèse nulle est l’indépendance des variables (= absence de relation).
Vrai ou faux? le test d’indépendance du χ2
n’est finalement qu’un test d’ajustement dont la distribution nulle est l’indépendance des variables.
Vrai
Comment est-ce qu’on calcule le degré de liberté pour un test d’indépendance du chi-carré?
dl = (lignes-1) × (colonnes-1)
Vrai ou faux : il faut rejeter l’hypothèse nulle quand la valeur de chi-carré calculée est supérieure à la valeur critique de chi-carré.
Vrai
Vrai ou faux : Le test d’indépendance du χ2
est limité à des facteurs qui ne prennent que 2 valeurs possibles.
Faux!
Vrai ou faux : On peut calculer la contribution relative de chaque écart d’indépendance, afin de déterminer quelle(s) catégorie(s) est principalement responsable de ce manque d’indépendance.
Vrai, donné par (Fréquence attendue/chi-carré calculé) x 100
Qui-suis-je? « Je varie entre 0 et 1 et je quantifie la force de la relation entre deux facteurs »
Coefficient de contingence
Vrai ou faux : plus le coefficient de contingence s’approche de 1, moins l’intensité de la relation entre deux facteurs est grande.
Faux, plus le facteur de contingence s’approche de 1, plus la relation est forte