quiz Flashcards
Citez le principe central à l’application des biostatistiques.
Il s’agit du principe d’estimation qui consiste à déduire une mesure inconnue (paramètre) d’une population à partir seulement d’un échantillon (statistique).
Citez 3 propriétés principales d’une bonne représentation graphique des données.
Représentation honnête, claire et efficace, selon le type de données représentées (qualitatives et/ou quantitatives).
Vrai ou faux?
La “distribution d’échantillonnage” est la distribution de probabilité des valeurs d’un estimé qu’on obtiendrait en échantillonnant la population de nombreuses fois.
Vrai
Une étude sur 405 patients souffrant une forme de leucémie a conclu à une probabilité de rémission à l’intérieur de 4 ans de traitement de 0.19, avec un intervalle de confiance de 0.12 à 0.28. Le(s)quel(s) des énoncés suivants est (sont) vrai(s) ?
A. La proportion de personnes en rémission dans la population est de 0.19.
B. La proportion de personnes en rémission dans la population est probablement comprise entre 0.12 et 0.28.
C. Il y a 95% de chances que la proportion de personnes en rémission dans la population soit comprise entre 0.12 et 0.28.
D. Une proportion de personnes en rémission dans la population de 0.13 est plausible.
B. La proportion de personnes en rémission dans la population est probablement comprise entre 0.12 et 0.28.
et
D. Une proportion de personnes en rémission dans la population de 0.13 est plausible.
Que peuvent représenter les barres d’erreur dans les graphiques?
Les barres d’erreurs peuvent représenter différentes mesures de confiance de l’estimé OU de dispersion des observations.
- L’écart-type des données
- L’erreur standard de l’estimé de la population (à partir des données)
- L’intervalle de confiance à 95% de l’estimé de la population (à partir des données)
Une statistique de test est (plusieurs réponses possibles) :
A. Une quantité calculée à partir des données.
B. Toujours la solution d’une équation statistique complexe.
C. Utilisée pour comparer la “conformité” des données à l’hypothèse nulle.
D. Soit un nombre de succès, soit une moyenne.
A. Une quantité calculée à partir des données.
ET
C. Utilisée pour comparer la “conformité” des données à l’hypothèse nulle.
Vrai ou faux.
La distribution nulle est toujours une distribution normale.
Faux
Vrai ou faux?
L’hypothèse nulle est rejetée lorsque la statistique de test est plus petite que la valeur critique définie selon la distribution nulle.
Faux
Choisissez les cas de figures qui nécessitent l’utilisation d’une loi de distribution de Poisson.
A. Tester si les étudiantes ont de meilleurs résultats en biostatistiques que les étudiants.
B. Tester si les balanes sont réparties de façon ordonnées le long d’un gradient d’exposition à l’effet
C. Calculer la probabilité d’observer exactement 4 épisodes de pluie pendant l’hiver (décembre à avril) à Québec
D. Tester si la proportion de nouveaux nés atteint de microcéphalie est liée à la proportion de femmes enceintes atteintes du virus Zika
B. Tester si les balanes sont réparties de façon ordonnées le long d’un gradient d’exposition à l’effet
ET
C. Calculer la probabilité d’observer exactement 4 épisodes de pluie pendant l’hiver (décembre à avril) à Québec
La distribution de Poisson décrit la distribution de fréquence du nombre de “succès” à l’intérieur de bloc de temps ou d’espace lorsque les succès surviennent indépendamment et avec la même probabilité dans le temps ou l’espace.
Dans quel cas est utilisée l’analyse de contingence?
Lorsqu’il y a une relation entre deux variables qualitatives. Par exemple:
- Consommer de l’alcool (oui | non) x fumer (oui | non)
- Mourir (oui | non) x être parasité (oui | non)
- Type de sol (plusieurs catégories possibles) x espèces du genre Poa (plusieurs espèces possibles)
Ne fonctionne PAS pour les variables quantitatives.
Quelles sont les trois choses que l’on peut faire lorsque les conditions d’application ne sont pas remplies.
- Ignorer la violation si elle est mineure
- Transformer les données initiales pour qu’elles correspondent à la distribution ciblée
- Utiliser un test équivalent non-paramétrique qui opère sur les rangs des valeurs.
(Les tests non-paramétriques ne sont pas moins bons que leurs équivalents paramétriques, mais ils sont généralement moins puissants, c-à-d qu’ils sont moins susceptibles de rejeter l’hypothèse nulle lorsqu’elle est fausse).
La variable suivante est explicative ou réponse?
Variable manipulée par le chercheur et qui a un effet sur la variable réponse
Variable explicative
La variable suivante est explicative ou réponse?
Variable mesurée par le chercheur, effet du traitement.
Variable réponse
L’erreur d’échantillonnage correspond à la précision ou à l’exactitude?
À la précision
Le biais correspond à la précision ou à l’exactitude?
À l’exactitude
Dans un tableau de contingence, quelle variable est dans les colonnes
La variable explicative
Dans un tableau de contingence, quelle variable est dans les lignes
La variable réponse
Quelle formule à utiliser pour une proportion de deux événements non-mutuellement exclusifs?
P[A ou B] = P[A] + P[B] - P[A et B]
C’est pour ne pas calculer la valeur de P[A et B] deux fois.
Comment se nomme la probabilité d’obtenir la statistique de test si l’hypothèse nulle est vraie?
p-value
Vrai ou faux?
On rejette l’hypothèse nulle lorsque le p-value < 0,05
Vrai
Quel est l’erreur de type I? (alpha)
Il s’agit de rejeter H0 alors qu’en réalité elle est vraie.
Quel est l’erreur de type II? (beta)
Il s’agit de ne pas rejeter H0 alors qu’elle est fausse en réalité.
Quel type de graphique à utiliser lorsqu’on a deux variables numériques?
Nuage de points
Quel type de graphique à utiliser lorsqu’on a deux variables qualitatives?
Mosaïque, diagramme en bâtons
Quel type de graphique à utiliser lorsqu’on a une variable numérique et une variable qualitative?
Histogramme de fréquence, strip chart, box plot.
Quelles sont les conditions d’application de la loi binomiale?
- Le nombre d’essais est fixe
- L’échantillonnage est aléatoire et indépendant
- La probabilité d’appartenir à l’une ou à l’autre des catégories est la même pour chaque individu
Quelles sont les conditions d’application du chi-carré?
- Aucune des catégories ne devrait avoir une fréquence attendue <1
- Pas plus que 20% des catégories ne devraient avoir une fréquence attendue <5