Cours 2: Échantillonnage, variables, statistiques descriptives et graphiques Flashcards
Qui-suis-je? « Fraction d’une population statistique sur laquelle des mesures (observations) sont effectuées dans le but d’estimer les propriétés de cette population.»
Échantillon
Qui-suis-je? «Plus petit niveau sur lequel est effectué l’échantillonnage. Par exemple un individu, une cellule à l’intérieur d’un individu, une famille, une école, etc»
unité d’échantillonnage
Qui-suis-je? « Mesure (ou caractéristique) calculée sur la population, souvent représentée par une lettre grecque (par exemple: moyenne = µ). »
paramètre statistique
Dans quel cas est-il nécessaire de prendre un échantillon?
lorsqu’on ne peut pas prendre des mesures sur l’ensemble d’une population.
Sélectionner le ou les énoncés qui est vrai :
a) Deux échantillons, même différents, ne proviennent pas nécessairement de deux populations différentes
b) Deux échantillons, même semblables, ne proviennent pas nécessairement de deux populations semblables.
c) toutes les réponses sont vraies
C) toutes ces réponses
Quels sont les intérêts principaux de l’échantillonnage?
- calculer des inférences (estimations) sur la population statistique à l’aide de tests d’hypothèses
- nombre limité d’observations
La qualité d’un échantillon se mesure selon deux caractéristiques, nomme-les
- erreur d’échantillonnage
2. le biais d’échantillonnage.
Qui-suis-je? «émerge de la variabilité des mesures et de l’effectif (taille) de l’échantillon et affecte la précision des estimations faites à partir de l’échantillon. »
erreur d’échantillonnage
Vrai ou faux : En général, plus l’échantillon est grand, plus l’erreur d’échantillonnage augmente (la précision diminue ).
faux : plus l’échantillon est grand, plus l’erreur d’échantillonnage diminue (la précision augmente).
Qui-suis-je? « écart systématique des estimations résultant d’une sélection inappropriée des individus formant notre échantillon par rapport à celle de la population et affecte l’exactitude (accuracy) des estimations.
Biais d’échantillonnage
Quel est le moyen le plus efficace pour minimiser les biais d’échantillonnage?
Échantillonnage aléatoire
Qui-suis-je? « méthode qui consiste à prélever au hasard et de façon indépendante »
Échantillonnage aléatoire
Comment obtenir un échantillon aléatoire en pratique ? (4 étapes)
- On crée une liste des individus de la population (N) et on leur attribuer un numéro allant de 1 à N
- On décide de la quantité à échantillonner n
comprise entre 1 et N - On utilise un générateur de nombres aléatoires pour n entiers compris entre 1 et N
- On échantillonne les individus dont le numéro correspond à un numéro qui a été généré aléatoirement.
Qui-suis-je? « propriété mesurable qui varie (le plus souvent) de manière naturelle.
Variable
Vrai ou faux : on ne peut mesurer qu’une variable à la fois par unité d’échantillonnage.
Faux : Il est important de noter que plus d’une variable peut être mesurée sur une unité d’échantillonnage.
Vrai ou faux : le type de variable n’a pas d’impact sur le traitement statistique des données
faux
Quelles sont les deux grandes classes de variables?
- Variable qualitative
- Variable quantitative
Qui-suis-je? « variables catégorielles, sont des variables ne pouvant pas être mesurées quantitativement »
Variables qualitatives
Quels sont les seuls calculs qu’on puisse faire avec des variables qualitatives?
Calculs impliquant le nombre d’éléments par catégorie et les différentes proportions parmi les catégories.
Les variables qualitatives peuvent être…(3)
- Binaire
- Nominale
- Ordinale