Cours 1 Flashcards
def statistique
la science qui vise à apprendre à partir de données
s’intéresse à leur collecte, leur analyse et leur interprétation
def interférence statistique
généraliser à une population une conclusion tirée sur la base d’un échantillon
def population
ensemble des individus (ou unités) sur lesquels porte l’étude
def échantillon
ensemble de la population qui sert à recueillir les données nécessaires à l’étude
def variable
- caractéristique ou propriété que l’on souhaite étudier et qui peut théoriquement être déterminée pour tous les individus de la population
- caractéristique ou propriété varie d’un individu à l’autre, on la dénote souvent par X
def estimation
approximation du paramètre inconnu calculée en utilisant les données de l’échantillon
vrai ou faux: si les données recueillies sont déficientes, les résultats n’auront pas de valeur et donc les décisions prises sur la base des conclusions pourront être de mauvaises décisions.
vrai
Conditions pour une bonne interférence
l’échantillon doit être représentatif de la population :
- population bien identifiée
- on sait comment rejoindre les membres de la population au besoin
- méthode d’échantillonnage est adéquate, elle s’appuie sur le hasard
méthodes d’échantillonnage probabilistes
- échantillon aléatoire simple avec remise (ASAR)
- échantillon aléatoire simple sans remise (ASSR)
- échantillon systématique
- échantillon stratifié
- échantillon en grappes
quel est le dénominateur commun entre toutes les méthodes d’échantillonnage probabilistes?
le hasard
ASAR
on sélectionne au hasard des unités de la population jusqu’à avoir le nombre souhaité, en conservant dans la liste d’unités éligibles pour le prochain tirage déjà sélectionnées
ASSR
on sélectionne au hasard des unités de la population jusqu’à en avoir le nombre souhaité, une unité n’étant plus éligible pour les tirages subséquents si elle est sélectionnée
échantillon systématique
on sélectionne de manière systématique les unités d’une liste présentée dans un ordre arbitraire (ex. chaque 12e unité), après avoir sélectionné aléatoirement le point de départ
permet d’approximer un échantillon ASAR tout en étant plus facile à réaliser
échantillon stratifié
la population est divisé en sous-groupes appelés states (ex. par âge, sexe, etc.), un échantillon aléatoire simple est ensuite sélectionné dans chaque groupe
cel permet de s’assurer de la représentation des différentes strates dans l’échantillon dans le but d’améliorer la précision des estimations
échantillon en grappes
si la population se présente naturellement en groupes d’unités, appelés grappes (ex. des foyers, des secteurs d’une région…), on peut prendre un échantillon aléatoire simple de grappes, tous les individus de l’échantillon de grappes font partie de l’échantillon
cette méthode est souvent moins coûteuse mais réduit la précision des estimation pour la même taille d’échantillon