Échantillonnage Flashcards
Qu’est-ce qu’un échantillonnage?
Opération consistant à sélectionner des éléments dans une population.
Qu’est-ce qu’un échantillon?
L’ensemble des éléments sélectionnés.
Qu’est-ce qu’un échantillonnage dit représentatif?
Opération consistant à sélectionner des éléments :
- de manière non biaisée (aléatoirement)
- dans une population statistique définie à l’avance
Nommez trois méthodes d’échantillonnage aléatoire.
1- Échantillonnage aléatoire simple
2- Échantillonnage systématique
3- Échantillonnage stratifié
Pourquoi des méthodes ont été conçues pour effectuer un échantillonnage aléatoire?
Parce que l’humain ne peut pas effectuer des actions aléatoires malgré lui.
En quoi consiste l’échantillonnage aléatoire simple?
Méthode qui consiste à prélever au hasard (par tirage aléatoire) et de façon indépendante n éléments d’une population statistique de N éléments.
Vrai ou faux? Chaque élément de la population possède la même probabilité a priori de faire partie de l’échantillon.
Vrai.
Vous devez sélectionner 40 éléments dans une population de 5000. Vous pouvez faire cela dans R en sélectionnant aléatoirement 40 nombres entre 1 et 5000. Quelle est la commande pour effectuer cette action dans R ?
nb.alea
Quelle est la commande dans R pour trier les nombres aléatoires définis dans un objet nommé nb.alea?
sort(nb.alea)
Qu’est-ce qu’un échantillonnage systématique?
Échantillonnage régulier sur une dimension (p.ex. le temps) ou deux dimensions (p.ex. sur un territoire ou dans une boite de Petri).
Vrai ou faux. L’échantillonnage aléatoire simple peut donner de bons résultats si on veut une couverture HOMOGÈNE d’un territoire.
Faux. Un échantillon avec une couverture homogène peut être réalisé avec l’échantillonnage systématique.
En quoi consiste un échantillonnage systématique?
1- Détermination de l’effort d’échantillonnage n, où n est le nombre d’éléments à sélectionner et positionner.
2- On sélectionne un premier élément de façon aléatoire. Par exemple, avec la commande R sample(seq(1, N), 1).
3- On détermine ensuite la raison (ou pas) de la progression systématique de l’échantillonnage, soit l’intervalle entre deux points d’échantillonnage.
On calcule la raison p=N/n, et on arrondi à la basse. (N= éléments de la population, tirés aléatoirement)
Par exemple, si N= 46 et n= 10, N/n= 46/10 = 4.6. La raison de la progression sera donc p= 4.
Dans un échantillonnage systématique, on réalise une statistique sur 50 personnes dont 7 personnes seront sélectionnées.
A) Quelle est la raison d’échantillonnage?
B) Quelle est la commande sur R nous permettant de trouver notre premier «point», de façon aléatoire pour débuter un graphique sur l’étendue donné?
A) p=N/n, où N=50 et n=7.
p= 50/7 = 7,1, soit arrondi à 7.
B) sample(seq(1, 50), 1)
Vrai ou faux. L’échantillonnage aléatoire simple peut donner de bons résultats si on veut une couverture HÉTÉROGÈNE d’un territoire.
Faux. Un échantillon avec une couverture homogène peut être réalisé avec l’échantillonnage stratifié.
Qu’est-ce qu’un échantillonnage stratifié?
Méthode qui consiste à subdiviser une population statistique hétérogène en sous-populations (= strates):
- Plus homogène
- Mutuellement exclusives
- collectivement exhaustives