Echantillons Flashcards
échantillon représentatif/non biaisé
chaque membre de la population a la même probabilité d’être sélectionné pour répondre à l’enquête
échantillon biaisé
chaque membre de la population n’a pas la même probabilité d’être sélectionné pour répondre à l’enquête
échantillon
sous ensemble de la population àpd laquelle on tente d’inférer des mesures sur la population
échantillon probabiliste
on dispose d’une base de sondage donc on garantit la représentativité.
- On peut estimer l’erreur possible d’échantillonnage de manière rigoureuse grâce au calcul des probabilités.
- Mais les conditions sont difficilement remplies et le coût est souvent élevé.
- Les biais sont en général plus facilement contrôlables et parfois, éliminables.
- Mais tout dépend du taux de réponse!
échantillon empirique
ne garantit pas la représentativité mais on tente de s’en rapprocher par raisonnement.
- Il n’y a pas de calcul possible sur l’erreur d’échantillonnage, sauf par analogie.
- La méthode est souvent moins coûteuse et parfois la seule possible ( il n’existe pas de base de sondage).
- Il est beaucoup plus difficile de contrôler les biais.
- Certains échantillons empiriques «imitent» le hasard.
technique d’échantillonnage
méthodes pour sélectionner un échantillon et qui ( en fonction des coûts, des techniques) minimise l’erreur d’échantillonage
erreur d’échantillonnage
marge d’imprécision qui existe dans tous les échantillons meme représentatifs
-> il faut situer toute mesure dans un intervalle de confiance
intervalle de confiance
intervalle à l’intérieur duquel va se trouver la vraie valeur d’une donnée d’échantillon et un niveau de probabilité donné
marge d’erreur
toute estimation s’écarte dans une certaine mesure des vraies valeurs de la population, sous le simple effet du hasard
échantillon stratifié
tirer au sort dans chaque strates d’une population
échantillon par grappe
ensemble d’unités que l’on peut tirer simultanément parce qu’elles ont un lien entre elles.
échantillon par quota
on construit un échantillon qui ressemble le plus possible à la population initiale
échantillonnage sur place
on sélectionnera les personnes en fonction d’un lieu déterminé qu’elles fréquentent
MCAR = Missing completely at random
sont des données manquantes totalement aléatoires.
Ces données réduisent la précision puisque l’échantillon est plus petit.
Mais ne biaisent pas les résultats
car elles sont totalement aléatoires
MAR = Missing at random
sont les données manquantes aléatoires ; c’est le cas quand une catégorie spécifique d’individus sélectionnés répond moins que les autres à une enquête et qu’il n’y a aucune différence entre les répondants et les non-répondants de cette catégorie