Échantillon Flashcards
Qu’est-ce que la population?
Tous les membres, éléments, et individus à propos desquels la recherche prétend dire quelque chose
-La taille de la population, qui est le nombre de membres, éléments, ou individus est dénotée par la lettre N
Qu’est-ce que l’échantillon?
Tous les membres, éléments, et individus d’une population qui font partie d’une étude ou expérience La taille de l’échantillon, qui est le nombre de membres, éléments, ou individus est dénotée par la lettre n Contrainte: n < N
Pourquoi l’échantillon est-il utile?
Répond à un besoin conjoint d’économie et d’accessibilité Permet d’observer une partie seulement d’un ensemble particulier dans le but de porter un jugement plus global ou de connaître l’ensemble dans son entier
Inconvénient majeur = risque de se tromper, de tirer une conclusion erronée au sujet d’un ensemble Plus les éléments varient, plus l’erreur est probable
Qu’est-ce que la variabilité?
La variation ou l’hétérogénéité des éléments constitutifs d’un ensemble est au cœur de toutes les théories de l’échantillonnage
Rappelez vous votre nombre préféré (allez sur le portail au besoin: cours 5)
Vos échantillons de taille n = 4 étaient, en moyenne, très près de la moyenne du groupe
Mais certains des échantillons étaient très éloignés de la moyenne La sous-estimant ou la surestimant substantiellement
Qu’est-ce que la représentativité?
Si les éléments d’un ensemble ne variaient pas, on n’aurait pas à se poser de questions sur la qualité de notre échantillon P. ex., il suffirait de connaître les intentions de vote d’un seul individu pour prédire, sans se tromper, l’issue d’un scrutin
Comme les gens varient, besoin d’échantillons qui varient de façon similaire pour bien représenter la population
Qu’est-ce que la généralisation?
Une recherche scientifique vise toujours la formulation de conclusions ou de généralisations qu’on veut valables pour un ensemble donné
L’échantillon comme raccourci inévitable
L’échantillon constitue un facteur très important qui affecte et détermine directement la valeur même des généralisations de l’étud
Qu’est-ce que le recensement?
Recensement = recueillir les informations auprès de l’ensemble des éléments ou des individus concernés
On mesure les N membres de la population
Avantages: les paramètres calculés inférences puisque les informations proviennent de tous les éléments de la population
Contraintes: identification préalable et localisation de la totalité des éléments de la population = coût relativement élevé
Rappel: m est un paramètre, X une statistique
Que doit-on accepter lorsque l’on travaille avec un échantillon?
Un certain niveau d’incertitude
Quelles sont les composantes du diagramme de Venn?
Population cible: Ensemble ou bassin d’individus auxquels on voudra, une fois le travail complété, appliquer les résultats obtenus (taille N)
Population accessible : Portion de la population cible qui est disponible à la recherche
-Ceux-celles qui peuvent se déplacer ou qu’on peut rejoindre
-Taille nA, où n ≤ nA ≤ N (mais n < N)
Source de biais de représentativité #1
-Devrait pouvoir être un sous-ensemble aléatoire de la population cible
Échantillon: Sous-ensemble de la population accessible qui participera à l’expérience ou l’étude (taille n)
-Source de biais de représentativité #2
-Devrait pouvoir être un sous-ensemble aléatoire de la population accessible
Que devrait constituer l’échantillon?
L’échantillon devrait constituer un modèle réduit de la population qu’il représente
La représentativité fait référence à une ou à des caractéristiques très précises et directement pertinentes pour ce que nous voulons étudier
- Ce n’est pas parce qu’un échantillon respecte les proportions d’hommes et de femmes dans la pop qu’il est représentatif par rapport à une autre caractéristique
Quel est le problème majeup des études faites à partir d’échantillons?
Le problème majeur des études faites à partir d’échantillons réside dans l’estimation de certaines valeurs de la population (une moyenne, une corrélation, une variance, une différence de moyennes…) à partir d’informations recueillies sur une partie seulement de cette dernière
- On cherche à favoriser une estimation optimale de certains paramètres de la population à partir de statistiques calculées sur l’échantillon
Comment la taille de l’échantillon influe sur l’erreur?
Règle générale: plus l’échantillon est petit, plus l’erreur est grande en moyenne (Théorème Central Limite)
Utilité d’un grand échantillon
- Lorsque des variables non contrôlées exercent un effet sur les résultats, le hasard va faire en sorte qu’ils vont tendre à se contrebalancer à la longue
Lorsque l’on veut comparer des sous-groupes à l’intéerieur d’un échantillon, la taille doit être assez grande pour pouvoir diviser l’échantillon en gardant une certaine représentativité de chacun des sous-groupes
Quelles sont les considérations nécessaires pour déterminer la taille d’un échantillon?
Difficile! Mais requiert trois considérations:
-Précision recherchée pour l’estimation
-Niveau de confiance choisi (ou du risque d’erreur assumé)
- L’ordre de grandeur de la variabilité présumée du trait étudié dans la population visée par l’étude
- Plus chacune de ces considérations implique une évaluation élevée (précision, niveau, variabilité), plus la taille de l’échantillon doit augmenter
-On utilise généralement des logiciels pour nous guider
Qu’est-ce qu’un échantillon probabiliste?
Fondés sur les probabilités
-Utilisent des estimateurs précis
Se basent sur des modèles théoriques
Exigent une base de sondage
-Une liste exhaustive de tous les éléments de la population
Qu’est-ce que l’échantillonnage aléatoire simple?
Réfère au cas particulier où chacune des unités de la population a une probabilité égale d’appartenir à l’échantillon
La technique de base consiste à identifier chacun des éléments de la population et à en retenir un certain nombre (n) par un procédé de tirage au sort
Enlève toute forme de biais
Procédure issue d’un monde idéal
Qu’est-ce que l’échantillonnage aléatoire stratifié?
Consiste à diviser la population en sous-populations (strates) en fonction de critères (ou variables de stratification) et à constituer par la suite un échantillon aléatoire pour chacune des strates
Les strates doivent-elles être proportionnelles ou égales?
Si 90% d’une population a une valeur A selon un variable de catégorisation en strate, et l’autre 10% B…
On met dans l’échantillon 9 fois plus de A que de B si on veut représenter fidèlement la population
On met autant de A que de B si on veut comparer ces deux sous-groupes de manière équitable
Qu’est-ce que l’échantillonnage par grapes?
Il existe des situations de recherche où il est soit très difficile d’identifier chaque élément d’une population, soit encore plus pratique de sélectionner non pas des individus mais des groupes d’individus
Il est plus facile de sélectionner des classes entières d’élèves plutôt que des élèves répartis un peu partout dans une école ou dans plusieurs institutions scolaires
Potentiel élevé d’effet de grappe sur représentativité
Quel est le problème de l’approche aléatoire?
Ne se peut pas en pratique!
Implique que nous aillons une base de sondage et que nous soyons capable de rejoindre tous les participants sélectionnés
Les nons-réponses affectent la valeur estimés et remettent en cause le caractère aléatoire d’un échantillon
Le tirage au hasard va à l’encontre de l’éthique
Généralement, les individus qui acceptent de participer présentent une configuration de caractéristiques qui les distinguent de ceux qui déclinent la même invitation
Quel est le principe de base des échantillons non-probabilistes empiriques?
L’approche probabiliste est impossible, du moins en psychologie
L’approche probabiliste plus appropriées pour agriculture et géologie, par exemple
-Consentement libre et éclairé des roches ou des épis de maïs?
Il n’existe aucun moyen de déterminer la probabilité qu’a un élément de la population d’être inclus dans l’échantillon, voire même aucune certitude à l’effet que tousles éléments ont une chance quelconque, aussi minime soit-elle, d’en faire partie
Principaux facteurs qui militent en faveur de l’utilisation d’échantillons non-probabilistes sont d’ordre éthique, économiques et pratiques
Qu’est-ce que l’échantillonnage accidentel?
Il suffit de prendre les cas qui se présentent simplement à nous à un moment et à un endroit donné, sans que cela n’ait quelque lien avec l’objet d’enquête et ce, jusqu’à ce que nous ayons atteint le nombre de participants désiré
La sélection des unités d’observation s’effectue entièrement sur le terrain
Quels sont les problèmes liés à l’échantillonnage accidentel?
Cette façon de procéder est risquée parce qu’elle prête flanc à des sources de biais importants
-Les gens qui ne fréquentent pas ces endroits n’ont aucune chance d’être choisis
- Ceux qui les fréquentent à l’occasion seulement ont peu de chances de l’être
- Ce qui n’est pas le cas de ceux qui s’y retrouvent régulièrement et qui ont ainsi de fortes chances de faire partie de l’échantillon
Qu’est-ce qui fait que certaines personnes plutôt que d’autres ont plus de chance d’être là?