Cours 10 Flashcards
Qu’est-ce qu’un population?
- Tous les membres, éléments, et individus à propos desquels la recherche prétend dire quelque chose
- La taille de la population, qui est le nombre de membres, éléments, ou individus est dénotée par la lettre N
Qu’est-ce qu’un échantillon?
- Tous les membres, éléments, et individus d’une population qui font partie d’une étude ou expérience
- La taille de l’échantillon, qui est le nombre de membres, éléments, ou individus est dénotée par la lettre n
- Contrainte : n < N
Quels sont les avantages et inconvénients d’un échantillon?
- Répond à un besoin conjoint d’économie et d’accessibilité
- Permet d’observer une partie seulement d’un ensemble particulier dans le but de porter un jugement plus global ou de connaître l’ensemble dans son entier
- Inconvénient majeur = risque de se tromper, de tirer une conclusion erronée au sujet d’un ensemble
- Plus les éléments varient, plus l’erreur est probable
Qu’est-ce que la variabilité?
- La variation ou l’hétérogénéité des éléments constitutifs d’un ensemble est au cœur de toutes les théories de l’échantillonnage
- Rappelez vous votre nombre préféré (allez sur le portail au besoin: cours 5)
- Vos échantillons de taille n = 4 étaient, en moyenne, très près de la moyenne du groupe
- Mais certains des échantillons étaient très éloignés de la moyenne
- La sous-estimant ou la surestimant substantiellement
- Rappelez vous votre nombre préféré (allez sur le portail au besoin: cours 5)
Quel est l’enjeu de la représentativité?
- Si les éléments d’un ensemble ne variaient pas, on n’aurait pas à se poser de questions sur la qualité de notre échantillon
- P. ex., il suffirait de connaître les intentions de vote d’un seul individu pour prédire, sans se tromper, l’issue d’un scrutin
« À 20hrs (heure de fermeture des bureaux de votes) et après le décompte d’UN bulletin, Radio-Canada AFFIRME que le Parti Clone formera le prochain gouvernement »
- P. ex., il suffirait de connaître les intentions de vote d’un seul individu pour prédire, sans se tromper, l’issue d’un scrutin
- Comme les gens varient, besoin d’échantillons qui varient de façon similaire pour bien représenter la population.
–> Comment on construit un échantillon important pour savoir comment et à quel point on peut généraliser
Que vise une recherche scientifique?
- Une recherche scientifique vise toujours la formulation de conclusions ou de généralisations qu’on veut valables pour un ensemble donné
- L’échantillon comme raccourci inévitable
- L’échantillon constitue un facteur très important qui affecte et détermine directement la valeur même des généralisations de l’étude
Qu’est-ce que le recensement ainsi que son avantage et inconvénient?
- Recensement = recueillir les informations auprès de l’ensemble des éléments ou des individus concernés
- On mesure les N membres de la population
- Avantages: les paramètres calculés n’égale pas des inférences puisque les informations proviennent de tous les éléments de la population
- Contraintes: identification préalable et localisation de la totalité des éléments de la population = coût relativement élevé
- Rappel: mu est un paramètre, X une statistique
Quelle conclusion est menée puisqu’il n’est pas possible de recenser?
- La décision de travailler avec un échantillon seulement plutôt qu’avec la totalité des cas visés par l’étude s’impose plus souvent qu’autrement
- Puisque les observations sont effectuées sur un échantillon et non sur la totalité de la population visée par l’étude, la recherche doit tolérer de ce fait une incertitude permanente quant à la valeur exacte des conclusions de son étude
- Statistiques comme estimation de paramètres
- Puisque les observations sont effectuées sur un échantillon et non sur la totalité de la population visée par l’étude, la recherche doit tolérer de ce fait une incertitude permanente quant à la valeur exacte des conclusions de son étude
- Avantages
- Économie de temps, d’argent et d’énergie
Comment définit-on la population cible, la population accessible ainsi que l’échantillon?
Population cible
* Ensemble ou bassin d’individus auxquels on voudra, une fois le travail complété, appliquer les résultats obtenus (taille N)
Population accessible
* Portion de la population cible qui est disponible à la recherche
- Ceux-celles qui peuvent se déplacer ou qu’on peut rejoindre
- Taille nA, où n ≤ nA ≤ N (mais n < N)
* Source de biais de représentativité #1
- Devrait pouvoir être un sous-ensemble aléatoire de la population cible
- Difficile de généraliser puisque les résultats de la population accessible pourraient être dû à un élément géographique par exemple (accessible physiquement)
Échantillon
* Sous-ensemble de la population accessible qui participera à l’expérience ou l’étude (taille n)
* Source de biais de représentativité #2
- Devrait pouvoir être un sous-ensemble aléatoire de la population accessible.
- L’échantillon regroupe des gens qui souhaitent participer et il s’agit d’un biais.
Comment la représentativité pose problème dans l’élaboration d’un échantillon?
- L’échantillon devrait constituer un modèle réduit de la population qu’il représente
- La représentativité fait référence à une ou à des caractéristiques très précises et directement pertinentes pour ce que nous voulons étudier
- Ce n’est pas parce qu’un échantillon respecte les proportions d’hommes et de femmes observées dans une population particulière qu’il peut être jugé représentatif de cette dernière par rapport à une autre caractéristique moins, autant, ou plus importante
- La représentativité fait référence à une ou à des caractéristiques très précises et directement pertinentes pour ce que nous voulons étudier
- Le problème majeur des études faites à partir d’échantillons réside dans l’estimation de certaines valeurs de la population (une moyenne, une corrélation, une variance, une différence de moyennes…) à partir d’informations recueillies sur une partie seulement de cette dernière
- On cherche à favoriser une estimation optimale de certains paramètres de la population à partir de statistiques calculées sur l’échantillon.
Qu’est-ce qu’implique la taille de l’échantillon?
- Règle générale: plus l’échantillon est petit, plus l’erreur est grande en moyenne (Théorème Central Limite)
- Utilité d’un grand échantillon
- Lorsque plusieurs variables non contrôlées interviennent et exercent un certain effet sur les résultats, le principe du hasard permet de postuler que ces variables, souvent désignées comme des parasites, vont tendre à se contrebalancer à la longue
- Lorsque nous désirons comparer des sous-groupes à l’intérieur d’un échantillon, la taille de ce dernier doit être suffisamment grande pour permettre un tel fractionnement tout en préservant une certaine représentativité de chacun des sous-groupes
- Par exemple, un échantillon de taille n = 30 permet de comparer seulement 15 hommes à 15 femmes si leurs nombres sont égaux
Comment détermine-t-on la taille nécessaire de l’échantillon?
- Difficile! Mais requiert trois considérations:
- Précision recherchée pour l’estimation
- Niveau de confiance choisi (ou du risque d’erreur assumé)
- L’ordre de grandeur de la variabilité présumée du trait étudié dans la population visée par l’étude
- Plus chacune de ces considérations implique une évaluation élevée (précision, niveau, variabilité), plus la taille de l’échantillon doit augmenter
- On utilise généralement des logiciels pour nous guider (G*Power 3)
Que sont les échantillons probabilistes ou aléatoires?
- Fondés sur les probabilités
- Utilisent des estimateurs précis
- Se basent sur des modèles théoriques
- Exigent une base de sondage de toute la population
- Une liste exhaustive de tous les éléments de la population
Qu’est-ce que l’échantillonnage aléatoire simple?
- Réfère au cas particulier où chacune des unités de la population a une probabilité égale d’appartenir à l’échantillon
- Formellement: p = n/N
- La technique de base consiste à identifier chacun des éléments de la population et à en retenir un certain nombre (n) par un procédé de tirage au sort
- Enlève toute forme de biais
- Procédure issue d’un monde idéal (la façon la moins biaisée d’aller chercher des participants)
Qu’est-ce que l’échantillonnage aléatoire stratifié?
- Consiste à diviser la population en sous-populations (strates) en fonction de critères (ou variables de stratification) et à constituer par la suite un échantillon aléatoire pour chacune des strates
- Par exemple, on pourrait s’assurer d’avoir une représentation des différents groupes religieux pertinents d’une population si c’est important pour l’étude
- Permet un contrôle rehaussé comparé à l’échantillonnage aléatoire, particulièrement pour les
plus petits sous-groupes
- Permet un contrôle rehaussé comparé à l’échantillonnage aléatoire, particulièrement pour les
- Par exemple, on pourrait s’assurer d’avoir une représentation des différents groupes religieux pertinents d’une population si c’est important pour l’étude
–> Peut surreprésenter les catégories plus communes et sous-représenter celles qui sont moins communes
Est-ce qu’on choisit des strates proportionnelles ou égales?
- Si 90% d’une population a une valeur A selon un variable de catégorisation en strate, et l’autre 10% B…
- On met dans l’échantillon 9 fois plus de A que de B si on veut représenter fidèlement la population
- On met autant de A que de B si on veut comparer ces deux sous-groupes de manière équitable
Qu’est-ce que l’échantillonnage par grappes?
- Il existe des situations de recherche où il est soit très difficile d’identifier chaque élément d’une population, soit encore plus pratique de sélectionner non pas des individus mais des groupes d’individus
- Il est plus facile de sélectionner des classes entières d’élèves plutôt que des élèves répartis un peu partout dans une école ou dans plusieurs institutions scolaires
- Potentiel élevé d’effet de grappe sur représentativité
- Il est plus facile de sélectionner des classes entières d’élèves plutôt que des élèves répartis un peu partout dans une école ou dans plusieurs institutions scolaires
–> La classe choisie avait autant de probabilités d’être prise que les autres.
Quel est le problème de l’approche aléatoire?
- Ne se peut pas en pratique!
- Implique non seulement que nous disposions d’une base de sondage (liste) de taille N, mais encore que nous parvenions à rejoindre et à convaincre de participer à l’étude tous les participant-e-s sélectionné-e-s
- Les non-réponses ou les refus de participation affectent lourdement la valeur des estimés et, de fait, remettent en cause le caractère aléatoire d’un échantillon
- Le tirage au hasard va à l’encontre de l’éthique: une recherche ne peut être entreprise qu’avec des individus volontaires et consentants (sauf certaines exceptions)
- Généralement, les individus qui acceptent de participer présentent une configuration de caractéristiques qui les distinguent de ceux qui déclinent la même invitation.
Quel est le principe de base des échantillons non-probabilistes - empiriques?
- L’approche probabiliste est impossible, du moins en psychologie
- L’approche probabiliste plus appropriées pour agriculture et géologie, par exemple
- Consentement libre et éclairé des roches ou des épis de maïs?
- Il n’existe aucun moyen de déterminer la probabilité qu’a un élément de la population d’être inclus dans l’échantillon, voire même aucune certitude à l’effet que tous les éléments ont une chance quelconque, aussi minime soit-elle, d’en faire partie
- L’approche probabiliste plus appropriées pour agriculture et géologie, par exemple
- Principaux facteurs qui militent en faveur de l’utilisation d’échantillons non-probabilistes sont d’ordre éthique, économiques et pratiques
Qu’est-ce que l’échantillonnage accidentel?
- Il suffit de prendre les cas qui se présentent simplement à nous à un moment et à un endroit donnés, sans que cela n’ait quelque lien avec
l’objet d’enquête et ce, jusqu’à ce que nous ayons atteint le nombre de participants désiré - La sélection des unités d’observation s’effectue entièrement sur le terrain
- E.g., entrevues réalisées auprès des passants dans des centres commerciaux, auprès des clients se présentant à un centre de consultation quelconque, d’étudiants en pause à la cafétéria, ou encore d’usagers du transport en commun
Quels sont les problèmes liés à l’échantillonnage accidentel?
- Cette façon de procéder est risquée parce qu’elle prête flanc à des sources de biais importants
- Les gens qui ne fréquentent pas ces endroits n’ont aucune chance d’être choisis
- Ceux qui les fréquentent à l’occasion seulement ont peu de chances de l’être
- Ce qui n’est pas le cas de ceux qui s’y retrouvent régulièrement et qui ont ainsi de fortes chances de faire partie de l’échantillon
- Qu’est-ce qui fait que certaines personnes plutôt que d’autres ont plus de chance d’être là?
Quelle est la population cible de l’échantillon accidentel?
- La probabilité d’être choisi varie en effet d’un individu à un autre en fonction du jour, du moment ou de l’endroit précis où se déroulent les entrevues
- Le problème principal de ce type d’échantillons, c’est qu’ils ne représentent aucune population bien définie
- Il devient dès lors difficile de formuler une quelconque généralisation qui soit valable pour une population déterminée.
–> Pas de population cible clairement définie
Quelles sont les améliorations apportées à la méthode accidetelle?
- On peut contourner le problème de population cible en sélectionnant les participants de l’échantillon en fonction de renseignements pertinents (échantillonnage dirigé)
- E.g., se servir de certains renseignements pertinents, tels les endroits publiques que fréquentent habituellement les personnes anxieuses (par exemple), de même que des statistiques descriptives sur les jours et les heures de fréquentation
- E.g., entrevues en assumant une rotation des jours et des heures de la semaine
–> Informe sur où aller faire de l’échantillonnage
Qu’est-ce que l’échantillonnage de volontaires?
- Très utilisé en sciences sociales et humaines
- Consiste à faire appel à des volontaires pour former l’échantillon
- Annonces, listes de volontaires…
- Un problème associé est le fait de ne pas disposer de base de sondage (p. ex., liste des couples ayant des problèmes d’ordre conjugal, nouveaux parents, personnes ayant commis des meurtres non résolus…)
- Problème au niveau de la généralisation des résultats
- On ne peut jamais juger formellement jusqu’à quel point les personnes ayant accepté volontairement de participer à une étude possèdent les mêmes caractéristiques que celles ayant refusé de le faire ou n’ayant pas pris connaissance de l’étude
- De toutes les personnes n’ayant pas appelé, quelle proportion savait qu’une étude avait lieu?
–> Difficile de recruter des participants qui représentent bien la population cible
Qu’est-ce que l’échantillonnage aréolaire?
- Également appelé méthode des itinéraires forcés ou topographique, l’échantillonnage aréolaire s’effectue sur le terrain
- Instructions formelles quant à l’itinéraire à suivre, au choix des résidences à visiter ainsi qu’à une ou des caractéristiques que doivent présenter les personnes interrogées
- P. ex., consigne d’interroger la personne qui viendra lui ouvrir la porte ou la personne la plus âgée habitant le domicile ou encore un adulte qui vit en couple
- Instructions formelles quant à l’itinéraire à suivre, au choix des résidences à visiter ainsi qu’à une ou des caractéristiques que doivent présenter les personnes interrogées
Réservé à certains types particuliers de recherche (sondages par entrevue face à-face) où la population visée est relativement concentrée en même temps que très générale au plan des caractéristiques visées.