Cours 4: sélection de l'échantillon Flashcards
Recensement
- Opération statistique qui vise à présenter un portrait des caractéristiques de tous les individus de la population cible.
- Étudier tous les cas de la population
Échantillon
- Méthode statistique qui vise à évaluer les proportions de différentes caractéristiques d’une population à partir d’un sous-ensemble d’individus.
- Échantillonnage probabiliste
- Échantillonnage non-probabiliste
la population cible = pas population générale
La population cible est tributaire des intentions du chercheur ou de la chercheuse et de l’hypothèse. Cette relativité doit être considérée lorsqu’on aborde la généralisation et ses limites.
population cible
Ensemble d’individus qui partagent une ou plusieurs caractéristiques permettant de les regrouper sous une catégorie.
Les individus visés par l’hypothèse.
ÉCHANTILLON
Ensemble d’individus qu’on veut représentatif de la population cible.
Les individus visés pour l’expérience.
Un échantillon devrait constituer un modèle réduit de la population qu’il représente. Vrai ou faux ?
vrai
POPULATION VS ÉCHANTILLON: la validité externe
- Fait référence à la généralisation des résultats. Dans quelle mesure peut-on généraliser les résultats d’une étude à la population cible ainsi qu’à une autre population, dans un autre milieu ou à d’autres conditions?
- Concerne la valeur des résultats en dehors des conditions particulières de la recherche.
validité d’échantillonnage
- Caractéristiques de l’échantillon (degré de représentativité)
- Âge, sexe, éducation, sévérité, comorbidité
représentativité de l’échantillon
Afin d’être REPRÉSENTATIVES, les caractéristiques d’un échantillon doivent être très similaires aux caractéristiques de la population d’origine.
- L’échantillonnage est important pour la validité interne et externe de la recherche.
- Est-ce qu’un étudiant universitaire représente adéquatement la population de « jeunes adultes »?
validité interne
- Représente la capacité de la méthode à produire des conclusions précises à propos de l’effet de la VI sur la VD.
Échantillonnage aléatoire:
Sélection aléatoire des participants
→ Liée à la validité externe
Assignation aléatoire
Placement des participants dans les conditions expérimentales sur la base d’un processus aléatoire
→ Liée à la validité interne
paramètre
Valeur dans la population
Ex: Revenu annuel
Poids
# Traumas vécus en enfance
Vrai ou faux? Plus les paramètres (caractéristiques) de l’échantillon sont similaires à ceux de la population, plus il est représentatif de cette population.
vrai
Vrai ou faux ? Assurer un recrutement aléatoire augmente les chances que l’échantillon soit représentatif
Vrai
vrai ou faux ? Recruter un plus grand nombre de participants augmente les chances que l’échantillon soit représentatif.
Vrai
échantillonnage comme processus d’inférence
- Lorsqu’on examine un échantillon, les paramètres de la population cible sont souvent inférés et jamais connus.
- Alors on va les estimer à partir de l’échantillon
- On ne peut jamais être certain que l’échantillon est représentatif de la population.
- Il existe des techniques / principes qui permettent de faciliter la supposition de représentativité.
L’erreur d’estimation
différence entre la valeur d’une statistique d’échantillon et la valeur du paramètre de population.
→ Une certaine erreur est toujours présente dans l’échantillonnage
Lorsque l’échantillonnage est aléatoire, les erreurs sont aléatoires et ne sont pas systématiquement erronées.
Vrai ou faux ? Plus la taille de l’échantillon est élevée, moins grande est l’erreur d’estimation de la valeur que nous tentons d’examiner.
vrai
la taille de l’échantillon
La représentativité de l’échantillon dépend (entre autres) de sa taille, mais pas de la taille absolue de la population cible. Il ne s’agit pas de recruter un échantillon qui est composé de 10% (ou 50%) de la population.
- C’est la precision désirée et non la taille de la population qui determine la taille d’un echantillon. Ça va déprendre à quelle point on voit que nos résultats soient petit
- Pour une précision donnée de l’estimateur, la taille d’échantillon pour une population de 1M ou 4M est la même.
comment déterminer la taille de l’échantillon ?
Possible de définir, à l’avance, le nombre de participants nécessaires afin d’observer un effet (ou un paramètre) avec une précision et une probabilité suffisantes. Que faut-il?
Puissance statistique: Probabilité de détecter un effet s’il existe réellement.
Taille d’effet espérée: force de l’effet observé d’une variable sur une autre.
Puissance statistique
Probabilité de détecter un effet s’il existe réellement.
Taille d’effet espérée
force de l’effet observé d’une variable sur une autre.
taille d’effet espéré: la stratégie normalement utilisé
1) Examiner la taille d’effet dans les études antérieures.
Problème
Études souvent biaisées, biais de publication
Voir Anderson, Kelley, & Maxwell (Psychological Science, 2017)
2) Décider d’une taille d’effet significative (p.ex., cliniquement significative)
3) Arbitrairement (risque de sous-estimer ou sur-estimer)
Échantillonnage probabiliste
il faut avoir accès à tout la population
- Processus par lequel chaque membre de la population d’origine a une chance égale d’être sélectionnée.
- Pour réaliser un échantillonnage probabiliste, il faut avoir accès au répertoire complet de notre population
Aléatoire simple:
à partir de la banque complète des membres de notre population, on tire au hasard les individus qui composeront notre échantillon.
Exemple:
- Étudier la perception de la tricherie chez les étudiants de l’UQÀM
- À l’aide de la liste complète des étudiants de l’UQÀM, on tire au hasard 100 personnes qui seront sollicitées pour répondre à un questionnaire.
- Inconvénient: Très long (accès à toute la population cible)
- validité externe, car très représentatif
aléatoire systématique
à partir de la banque complète des membres de notre population, on sélectionne chaque nième individu après un départ aléatoire.
-Déterminer l’intervalle d’échantillonnage (K) en divisant le nombre membres de la population par la taille de l’échantillon que vous désirez obtenir.
- validité externe élevé
les échantillons probabiliste
-aléatoire simple
- aléatoire systématique
- stratifié
- en grappe
échantillonnage stratifié
on divise notre population en sous-catégories (strates) que l’on juge comme structurantes au sein de notre échantillon. On fixe un % de l’échantillon souhaité pour chacune des strates. Ensuite, on procède de façon aléatoire simple à l’intérieur de chacune des strates, tout en respectant les quotas de strate fixés.
échantillonnage en grappe
Identification de « groupes naturels » faisant partie de la population, puis sélection aléatoire d’un nombre de groupes. Tous les individus d’un groupe sélectionné sont sélectionnés.
Exemple:
▪ Un chercheur veut déterminer quels sports pratiquent les élèves de 5e année au Québec. ▪ On sélectionne au hasard 100 écoles de tout le Québec
▪ Chacune de ces 100 écoles = 1 grappe
▪ On sonde ensuite chaque élève de 5e année de chacune des 100 grappes (écoles).
▪ Les élèves inclus dans ces grappes représenteraient tous les élèves de 5e année au Québec.
vrai ou faux? Plus le nombre de grape est petit, plus de risque de biais! (moins représentatif)
vrai
échantillonnage non-probabiliste
Sélection des participants qui n’obéit pas au hasard.
- Processus qui ne permet pas de calculer la probabilité d’inclusion des
individus.
→ Présente des avantages au niveau des couts, de l’efficacité et de la faisabilité
type d’échantillonnage non-probabiliste
- accidentel
- Volontaire
- Boule de neige
- par quotas
- Choix raisonné
échantillonnage non-probabiliste : accidentel
Utilisation des individus disponibles selon les circonstances et le contexte. Exemple:
- Étudier la perception de la tricherie chez les étudiants de l’UQÀM
- Mercredi 22 mai à 12h30 à la cafétéria: vous distribuez votre questionnaire aux 100 premiers
universitaires croisés qui acceptent d’y répondre.
Inconvénient: Probabilité d’être choisi varie en fonction du jour, du moment ou de l’endroit choisi.
validité externe faible
échantillonnage non-probabiliste : volontaire
Les répondants prennent contact avec les chercheurs sur une base volontaire. Sollicitation indirecte.
Exemple:
- Votre échantillon est composé de participants ayant répondu à une annonce que vous avez affichée sur les babillards de l’UQAM.
Inconvénient: Les participants risquent d’être composées par des personnes qui sont intéressées au sujet de la recherche. - validité externe faible
échantillonnage non-probabiliste : boule de neige
avoir recours à des personnes de confiance au sein de la population (ou qui côtoie cette population) afin d’entrer en contact avec des participants potentiels.
Exemple:
- Vous voulez étudier la dépression chez les femmes victimes de violence.
- Vous contactez une intervenante travaillant dans une maison d’hébergement et lui demandé de distribuer votre questionnaire aux femmes qu’elle connaît.
échantillonnage non-probabiliste: par quotas
Des quotas sont déterminés pour des types d’individus, puis les quotas sont remplis par les premiers individus correspondant aux différents types.
Exemple:
* Une école de Montréal veut connaitre l’opinion des élèves du primaire au sujet de la qualité de leurs activités parascolaires. Elle décide d’interroger 100 des 1 000 élèves de l’école en utilisant comme sous- population les années d’études (c’est-à-dire 1e, 2e, 3e, 4e,5e et 6e année).
Des quotas sont déterminés pour des types d’individus, puis les quotas sont remplis par les premiers individus correspondant aux différents types.
Inconvénient:
* Échantillonnage pas faite au hasard.
* Certaines personnes peuvent n’avoir aucune chance d’être sélectionnées ou on risque de ne pas connaître leur chance de l’être.
* L’échantillon peut donc être biaisé.
échantillonnage non-probabiliste: choix raisonné
Le chercheur choisit délibérément ses sujets selon des caractéristiques particulières.
* Plus utilisé dans le cadre d’études préparatoires comme des tests préalables de questionnaires et des discussions en groupe.
Inconvénient: Subjectivité (dépend des idées préconçues du chercheur, qui peuvent être erronées)
- validité externe faible