L'échantillonnage Flashcards
Qui suis-je : Tous les membres, éléments, et individus à propos
desquels la recherche prétend dire quelque chose
Population
Qu’est-ce que la taille de la population ou de l’échantillon?
Le nombre de membres, éléments, ou individus
Comment est dénotée la taille de la population?
N
Qui suis-je? Tous les membres, éléments, et individus d’une population qui font partie d’une étude ou expérience
Échantillon
Comment est dénotée la taille de l’échantillon?
n
Quelle est la contrainte population/échantillon?
n < N
L’échantillon répond à un besoin conjoint. Lequel?
Économie et accessibilité
Qu’est-ce que permet l’échantillon? Dans quel but?
Permet d’observer une partie seulement d’un ensemble particulier dans le but de porter un jugement plus global ou de connaître l’ensemble dans son entier
Quel est l’inconvénient majeur de l’échantillon?
Risque de se tromper, de tirer une conclusion erronée au sujet d’un ensemble
Plus les éléments ______, plus l’erreur est ________
varient, probable
Qu’est-ce qui est au cœur de toutes les théories de l’échantillonnage?
La variation ou l’hétérogénéité des éléments constitutifs d’un ensemble
Si les éléments d’un ensemble ne variaient pas, on n’aurait pas à se poser de questions sur la _____ de notre échantillon
Qualité
Quand est-ce qu’on n’aurait pas à se poser de questions sur la qualité de notre échantillon?
Si les éléments d’un ensemble ne varient pas
Rappelez vous l’exercice de nombre préféré. Vos échantillons de taille n = 4 étaient, en moyenne, très près de la moyenne du groupe, mais certains des échantillons étaient très éloignés de la moyenne. Qu’est-ce que ça peut causer sur la moyenne?
Sous-estimation ou la surestimation
Comme les gens varient, on a besoin d’échantillons qui varient de façon similaire. Pourquoi?
Bien représenter la population
Une recherche scientifique vise toujours la ____1_____ de _____2_____ ou de _____3_____ qu’on veut valables pour un ensemble donné
1 formulation
2 conclusions
3 généralisations
L’échantillon constitue un facteur très important qui ___1_____ et ___2____ directement la ____3____ même des ___4_____ de l’étude
1 affecte
2 détermine
3 valeur
4 généralisations
Qui suis-je? Je consiste à recueillir les informations auprès de l’ensemble des éléments ou des individus concernés
Recensement
Qu’est-ce qu’on mesure lors d’un recensement?
N membres de la population
Quels sont les avantages du recensement?
Les paramètres calculés n’égal pas les inférences
Lors du recensement, les paramètres calculés n’égal pas les inférences. Pourquoi?
Puisque les informations proviennent de tous les éléments de la population
Quels sont les contraintes du recensement ?
L’identification préalable et la localisation de la totalité des éléments de la population = coût relativement élevé
Symbole du paramètre, et de la statistique?
μ et X̅
La décision de travailler avec un échantillon seulement plutôt qu’avec la totalité des cas visés par l’étude s’impose plus souvent qu’autrement.
Puisque les observations sont effectuées sur un échantillon et non sur la totalité de la population visée par l’étude, la recherche doit tolérer quoi?
Une incertitude permanente quant à la valeur exacte des conclusions de son étude
Statistique comme estimation de _________
Paramètre
Quels sont les avantages d’utiliser l’échantillon?
Économie de temps, d’argent et d’énergie
Qui suis-je ? Ensemble ou bassin d’individus auxquels on voudra, une fois le
travail complété, appliquer les résultats obtenus (taille N)
Population cible
Qui suis-je ?
Portion de la population cible qui est disponible à la recherche
Population accessible
Qui suis-je?
Ceux-celles qui peuvent se déplacer ou qu’on peut rejoindre
Population accessible
Qui suis-je? Taille nA, où n ≤ nA ≤ N (mais n < N).
Population accessible
Quel est la source de biais de représentativité #1?
Population accessible
Qu’est-ce qui explique que la population accessible est la source de biais de représentativité #1?
Car devrait pouvoir être un sous-ensemble aléatoire de la population cible
Qui suis-je?
Sous-ensemble de la population accessible qui participera à
l’expérience ou l’étude (taille n)
Échantillon
Quel est le biais de source de représentativité #2?
Échantillon
Qu’est-ce qui explique que l’échantillon est la source de biais de représentativité #2?
Devrait pouvoir être un sous-ensemble aléatoire de la population accessible
L’échantillon devrait constituer un modèle réduit de quoi?
La population qu’il représente
Qui suis-je? Je fais référence à une ou à des caractéristiques très précises et directement pertinentes pour ce que nous voulons étudier
Représentativité
Est-ce qu’un échantillon qui respecte les proportions d’hommes et de femmes observées dans une population particulière peut être jugé représentatif de cette dernière par rapport à une autre caractéristique moins, autant, ou plus importante?
Non
Le problème majeur des études faites à partir d’échantillons réside dans quoi?
L’estimation de certaines valeurs de la population (une moyenne, une corrélation, une variance, une différence de moyennes…) à partir d’informations recueillies sur une partie seulement de cette dernière
Le problème majeur des études faites à partir d’échantillons réside dans l’estimation de certaines valeurs de la population à partir d’informations recueillies sur une partie seulement de cette dernière.
Qu’est-ce qu’on cherche à faire?
Favoriser une estimation optimale de certains paramètres de la population à partir de statistiques calculées sur l’échantillon
Selon le théorème central limite, plus ____1______ est petit, plus _____2______ est grande
1 échantillon
2 erreur
Lorsque plusieurs variables non contrôlées interviennent et exercent un certain effet sur les résultats, quel principe permet de postuler que ces variables, souvent désignées comme des parasites, vont tendre à se contrebalancer à la longue?
Le principe du hasard
Lorsque plusieurs variables non contrôlées interviennent et exercent un certain effet sur les résultats, le principe de hasard permet de postuler que ces variables, souvent désignées comme des parasites, vont tendre quoi, à la longue?
Se contrebalancer
Lorsque nous désirons comparer des sous-groupes à l’intérieur d’un échantillon, la taille de ce dernier doit être suffisamment grande pour permettre un tel fractionnement tout en préservant quoi?
Une certaine représentativité de chacun des sous-groupes
Quelles sont les 3 considérations lorsqu’on cherche à savoir la taille nécessaire de l’échantillon?
1 Précision recherchée pour l’estimation
2 Niveau de confiance choisi (ou du risque d’erreur assumé)
3 L’ordre de grandeur de la variabilité présumée du trait étudié dans la population visée par l’étude
Lorsqu’on cherche à savoir la taille nécessaire de l’échantillon, si les considérations sont élevée, alors…
La taille de l’échantillon doit augmenter
Une évaluation élevée pour déterminer la taille nécessaire de l’échantillon comprend l’évaluation de quoi? (3)
Précision
Niveau
Variabilité
Les échantillons probabilistes ou aléatoires sont fondées sur quoi, et utilisent quoi?
Les probabilités
Des estimateurs précis
Les échantillons probabilistes ou aléatoires sont basés sur quels modèles?
Théorique
Quel est la base des échantillons probabilistes ou aléatoires?
Un sondage
Qui suis-je? Une liste exhaustive de tous les éléments de la population
Sondage
Qui suis-je ?
Réfère au cas particulier où chacune des unités de la population a une probabilité égale d’appartenir à l’échantillon
L’échantillonnage aléatoire simple
Quelle est la technique de base de l’échantillonnage aléatoire simple? (2)
Identifier chacun des éléments de la population
En retenir un certain nombre par un procédé de tirage au sort
Quelle est la procédure issue d’un monde idéal, et donc qui enlève toute forme de biais?
Échantillonnage aléatoire simple
Qui suis-je? Consiste à diviser la population en sous- populations (strates) en fonction de critères (ou variables de stratification) et à constituer par la suite un échantillon aléatoire pour chacune des strates
Échantillonnage aléatoire stratifié
Qu’est-ce que permet l’échantillonnage aléatoire stratifié, en comparaison à l’échantillonnage aléatoire?
Un contrôle rehaussé comparé, particulièrement pour les plus petits sous-groupes
Si 90% d’une population a une valeur A selon un variable de catégorisation en strate, et l’autre 10% B… Que fait-on, si on veut représenter fidèlement la population?
On met dans l’échantillon 9 fois plus de A que de B
Si 90% d’une population a une valeur A selon un variable de catégorisation en strate, et l’autre 10% B… Que fait-on, si on veut comparer 2 sous-groupes de manière équitable?
On met autant de A que de B
Si 90% d’une population a une valeur A selon un variable de catégorisation en strate, et l’autre 10% B… On met dans l’échantillon 9 fois plus de A que de B si on veut quoi?
Représenter fidèlement la population
Si 90% d’une population a une valeur A selon un variable de catégorisation en strate, et l’autre 10% B… On met autant de A que de B si on veut quoi?
Comparer ces deux sous-groupes de manière équitable
Il existe des situations de recherche où il est soit très difficile d’identifier chaque élément d’une population, soit encore plus pratique de sélectionner non pas des individus mais des groupes d’individus. Ainsi, on utilise quel type d’échantillonnage?
Par grappes
Potentiel élevé d’effet de grappe sur quoi?
La représentativité
Quel est le principal problème de l’approche aléatoire?
Ne peut se mettre en pratique
L’approche aléatoire implique non seulement que nous disposions d’une base de sondage (liste) de taille N, mais encore que nous parvenions à quoi?
À rejoindre et à convaincre de participer à l’étude tous les n participant-e-s sélectionné-e-s
Les non-réponses ou les refus de participation lors de l’approche aléatoire affectent lourdement quoi?
La valeur des estimé
Les non-réponses ou les refus de participation lors de l’approche aléatoire affectent lourdement la valeur des estimé, et donc remettent en cause quoi?
Le caractère aléatoire d’un échantillon
Le tirage au hasard va à l’encontre de quoi, et pourquoi?
De l’éthique : une recherche ne peut être entreprise qu’avec des individus volontaires et consentants (sauf certaines exceptions)
Généralement, les individus qui acceptent de participer présentent une ___1____ de ______2_____ qui les ______3______ de ceux qui déclinent la même invitation
1 configuration
2 caractéristiques
3 distinguent
L’approche probabiliste est impossible, du moins en psychologie. Dans quel domaine elle est plus appropriés, et pourquoi?
L’approche probabiliste plus appropriées pour agriculture et géologie, par exemple, car pas de consentement libre et éclairé des roches ou des épis de maïs.
Dans l’approche probabiliste, il n’existe aucun moyen de déterminer la ____1____ qu’a un élément de la population d’être ___2____ dans l’échantillon, voir même aucune ____3___ à l’effet que tous les éléments ont une ____4____ quelconque, aussi minime soit-elle, d’en faire partie.
1 probabilité
2 inclus
3 certitude
4 chance
Les principaux facteurs qui militent en faveur de l’utilisation d’échantillons non-probabilistes sont de quelle ordre?
Éthique, économique, pratique
Qui suis-je? Il suffit de prendre les cas qui se présentent simplement à nous à un moment et à un endroit donnés, sans que cela n’ait quelque lien avec l’objet d’enquête et ce, jusqu’à ce que nous ayons atteint le nombre de participants désiré
Échantillonnage accidentel
Dans l’échantillonnage accidentel, la sélection des unités d’observation s’effectue où?
Sur le terrain
De quel type d’échantillonnage il s’agit? Entrevues réalisées auprès des passants dans des centres commerciaux, auprès des clients se présentant à un centre de consultation quelconque, d’étudiants en pause à la cafétéria, ou encore d’usagers du transport en commun
Échantillonnage accidentel
Pourquoi l’échantillonnage accidentel est risqué?
Parce qu’elle prête flanc à des sources de biais importants
Quels sont les principaux biais présentés dans l’échantillonnage accidentel?
Les gens qui ne fréquentent pas ces endroits n’ont aucune chance d’être choisis
Ceux qui les fréquentent à l’occasion seulement ont peu de chances de l’être
Ce qui n’est pas le cas de ceux qui s’y retrouvent régulièrement et qui ont ainsi de fortes chances de faire partie de l’échantillon
Dans l’échantillonnage accidentel, la probabilité d’être choisi varie en effet d’un individu à un autre en fonction de quoi?
Du jour, du moment ou de l’endroit précis où se déroulent les entrevues
Le problème principal de l’échantillon accidentel, c’est quoi?
Ils ne représentent aucune population bien définie
Puisque l’échantillon accidentel ne représente aucune population bien définie, il devient difficile de quoi?
Formuler une quelconque généralisation qui soit valable pour une population déterminée
Dans la méthode accidentelle, on peut contourner le problème de population cible en faisant quoi?
En sélectionnant les participants de l’échantillon en fonction de renseignements pertinents
Le fait de sélectionner les participants de la méthode accidentelle, en fonction de renseignements pertinents, représente quel type d’échantillonnage?
Échantillonnage dirigé
À quel type d’échantillonnage je fais référence ?
Se servir de certains renseignements pertinents, tels les endroits publiques que fréquentent habituellement les personnes anxieuses (par exemple), de même que des statistiques descriptives sur les jours et les heures de fréquentation
Échantillonnage dirigé
À quel type d’échantillonnage je fais référence ? Entrevues en assumant une rotation des jours et des heures de la semaine
Échantillonnage dirigé
Quel type d’échantillonnage est très utilisé en sciences sociales et humaines
Échantillonnage de volontaires
Échantillonnage de volontaires consiste en quoi?
Faire appel à des volontaires pour former l’échantillon
Quel est le problème de l’échantillonnage de volontaire?
Le fait de ne pas disposer de base de sondage
(p. ex., liste des couples ayant des problèmes d’ordre conjugal, nouveaux parents, personnes ayant commis des meurtres non résolus…)
Dans l’échantillonnage de volontaire, le fait de ne pas disposer de base de sondage aura quels impacts ?
Problème au niveau de la généralisation des résultats
On ne peut jamais juger formellement jusqu’à quel point les personnes ayant accepté volontairement de participer à une étude possèdent les mêmes caractéristiques que celles ayant refusé de le faire ou n’ayant pas pris connaissance de l’étude
(De toutes les personnes n’ayant pas appelé, quelle proportion savait qu’une étude avait lieu?)
Quelle méthode est également appelé méthode des itinéraires forcés ou topographique
Échantillonnage aréolaire
Où s’effectue l’échantillonnage aréolaire?
Sur le terrain
À quoi je fais référence? Instructions formelles quant à l’itinéraire à suivre, au choix des résidences à visiter ainsi qu’à une ou des caractéristiques que doivent présenter les personnes interrogées
P. ex., consigne d’interroger la personne qui viendra lui ouvrir la porte ou la personne la plus âgée habitant le domicile ou encore un adulte qui vit en couple
Échantillonnage aréolaire
L’échantillonnage aréolaire est réservé à certains types particuliers de recherche (sondages par entrevue face- à-face) où la population visée est comment?
Relativement concentrée en même temps que très générale au plan des caractéristiques visées
Quel type d’échantillonnage s’apparente beaucoup à l’échantillonnage stratifié, et comment pourrait-il être qualifié?
L’échantillonnage par quotas
Qualifié de stratifié accidentel
À quoi je fais référence?
Volonté de garantir l’inclusion de divers éléments de la population et la fixation de quotas à respecter lors de la sélection de participants
L’échantillonnage par quotas
Quelles sont les 4 étapes de l’échantillonnage par quotas?
1 Subdivision de la population en sous-catégories ou choix d’une ou des variables de stratification
2 Collecte de statistiques relatives aux effectifs de chaque sous-groupe
3 Détermination des quotas à respecter
4 Sélection des participants
Qu’est-ce qu’une erreur de type I?
Rejeter H0 si H0 est vraie (faux positif)
Quelle est la probabilité de l’erreur de type I?
alpha (0,05)
Quelles sont les 2 principales conséquences des erreur de type I
Informer inadéquatement les travaux subséquents
Suggérer des traitements ou interventions inappropriés
Qu’est-ce qu’une erreur de type II?
Conserver H0 quand elle est fausse (faux négatif)
Quelles sont les 2 principales conséquences des erreur de type II?
La recherche est mal informée
Peut prévenir ou retarder des découvertes importantes
Quelles sont les 2 principales conséquences des erreur de type II?
La recherche est mal informée
Peut prévenir ou retarder des découvertes importantes
Quelle est la probabilité de l’erreur de type II, et ses caractéristiques?
Probabilité symbolisée par bêta
Difficile à quantifier
Mais peut être minimisée en augmentant la puissance statistique
Comment est définie la puissance, en symbole et en mot.
1-B
La probabilité d’erreur de type II
Puissance est donc la probabilité qu’un test va trouver quoi?
Un vrai effet dans l’échantillon quand il y en a un dans la population et donc, rejeter correctement H0
La puissance peut être augmenter par quoi?
Plus gros échantillons
Tests paramétriques lorsque possibles
Améliorer la précision de la variable dépendante (Enlever une portion du bruit qui masque le signal)
Ajouter / améliorer des contrôles
Est-il éthique de procéder à une étude ou expérience, même si on sait (ou doute) que la puissance statistique est insuffisante? Pourquoi?
Non
Abus des participants et des supporteurs de la recherche (institution, conseils de recherche, etc)