Cours 10.1 : Échantillonnage Flashcards
Q’est-ce qu’une population ?
La recherche prétend dire qq’chose à propos des membres/éléments.
Taille de la population (nb de membres/éléments) = N
Qu’est-ce qu’un échantillon ?
Les membres/éléments d’une population qui font partie d’une étude/expérience
Taille de l’échantillon (nb de membres/éléments) = n
Y’a-t-il une contrainte entre la population et l’échantillon ?
n < N
Qu’est-ce que permet ‘échantillonnage ? (2)
Permet d’observer une partie d’un ensemble dans le pour :
- Porter un jugement global
- Connaître l’ensemble dans son entier
Quel est l’avantages et l’inconvénient de l’échantillonnage ?
Avantage : Répond à un besoin d’accessibilité et d’économie d’énergie, de temps et $$
Inconvénient : Risque de se tromper (tirer une conclusion erronée)
- Incertitude vs la valeur exacte des conclusions
___________, plus l’erreur est probable
Complète la phrase.
Plus les éléments varient, plus l’erreur est probable
Qu’est-ce que la variabilité ?
Qu’est-ce qui est substantielle ?
La variation/hétérogénéité des éléments dans les théories de l’échantillonnage
La sous-estimant ou la surestimant substantiellement
Selon la représentativité, est-ce que l’ensemble doit varier ? (2)
Si les éléments d’un ensemble ne varie pas = pas de questions sur la qualité de l’échantillon
- Les gens varient = l’échantillon doit varier de manière similaire pour représenter la population
Qu’est-ce que vise une recherche scientifique ?
L’échantillon détermine quoi ?
Une recherche scientifique vise une conclusion/généralisation pour l’ensemble
L’échantillon détermine la valeur des généralisations de l’étude
- L’échantillon = raccourci
Qu’est-ce que recenser ?
Qu’est-ce qu’on mesure ?
Recensement = recueillir les infos. auprès de l’ensemble
- On mesure les N de la population
Quel est l’avantage et la contrainte du recensement ?
Avantages : Paramètres calculés ≠ inférences
- Info. proviennent des éléments de la population
Contraintes : identification/localisation des éléments de la population = coût élevé
Quel est le symbole d’un paramètre et d’une statistique ?
μ = paramètre
X̄ = statistique
À quoi ressemble le diagramme de Venn des population ?
-Population cible
— Population accessible
—— Échantillon
Qu’est-ce qu’une population cible ?
Quelle est la taille ?
= L’ensemble qu’on veut appliquer les résultats une fois le travail complété
Taille N
Qu’est-ce qu’une population accessible ?
Quelle est la taille ?
Quelle source retrouve-t-on ? Qu’es-ce que c’est ?
= Portion de la population cible qui est disponible à la recherche
- Ceux qui peuvent se déplacer/qu’on peut rejoindre
Taille nA
- Où n ≤ nA ≤ N (mais n < N)
Source de biais de représentativité #1
= Sous-ensemble aléatoire de la population cible
Qu’est-ce qu’un échantillon ?
Quelle source retrouve-t-on ? Qu’es-ce que c’est ?
= Sous-ensemble de la population accessible qui participe à l’étude
Taille n
Source de biais de représentativité #2
= Sous-ensemble aléatoire de la population accessible
Qu’est-ce que la représentativité ?
= Une/des caractéristiques précises/pertinentes pour ce que nous voulons étudier
Selon la représentativité, l’échantillon doit représenter un modèle de quoi ?
Si une caractéristique est respectée, toutes les autres aussi ?
L’échantillon doit être un modèle réduit de la population qu’il représente
Si l’échantillon respecte les proportions hommes/femmes d’une population ≠ représentatif pour d’autres caractéristiques
Quelle est la règle générale du Théorème Central Limite ?
Plus l’échantillon est petit, plus l’erreur est grande en moyenne
Selon l’utilité d’un grand échantillon :
Que ce passe-t-il lorsque des variables non contrôlées exercent un effet ?
Que doit-on avoir si on désir comparer des sous-groupes dans l’échantillon ? Exemple.
Lorsque des variables non contrôlées exercent un effet sur les résultats = le hasard permet que ces variables (parasites) vont se contrebalancer à la longue
Lorsque nous désirons comparer des sous-groupes dans l’échantillon = la taille doit être assez grande pour permettre un fractionnement en préservant une représentativité des sous-groupes
- Ex : Échantillon taille n = 30 = comparer 15 hommes à 15 femmes si leurs nombres sont égaux
Quelles sont les 3 considérations pour déterminer la taille de l’échantillon ?
Que voit-on si les considérations demandent un niveau élevé ?
On le calcule avec quoi ?
Considérations :
1. Précision recherchée pour l’estimation
2. Niveau de confiance choisi (risque d’erreur assumé)
3. L’ordre de grandeur de la variabilité présumée du trait étudié dans la population visée par l’étude
Plus les considérations demandent une évaluation élevée (précision, niveau, variabilité) = plus la taille de l’échantillon doit augmenter
- Calcule avec G-Power
Quels sont les 2 types d’échantillons ?
- Probabilistes - aléatoires
- Non-probabilistes - empiriques
Échantillons probabilistes ou aléatoires a 4 caractéristiques, quelles sont-elles ?
- Fondés sur les probabilités
- Utilisent des estimateurs précis
- Se basent sur des modèles théoriques
- Exigent une base de sondage (liste exhaustive des éléments de la population)
Quels sont les 3 types d’échantillons probabilistes ou aléatoires ?
- Échantillonnage aléatoire simple
- Échantillonnage aléatoire stratifié
- Échantillonnage par grappes
Qu’est-ce que l’échantillonnage aléatoire simple ?
Quelle est la technique de bas ?
= Les unités de la population a une probabilité égale d’appartenir à l’échantillon
La technique de base = identifier les éléments de la population et retenir un nombre (n) avec un tirage au sort
- Enlève toute forme de biais
Qu’est-ce que l’échantillonnage aléatoire stratifié ?
Qu’est-ce qu’il permet ?
= Diviser la population en sous- populations (strates) en fonction de critères (variables de stratification) et à faire un échantillon aléatoire pour chacune des strates
Permet un contrôle rehaussé vs l’échantillonnage aléatoire
- ++ pour les plus petits sous-groupes
Selon un variable de catégorisation en strate, que doit-on faire pour représenter la population ou des sous-groupes ?
Selon un variable de catégorisation en strate :
90% d’une population = A
10% de cette population = B
Représenter fidèlement la population = On met dans l’échantillon 9 fois plus de A que de B
Comparer équitablement les deux sous-groupes = On met autant de A que de B
Qu’est-ce que l’échantillonnage par grappes ?
Est-ce qu’il y a un effet sur la représentativité ?
= Sélectionner non pas des individus mais des groupes d’individus
- Ex : Sélectionner une classe vs des élèves
Potentiel élevé d’effet de grappe sur représentativité
Quels sont les 6 inconvénient de l’approche aléatoire ?
- Ne se peut pas en pratique
- Avoir une base de sondage (liste) de taille N
- Rejoindre et convaincre les n de participer à l’étude
- Les non-réponses/refus de participation affectent la valeur des estimés et remettent en cause l’aléatoire de l’échantillon
- Le tirage au hasard va à l’encontre de l’éthique : une recherche ne peut être entreprise qu’avec des individus volontaires et consentants
- Les individus qui acceptent ont une des caractéristiques qui les distinguent de ceux qui refusent
Est-ce que l’échantillon non-probabilistes ou empiriques est utilisée en psychologie ?
Quels sont les facteurs qui militent pour son utilisation ?
Impossible en psychologie
- Pas de moyen de déterminer la probabilité si un élément de la population est inclus dans l’échantillon
Principaux facteurs : d’ordre éthique, économiques et pratiques
Comment se déroule l’échantillonnage accidentel ?
Où cela se déroule ?
Prendre les cas qui se présentent à nous à un moment et à un endroit donnés
- Sans qu’il ait un lien avec l’enquête
- Jusqu’à avoir atteint le nombre de participants désiré
Sur le terrain
Ex : entrevues réalisées auprès des passants dans des centres commerciaux
Quels sont les problèmes avec l’échantillonnage accidentel ? (2)
- Ne représentent aucune population définie
- Ne peut pas généraliser les résultats à une population - Sources de biais
- Les gens qui ne fréquentent pas ces endroits n’ont aucune chance d’être choisis
- Ceux qui les fréquentent à l’occasion seulement ont peu de chances de l’être
- Ceux qui s’y retrouvent régulièrement ont de fortes chances de faire partie de l’échantillon
Comment améliore-t-on la méthode accidentelle ?
Avec un échantillonnage dirigé : sélectionner les participants de l’échantillon en fonction de renseignements pertinents
Qu’est-ce que l’échantillonnage volontaire ?
= Faire appel à des volontaires pour former l’échantillon
- Très utilisée
Quels sont les problèmes de l’échantillonnage de volontaires ? (2)
- Pas disposer de base de sondage
- Problème de généralisation des résultats :
Les personnes ayant accepté volontairement de participer ≠ mêmes caractéristiques que ceux ayant refusé OU pas pris connaissance de l’étude
Où s’effectue l’échantillonnage aréolaire (méthode des itinéraires forcés ou topographique) ?
Les instructions concernent quoi ?
Cette méthode est récervée à quel type de recherche ?
Sur le terrain
Instructions à :
- L’itinéraire à suivre, au choix des résidences à visiter ainsi qu’à une/des caractéristiques que doivent présenter les personnes interrogées
Réservé à des types de recherche (sondages par entrevue face- à-face) où la population est concentrée et générale vs les caractéristiques
À quoi s’apparente l’échantillonnage par quotas ?
Elle garantie et fixe quoi ?
S’apparente à l’échantillonnage stratifié
- Qualifié de stratifié accidentel
- Garantir l’inclusion des éléments de la population
- Fixation de quotas à respecter lors de la sélection de participants
Quels sont les 4 étapes de l’échantillonnage par quotas ?
- Subdivision de la population en sous-catégories ou choix d’une ou des variables de stratification
- Collecte de statistiques relatives aux effectifs de chaque sous-groupe
- Détermination des quotas à respecter
- Sélection des participants
Résumé : Quels sont les 9 types d’échantillonnages ?
Échantillonnage probabiliste ou aléatoire
- Échantillonnage aléatoire simple
- Échantillonnage aléatoire stratifié
- Échantillonnage par grappe
Échantillon non-probabiliste empique
- Échantillonnage accidentel
- Échantillonnage de volontaire
- Échantillonnage aléatoire
- Échantillonnage par quotas
Quelles sont les erreurs associées aux tests d’hypothèse ?
Rejeter H0 + H0 vraie = Erreur Type I
Rejeter H0 + H0 fausse = Correct
Garder H0 + H0 vraie = Correct
Garder H0 + H0 fausse = Erreur Type II
Quelle est la probabilité de l’erreur de Type I ?
Quelles sont les 2 conséquences ?
Rejeter H0 quand vraie (faux positif)
Probabilité alpha (0.05)
Conséquences :
- Informer inadéquatement les travaux
- Suggérer des tx ou interventions inappropriés
Quelle est la probabilité de l’erreur de Type II et est-elle facile à quantifier ?
Quelles sont les 2 conséquences ?
Conserver H0 quand fausse (faux négatif)
Probabilité : b
- Difficile à quantifier
- Minimisée en augmentant la puissance statistique
Conséquences :
- Recherche mal informée
- Prévenir/retarder des découvertes
Qu’est-ce que la puissance ?
Comment la puissance est définie ?
Comment l’augmenter ? (4)
Puissance = probabilité qu’un test va trouver un vrai effet dans l’échantillon quand il y en a un dans la population
- Rejeter correctement H0
Définie : b (probabilité d’erreur de Type II)
Peut être augmentée :
- Plus gros échantillons
- Tests paramétriques
- Améliorer précision de la variable dépendante (enlever du bruit qui masque)
- Ajouter/améliorer des contrôles
Il n’est pas éthique de procéder à une étude/expérience quand on doute de quoi ?
Quels sont les 2 abus ?
Pas éthique de procéder à une étude/expérience quand on doute que la puissance statistique est insuffisante
Abus :
- des participants
- des supporteurs de la recherche (institution, conseils de recherche, etc)