L'échantillonnage Flashcards
Déterminer la taille nécessaire de l’échantillon = Difficile! Mais requiert trois considérations:
- _____________recherchée pour l’estimation
- Niveau de___________ choisi
- L’ordre de grandeur de la _________________présumée du trait étudié dans la population visée par
l’étude
- Précision recherchée pour l’estimation
- Niveau de confiance choisi (ou du risque d’erreur assumé)
- L’ordre de grandeur de la variabilité présumée du trait étudié dans la population visée par
l’étude
Échantillons probabilistes ou aléatoires (Procédure issue d’un monde idéal)
- Fondés sur les ________________: Utilisent des estimateurs précis
- Se basent sur des modèles ________
- Exigent une base de ___________ : Une liste exhaustive de tous les éléments de la population
les probabilités
théoriques
sondage
Réfère au cas particulier où chacune des unités de la population a une probabilité égale d’appartenir
à l’échantillon
La technique de base consiste à identifier chacun des éléments de la population et à en retenir un certain nombre (n) par un procédé de tirage au sort
a) Échantillonnage aléatoire simple
b) Échantillonnage aléatoire stratifié
c) Échantillonnage par grappes
Échantillonnage aléatoire simple
Enlève toute forme de biais
Consiste à diviser la population en sous populations en fonction de critères et à constituer par la suite un échantillon aléatoire pour chacune
a) Échantillonnage aléatoire simple
b) Échantillonnage aléatoire stratifié
c) Échantillonnage par grappes
Échantillonnage aléatoire stratifié
…Strates proportionnelles ou égales?
Si 90% d’une population a une valeur A selon une variable de catégorisation en strate, et l’autre 10% B… si on veut représenter fidèlement la population
…Dans l’échantillon
a) On met 9 fois plus de A que de B
b) On met autant de A que de B
On met dans l’échantillon 9 fois plus de A que de B (fidélité)
…Strates proportionnelles ou égales?
Si 90% d’une population a une valeur A selon une variable de catégorisation en strate, et l’autre 10% B… si on veut comparer ces deux sous-groupes de manière équitable
…Dans l’échantillon,
a) On met 9 fois plus de A que de B
b) On met autant de A que de B
➢ autant de A que de B = Équitable
9 fois plus de A que de B = fidèlement
sélectionner non pas des individus mais des groupes d’individus
a) Échantillonnage aléatoire simple
b) Échantillonnage aléatoire stratifié
c) Échantillonnage par grappes
grappes
Principaux facteurs qui militent en faveur de l’utilisation d’échantillons non-probabilistes sont d’ordre :
* É______________
* É________________
* P________________
- Éthique
- Économiques
- Pratiques
Il suffit de prendre les cas qui se présentent simplement à nous à un moment et à un endroit donné, sans que cela n’ait quelque lien avec l’objet d’enquête et ce, jusqu’à ce que nous ayons atteint le nombre de participants désiré.
a) L’échantillonnage accidentel
b) L’échantillonnage de volontaire
c) L’échantillonnage aréolaire
d) L’échantillonnage par quotas
L’échantillonnage accidentel
Risquée parce qu’elle prête flanc à des sources de biais importants
✓ Les gens qui ne fréquentent pas ces endroits n’ont aucune chance d’être choisis
✓ Ceux qui les fréquentent à l’occasion seulement ont peu de chances de l’être
✓ Ce qui n’est pas le cas de ceux qui s’y retrouvent régulièrement et qui ont ainsi de fortes chances de
faire partie de l’échantillon
a) L’échantillonnage accidentel
b) L’échantillonnage de volontaire
c) L’échantillonnage aréolaire
d) L’échantillonnage par quotas
L’échantillonnage accidentel
La probabilité d’être choisi varie d’un individu à un autre en fonction du jour, du moment ou de l’endroit précis où se déroulent les entrevues
a) L’échantillonnage accidentel
b) L’échantillonnage de volontaire
c) L’échantillonnage aréolaire
d) L’échantillonnage par quotas
L’échantillonnage accidentel
Le problème principal de ce type d’échantillons, c’est qu’ils ne représentent aucune population bien définie
L’échantillonnage accidentel
Il devient dès lors difficile de formuler une quelconque généralisation qui soit valable pour une population déterminée
a) L’échantillonnage accidentel
b) L’échantillonnage de volontaire
c) L’échantillonnage aréolaire
L’échantillonnage accidentel
Problèmes associés:
Le fait de ne pas disposer de base de sondage
Problème au niveau de la généralisation des résultats.
a) L’échantillonnage accidentel
b) L’échantillonnage de volontaire
c) L’échantillonnage aréolaire
d) L’échantillonnage par quotas
L’échantillonnage de volontaire
Également appelé méthode des itinéraires forcés ou topographique, l’échantillonnage s’effectue sur le terrain
Instructions formelles quant à l’itinéraire à suivre, au choix des résidences à visiter ainsi qu’à une
ou des caractéristiques que doivent présenter les personnes interrogées.
a) L’échantillonnage accidentel
b) L’échantillonnage de volontaire
c) L’échantillonnage aréolaire
d) L’échantillonnage par quotas
L’échantillonnage aréolaire
Réservé à certains types particuliers de recherche (sondages par entrevue face à-face) où la population visée est relativement concentrée en même temps que très générale au plan des
caractéristiques visées
a) L’échantillonnage accidentel
b) L’échantillonnage de volontaire
c) L’échantillonnage aréolaire
d) L’échantillonnage par quotas
L’échantillonnage aréolaire
S’apparente beaucoup à l’échantillonnage stratifié Pourrait être qualifié de stratifié accidentel
b) L’échantillonnage de volontaire
c) L’échantillonnage aréolaire
d) L’échantillonnage par quotas
L’échantillonnage par quotas
4 étapes
1. Subdivision de la population en sous-catégories ou choix d’une ou des variables de stratification
2. Collecte de statistiques relatives aux effectifs de chaque sous-groupe
3. Détermination des quotas à respecter
4. Sélection des participants
L’échantillonnage par quotas
Rejeter H0 quand elle est vraie
a) Erreur de type I (alpha)
b) Erreur de type II (beta)
Erreur de type I (alpha)
Peut avoir des conséquences :
✓ Informer inadéquatement les travaux subséquents
✓ Suggérer des traitements ou interventions inappropriés
a) Erreur de type I (alpha)
b) Erreur de type II (beta)
Erreur de type I (alpha)
Conserver H0 quand elle est fausse
a) Erreur de type I (alpha)
b) Erreur de type II (beta)
Erreur de type II (beta)
Peut avoir des conséquences;
✓ La recherche est mal informée
✓ Peut prévenir ou retarder des découvertes importantes
Difficile à quantifier, Mais peut être minimisée en augmentant la puissance statistique
a) Erreur de type I (alpha)
b) Erreur de type II (beta)
Erreur de type II (beta)
Probabilité qu’un test va trouver un vrai effet dans l’échantillon quand il y en a un dans la population
Puissance
La Puissance Peut être augmentée par
✓ Plus_______ échantillons
✓ Tests _______________ lorsque possibles
✓ Améliorer la ___________de la variable dépendante (Enlever une portion du bruit qui masque le signal)
✓ Ajouter / __________ des contrôles
✓ Plus gros échantillons
✓ Tests paramétriques
✓ Améliorer la précision de la variable dépendante (Enlever une portion du bruit qui masque le signal)
✓ Ajouter / améliorer des contrôles
La qualité d’une recherche dépend, en partie, de la qualité des _________obtenus (Importance des instruments)
scores
De nature qualitative, où chaque valeur est distincte sans rapport d’ordre ou de hiérarchie. Les chiffres utilisés pour représenter ces valeurs sont arbitraires. Il n’existe pas d’ordre particulier entre les niveaux de cette variable.
1) Nominale ou catégorielle
b) Ordinale
c) Intervalle
d) Rapports
Nominale
état civil, type de maladies, régions, métiers…
1) Nominale ou catégorielle
b) Ordinale
c) Intervalle
d) Rapports
Nominale
rang scolaire, classement final d’une épreuve sportive…
1) Nominale ou catégorielle
b) Ordinale
c) Intervalle
d) Rapports
Ordinale
indique la position relative d’un individu par rapport à un autre, sans tenir compte des écarts exacts entre les valeurs. Implique une notion de quantité où un rang inférieur suggère “plus” ou “moins” d’une caractéristique.
1) Nominale ou catégorielle
b) Ordinale
c) Intervalle
d) Rapports
Ordinale
Variable ou les nombres renvoient à une quantité précise de la caractéristique mesurée. Unité constante et linéaire.
Unité ordonnée : Un plus grand nombre implique «plus» de la caractéristique
Absence de 0 absolu
1) Nominale ou catégorielle
b) Ordinale
c) Intervalle
d) Rapports
Intervalle
utilise des nombres pour indiquer une quantité précise de la caractéristique mesurée. Les unités sont constantes et linéaires, ce qui signifie qu’un changement de 1 est uniforme sur toute l’échelle. Un nombre plus élevé indique toujours “plus” de la caractéristique, et l’échelle possède un 0 absolu représentant l’absence complète de la caractéristique.
1) Nominale ou catégorielle
b) Ordinale
c) Intervalle
d) Rapports
Rapports
Quelle affirmation est fausse concernant les échelles d’intervalle et les échelles de rapport
a) peuvent être discrètes ou continues
b) La différence principale réside dans le type de zéro
c) Seulement dans le cas d’échelle de rapport qi’il est possible d’additionner et de soustraire
c)
Dans les deux cas, il est possible d’additionner et de soustraire
Permet les opérations de multiplication et division (par exemple, 150 ms est deux fois plus rapide que 300 ms)
a) zéro absolu
b) zéro arbitraire
zéro absolu
Ne permet pas les opérations de multiplication et division: 70 de QI n’est pas la moitié de 140 de QI
a) zéro absolu
b) zéro arbitraire
b) zéro arbitraire
On peut mettre les échelles de mesure dans cet ordre:
1-
2-
3-
4-
Chacune a les propriétés de l’échelle précédente, plus un petit quelque chose de plus
1- nominale
2- ordinale
3- intervalle
4- rapports
Quel type de variables?
Genre :Femme, Homme, Non-binaire
Couleurs :Rouge, Bleu, Vert, Jaune
Types de fruits :Pomme, Orange,
Nationalités :Canadienne, Française,
État civil :Célibataire, Marié(e),
Catégories de véhicules :Voiture, Moto,
Type de logement :Appartement, Maison, Loft, Studio
Ces variables sont qualitatives et n’ont pas d’ordre particulier entre les différentes valeurs. Les nombres peuvent être utilisés pour représenter ces catégories, mais ils sont arbitraires
Nominale
Ces variables sont qualitatives et n’ont pas d’ordre particulier entre les différentes valeurs. Les nombres peuvent être utilisés pour représenter ces catégories, mais ils sont arbitraires
Nominale
Quel type de variables?
Niveau d’éducation :Primaire…
Degré de satisfaction : Neutre, Satisfait,
Classement sportif :1ère place, 2ème
Niveau de douleur :Aucune douleur, Légère douleur…
Niveau de compétence :Débutant, Intermédiaire…
Taille de vêtements :(S), (M), (L),
Rang professionnel :Stagiaire, Employé, Gestionnaire, Directeur.
ordinales
Variables qui représentent une progression ou un ordre entre les catégories, mais la distance entre les niveaux n’est pas nécessairement égale. Par exemple, le passage de « Satisfait » à « Très satisfait » n’est pas nécessairement équivalent au passage de « Insatisfait » à « Neutre ».
Les variables ordinales
Quels type de variable?
Scores de QI (Quotient Intellectuel) :
Années du calendrier
Heures de la journée
Échelles de notation pour des questionnaires psychologiques
mesures à intervalle
Distance égale entre les valeurs (les écarts sont constants).
Zéro arbitraire (le zéro ne représente pas l’absence totale de la caractéristique mesurée).
Possibilité d’effectuer des opérations d’addition et de soustraction, mais pas de multiplication ou de division (par exemple, on ne peut pas dire qu’une température de 20 °C est deux fois plus chaude que 10 °C).
intervalle
Quels types de variable
Poids :0 kg, 5 kg, 10 kg.
Une longueur
Durée/Temps écoulé : 0 seconde, 10
Revenu/Salaires : 0 $, 100 $, 200 $.
Âge: 0 an, 10 ans, 20 ans.
Vitesse : 0 km/h, 50 km/h, 100 km/h.
Fréquence cardiaque :
de rapport
Zéro absolu : Le zéro signifie une absence totale de la caractéristique mesurée.
Les différences entre les mesures sont équidistantes.
Opérations possibles : Addition, soustraction, multiplication et division (par exemple, 20 kg est deux fois plus lourd que 10 kg).
Échelle de rapport
Cette méthode consiste à recueillir des informations en posant directement des questions aux individus sur leurs attitudes, opinions, comportements ou états internes. C’est une approche simple et économique, particulièrement utile lorsqu’il est impossible d’observer directement ces caractéristiques. On se fie aux réponses subjectives des participants concernant leur satisfaction relationnelle, leurs opinions, leur santé ou leurs difficultés psychologiques
Le questionnaire
Nommez 2 Problèmes reliés à la mesure par questionnaire
Obtenir collaboration de chacun des participants choisis dans l’échantillon
✓ Compréhension des questions
✓ Capacité fournir l’information demandée
✓ Véracité des réponses
✓ Réticence à livrer informations personnelles ou (désirabilité sociale)
✓ Informations moins fiables que méthodes plus objectives où les participants n’ont pas à être leur propre témoin
Les propriétés métrologiques du questionnaire dépendent directement de la qualité de chacun des items
Il est relativement facile de constituer une banque initiale d’items à l’aide:
- D’une recension de la _____________
- D’entrevues avec des personnes de la population __________
- D’entrevues avec des __________
- D’une recension de la littérature sur le sujet
- D’entrevues avec des personnes de la population cible
- D’entrevues avec des experts dans le domaine de spécialisation
Les échelles de type Likert
a) les répondants éprouveraient des difficultés lorsque le nombre de choix de réponse dépasse _____
b) Il est préférable d’avoir ______ d’options de réponse que d’en avoir ____
c) faciliter la tâche du participant en jouant sur la ______des options de réponse au plan de la présentation
5
Comme règle générale, il est préférable d’avoir -moins- d’options de réponse que d’en avoir un -plus-
disposition
Les échelles de type Likert: permet la neutralité
a) Un nombre impair
b) Un nombre pair
Un nombre impair
Les échelles de type Likert: « force » à se compromettre
a) Un nombre impair
b) Un nombre pair
Un nombre pair
V ou F
Plus la précision souhaitée est grande, plus le niveau de confiance est élevé, et plus la variabilité est importante, plus l’échantillon doit être grand pour assurer des résultats valides et fiables.
v
Déterminer la taille nécessaire de l’échantillon pour une étude est complexe, mais repose sur trois facteurs essentiels :
correspond au niveau de détail souhaité pour les résultats. Une précision élevée nécessite généralement un échantillon plus grand. Par exemple, si l’on souhaite que les résultats varient de ±2 % au lieu de ±5 %, il faudra un échantillon plus large pour réduire l’incertitude.
a) Précision recherchée pour l’estimation
b) Le niveau de confiance choisi
c) Variabilité présumée du trait étudié
Précision recherchée pour l’estimation
Déterminer la taille nécessaire de l’échantillon pour une étude est complexe, mais repose sur trois facteurs essentiels :
Représente la probabilité que l’estimation tombe dans une certaine marge d’erreur. Un niveau de confiance élevé (par exemple, 95 % ou 99 %) implique une plus grande certitude, mais demande un échantillon plus large pour minimiser le risque d’erreur (par exemple, éviter une erreur de type I ou II).
a) Précision recherchée pour l’estimation
b) Le niveau de confiance choisi
c) Variabilité présumée du trait étudié
Niveau de confiance choisi (ou du risque d’erreur assumé)
Déterminer la taille nécessaire de l’échantillon pour une étude est complexe, mais repose sur trois facteurs essentiels :
décrit à quel point les valeurs du trait étudié sont dispersées dans la population. Une grande variabilité nécessite un échantillon plus grand pour obtenir une estimation fiable. Par exemple, si les réponses sont très diverses, il faudra plus de participants pour refléter cette diversité avec précision
a) Précision recherchée pour l’estimation
b) Le niveau de confiance choisi
c) Variabilité présumée du trait étudié
Variabilité présumée du trait étudié :