Stats bloc 1 Flashcards
Qu’est-ce que la méthode scientifique?
ensemble d’étapes permettant d’acquérir de nouvelles connaissances fiables et objectives
«elle peut être reproduite par quiconque pour arriver aux mêmes résultats
Quelles sont les étapes de la méthode scientifique?
- Identifier la problématique et préciser la question de recherche
- Hypothèse de recherche
- Opérationnaliser les concepts
- Choisir la technique d’observation/collecte et déterminer instruments de mesure
- Effectuer observations/ collecte (recueille données brutes)
- Traiter et organiser les données
- Analyser et interpréter les données
- Diffuser les résultats
Que comprend la 3e étape de la méthode scientifique, soit opérationnaliser les concepts?
Clarifier les termes utilisés dans l’hypothèse de recherche
Raffiner l’hypothèse en précisant le sens du lien présumé entre les variables
Quels symboles représentent la taille d’une population et d’un échantillon?
Taille de la population = N
Taille de l’échantillon = n
Quel symbole représente une variable statistique?
N’importe quelle lettre majuscule
Qu’est-ce qu’une modalité (valeur)?
Un état ou une valeur que peut prendre une variable
Les modalités sont les réponses possibles à un sondage ou un recensement (numérique ou non)
Quels sont les 4 types de variables?
Qualitative nominale. qualitative ordinale, quantitative discrète, quantitative continue
Quelles sont les 4 échelles de mesure?
et les calculs possibles
Échelle nominale (égalités)
Échelle ordinale (égalités et ordonnances) ex: tranches d’âge
Échelle d’intervalle (égalité, ordonnance, somme, différence) → zéro arbitraire ex: météo
Échelle de rapport (égalité, ordonnance, somme, différence, multiplication, division) → zéro = absence
Pourquoi est-il pertinent de faire un sondage plutôt qu’un recensement ? (6)
- Population est trop grande
- Une partie de la population est difficilement accessible
- Recensement est souvent trop long
- Trop coûteux
- Trop de recensement peut devenir un fardeau pour la population
- le méthode peut être destructrice
Quelles sont les 4 méthodes d’échantillonnage aléatoire?
- échantillonnage aléatoire simple
- échantillonnage systématique
- échantillonnage stratifié
- échantillonnage par grappes
Quelles sont les 4 méthodes d’échantillonnage non aléatoire?
- échantillonnage à l’aveuglette
- échantillonnage de volontaires
- échantillonnage par quotas
- échantillonnage au jugé
Quelles méthodes représentent mieux la population entre les méthodes probabilistes (aléatoires) ou les non probabilistes (non aléatoires)?
Les méthodes aléatoire ou probabilistes parce que les autres sont nécessairement un peu biaisées
Comment fonctionne la méthode d’échantillonnage aléatoire simple?
Quels sont les avantages et désavantages?
- avoir une liste de tous les individus de la population
- décider de n (taille de l’échantillon)
- Choisir n nombres entre 1 et N au hasard
- Constituer l’échantillon avec les individus portant les numéros choisis
ex: pige avec remise
Avantages:
- Simple
- Échantillon représentatif de la population
Désavantages:
- Il faut avoir une liste complète de toutes les unités statistiques de la population (à jour)
- Peut être long si c’est pas par ordinateur
Comment fonctionne la méthode d’échantillonnage systématique?
Quels sont les avantages et désavantages?
- Avoir la liste de tous les individus de la population numérotée de 1 à N
- Décider la taille de n
- Calculer le pas de sondage (N/n)
- Choisir au hasard un nombre de départ entre 1 et N
- Parcourir la population et sélectionner systématiquement l’échantillon
Avantages:
- Sélection d’un seul nombre aléatoire
- Rapide
- Bonne répartition de l’échantillonnage dans la base de sondage
Désavantages:
- Il faut avoir une liste complète de toutes les unités statistiques de la population (à jour)
- Fonctionne pas vraiment pour les phénomènes périodiques
Comment fonctionne la méthode d’échantillonnage stratifié?
Quels sont les avantages et désavantages?
- Avoir une liste de tous les individus
- Subdiviser la population en strates pertinentes
- Déterminer le proportion que chaque strate occupe dans la population
- Décider la taille de n
- Déterminer le nombre d’individus de chaque strates dans l’échantillon pour respecter les proportions
- Choisir les individus de chaque strate par échantillonnage aléatoire simple
Avantages:
- L’échantillon représente bien les caractéristiques de la population
Désavantages:
- Il faut connaître chacune des caractéristiques de la population
- Il peut être difficile de rejoindre les individus de certaines strates peu nombreuses
- Souvent très coûteux
Comment fonctionne la méthode d’échantillonnage par grappes?
Quels sont les avantages et désavantages?
- Subdiviser la population en grappes hétérogènes de tailles semblables
- Décider de la taille de n
- Déterminer le nombre de grappes qu’il faudra choisir
- Choisir ce nombre de grappe par échantillonnage aléatoire simple
Avantages:
- Réduit les déplacements et les coûts si la population est sur un grand territoire
Désavantages:
- Si les grappes son constituées d’unités statistiques homogènes, l’échantillon ne représentera pas bien la population
- Fonctionne juste si chaque groupe est aussi diversifié que la population
*Marche mieux pour des éléments pas reliés au milieux ex: les réflexes
Comment fonctionne la méthode d’échantillonnage à l’aveuglette?
Dans quel cas est-ce que c’est pertinent?
Dans quel cas est-ce que les résultats pourraient peut-être être généralisés à la population au complet?
Quand on sélectionne les individus de l’échantillon de façon arbitraire
ex: les gens qui passent à un coin de rue
Bon usage:
- Journalistes qui veulent avoir une idée des différentes opinions sur un sujet d’actualité
Désavantage:
Comme toutes les méthodes non-aléatoire, ça ne peut pas être généralisé à la population
En fait, peut être généralisé si la population est très très homogène
Comment fonctionne la méthode d’échantillonnage de volontaires?
Quand est-ce que cette méthode est pertinente?
Dans quel contexte est-ce que cette méthode est impertinente?
C’est quand on fait appel à des volontaires
Pertinent quand?
- La recherche nécessite beaucoup d’implication de la part des participants
- L’échantillon est très semblable à la population
ex: la réaction du corps à un médicament
Impertinent quand on veut l’avis des gens parce que l’échantillon va être constitué de gens avec juste des avis extrêmes (échantillon d’individus polarisés)
Comment fonctionne la méthode d’échantillonnage par quotas?
Quand est-ce que cette méthode est pertinente/ avantages?
Comme stratifiée, mais on sélectionne de façon non aléatoire les individus dans les strates
Pertinent quand/ avantages:
- Dans les enquêtes d’opinions et les études de marché
- rapide et peu coûteux
Ça peut marcher si les strates choisies sont celles qui ont une influence sur les résultats parce qu’on s’assure que tout le monde est représenté
Risque si la caractéristique des strates est trop différente est qu’on va avoir une homogénéité dans l’échantillon qui n’est pas dans la population
Comment fonctionne la méthode d’échantillonnage au jugé?
Quand est-ce que cette méthode est pertinente?
Dans quel contexte est-ce que cette méthode est impertinente?
Quand on sélectionne les individus d’un échantillon en se basant sur un certain jugement qu’on a au sujet de la composition de la population et en tentant de s’y conformer (strates selon ton jugement?)
DEMANDE L’AVIS D’UN EXPERT pour que ça représente à peu près la population
Pertinent:
- Dans le cadre d’une étude préparatoire comme tests préalables de questionnaires
- rapide et peu coûteux
Résultats valides seulement si la personne qui a constitué l’échantillon a une idée juste et non-biaisé de la population
Quelles sont les informations que l’on doit absolument retrouver dans le titre d’un tableau ou d’un graphique?
Mot clé (ex: distribution/répartition) Qui? (unité statistique, insinuer si échantillon ou population et taille de celui-ci) Où? SELON Quoi? (variable étudiée) Quand?
Que doit-on mettre en plus du titre et du graphique/tableau?
La source (en-bas)
Pour quelle variable est-ce que l’on ne fait jamais de colonne de pourcentage cumulé?
Qualitative nominale parce qu’il n’y a pas d’ordre
placée en ordre alphabétique dans tableau
Comment place-t-on les variables qualitatives nominales dans un tableau?
en ordre alphabétique
Dans quel cas est-ce qu’on fait des classes pour les tableaux?
Quand c’est une variable quantitative discrète et qu’il y a plus de 15 valeurs différentes
Quand c’est une variable quantitative continue
Comment établit-on des classes?
- Calculer l’étendue
- Nombre approximatif de classes selon la règle de Sturges (1 + 3,3log n)
- Largeur des classes (E/nbr de classes)
- Choisir borne inférieure de la première classe
- Construire des belles classes
*S’assurer que toutes les valeurs sont incluses
Combien de classes sont appropriées pour les tableaux?
entre 5 et 15 classes