Cours 2: Échantillonnage, variables, statistiques descriptives et graphiques Flashcards
Qui-suis-je? « Fraction d’une population statistique sur laquelle des mesures (observations) sont effectuées dans le but d’estimer les propriétés de cette population.»
Échantillon
Qui-suis-je? «Plus petit niveau sur lequel est effectué l’échantillonnage. Par exemple un individu, une cellule à l’intérieur d’un individu, une famille, une école, etc»
unité d’échantillonnage
Qui-suis-je? « Mesure (ou caractéristique) calculée sur la population, souvent représentée par une lettre grecque (par exemple: moyenne = µ). »
paramètre statistique
Dans quel cas est-il nécessaire de prendre un échantillon?
lorsqu’on ne peut pas prendre des mesures sur l’ensemble d’une population.
Sélectionner le ou les énoncés qui est vrai :
a) Deux échantillons, même différents, ne proviennent pas nécessairement de deux populations différentes
b) Deux échantillons, même semblables, ne proviennent pas nécessairement de deux populations semblables.
c) toutes les réponses sont vraies
C) toutes ces réponses
Quels sont les intérêts principaux de l’échantillonnage?
- calculer des inférences (estimations) sur la population statistique à l’aide de tests d’hypothèses
- nombre limité d’observations
La qualité d’un échantillon se mesure selon deux caractéristiques, nomme-les
- erreur d’échantillonnage
2. le biais d’échantillonnage.
Qui-suis-je? «émerge de la variabilité des mesures et de l’effectif (taille) de l’échantillon et affecte la précision des estimations faites à partir de l’échantillon. »
erreur d’échantillonnage
Vrai ou faux : En général, plus l’échantillon est grand, plus l’erreur d’échantillonnage augmente (la précision diminue ).
faux : plus l’échantillon est grand, plus l’erreur d’échantillonnage diminue (la précision augmente).
Qui-suis-je? « écart systématique des estimations résultant d’une sélection inappropriée des individus formant notre échantillon par rapport à celle de la population et affecte l’exactitude (accuracy) des estimations.
Biais d’échantillonnage
Quel est le moyen le plus efficace pour minimiser les biais d’échantillonnage?
Échantillonnage aléatoire
Qui-suis-je? « méthode qui consiste à prélever au hasard et de façon indépendante »
Échantillonnage aléatoire
Comment obtenir un échantillon aléatoire en pratique ? (4 étapes)
- On crée une liste des individus de la population (N) et on leur attribuer un numéro allant de 1 à N
- On décide de la quantité à échantillonner n
comprise entre 1 et N - On utilise un générateur de nombres aléatoires pour n entiers compris entre 1 et N
- On échantillonne les individus dont le numéro correspond à un numéro qui a été généré aléatoirement.
Qui-suis-je? « propriété mesurable qui varie (le plus souvent) de manière naturelle.
Variable
Vrai ou faux : on ne peut mesurer qu’une variable à la fois par unité d’échantillonnage.
Faux : Il est important de noter que plus d’une variable peut être mesurée sur une unité d’échantillonnage.
Vrai ou faux : le type de variable n’a pas d’impact sur le traitement statistique des données
faux
Quelles sont les deux grandes classes de variables?
- Variable qualitative
- Variable quantitative
Qui-suis-je? « variables catégorielles, sont des variables ne pouvant pas être mesurées quantitativement »
Variables qualitatives
Quels sont les seuls calculs qu’on puisse faire avec des variables qualitatives?
Calculs impliquant le nombre d’éléments par catégorie et les différentes proportions parmi les catégories.
Les variables qualitatives peuvent être…(3)
- Binaire
- Nominale
- Ordinale
Classez les définitions suivantes avec le bon type de variables qualitatives (binaire, nominale ou ordinale)
A. Variables qualitatives offrant plusieurs possibilités ordonnées.
B. Variables qualitatives offrant deux possibilités.
C. Variables qualitatives offrant plusieurs possibilités non ordonnées.
A. Ordinale
B. Binaire
C. Nominale
Qui-suis-je? « variables numériques pouvant être mesurées et fournir une valeur numérique sur une échelle de mesure »
Variables quantitatives
Quels sont les deux types de variables quantitatives
- Discrète
- Continue
Qui-suis-je? « Variables quantitatives décrivant une série de nombres entiers. Par exemple, on pourrait vouloir mesurer le nombre de petits par portée d’un échantillon de taille n issue de la population de taille N»
Variable qualitative discrète
Qui-suis-je? « Variables quantitatives décrivant une série continue de nombres réels. Par exemple, on pourrait vouloir mesurer la taille, l’âge ou le poids d’un échantillon. »
Variables quantitatives continues
Vrai ou faux : il existe 2 sous-types de variables quantitatives continues.
Vrai, variable continue d’intervalle et variable continue de rapport
Quelles sont les différences entre les variables continues d’intervalles et celles de rapports?
Intervalles : valeurs continues pour lesquelles une différence d’une unité a la même signification tout au long de l’échelle de mesure, quelle que soit la valeur de référence. Le statut de la valeur nulle est arbitraire.
Rapports : Il s’agit de valeurs continues pour lesquelles le zéro de l’échelle de mesure n’est pas arbitraire et mesure bien un « rien » qui a un sens physique.
Vrai ou faux : lorsqu’on effectue une analyse statistique, il y a toujours une variable indépendante, une variable dépendante.
Vrai
Vrai ou faux : dans le cadre expérimental, il y a rarement des variables contrôle
Faux, il y a souvent des variables contrôles
Associez les définitions suivantes au bon terme (variable dépendante, indépendante ou contrôle)
A. Variable qui devraient rester constantes durant l’expérience et qui ne devrait pas influencer les résultats.
B. variable exogène que nous utiliserons pour expliquer la variabilité de la variable endogène.
C. variable endogène, c’est celle que l’on observera sur notre échantillon et dont on cherche à expliquer la variabilité grâce à nos analyses statistiques.
A. Variable contrôle
B. Variable indépendante
C. Variable dépendante
Qui-suis-je? « Nombre de mesures qui ont une valeur particulière (ou incluses dans un intervalle). »
Distribution de fréquence absolue
Qui-suis-je? « Proportion de mesures qui ont cette valeur (incluses dans l’intervalle). Les proportions sont bien sûr comprises entre 0 et 1 »
Distribution de fréquence relative
Qui-suis-je? « Proportion des mesures inférieures ou égales à la valeur considérée (l’intervalle). Dans ce cas-ci, les proportions croissent de façon monotonique (la suivante est toujours > à la précédente) de 0 à 1 »
Distribution de fréquence cumulée
Quels sont les principaux paramètres de tendance centrale en statistique?
- Moyenne
- Médiane
- Mode
Quels sont les principaux paramètres de dispersion en statistique?
- Variance
- Écart-type
Qui-suis-je? « somme de toutes les valeurs divisées par l’effectif n. »
Moyenne
Qui-suis-je? « indique à partir de quelle valeur nous avons 50% de valeurs plus petites et 50%
de valeurs plus grandes. »
Médiane
Qui-suis-je? « valeur d’une variable ayant la plus forte fréquence. »
Mode
Qui-suis-je? « la moyenne des carrés des écarts »
Variance d’échantillonnage
Qui-suis-je? « noté S, racine carrée de la variance. »
Écart-type
Vrai ou faux : la médiane semble fournir une vision plus “juste” parce qu’elle n’est pas influencée par les valeurs extrêmes.
Vrai
Qui-suis-je? « est l’écart type exprimé en pourcentage de la moyenne. »
Coefficient de variation (CV)
Vrai ou faux : Le coefficient de variation est très utile afin de comparer la dispersion entre des variables d’ordre de grandeur ou d’unités différentes.
vrai
L’analyse graphique devrait se faire de façon : (3)
- rapide
- précise
- efficace
Quels sont les 4 principes à respecter lorsqu’on présente des données sous forme de graphique?
- Montrer les données de façon pertinente
- Graduation fournissant des données de grandeurs honnêtes
- Patrons détectables (pas de données cachées, légende trop petites et RIEN en 3D)
- Graphiques clairs
Qui-suis-je ? « type de graphique utilisé pour obtenir des renseignements sur le type de distribution de fréquence d’une variable continue. »
Histogramme
Qui-suis-je ? « type de graphique utilisé pour les données qualitatives qui sont représentées par un nombre défini de catégories (peut être ordinale ou non ordinale) »
diagramme à bâtons
Qui-suis-je ? « type de graphique utilisé pour permettre d’illustrer l’association entre 2 variables qualitatives. »
tableau de contingence
Qui-suis-je ? « meilleure façon de représenter les données contenues dans un tableau de contingence »
diagramme mosaïque
Qui suis-je? « idéal pour montrer l’association entre 2 variables numériques (quantitatives). »
nuage de points
Qui suis-je? « montre la distribution de fréquence d’une variable quantitative ET l’association avec une variable qualitative. »
boxplot