Cours 2 - Échantillonage, variables, statistiques descriptives et graphiques Flashcards
Vrai ou Faux: Le contenu d’un échantillon est influencé par le hasard et les probabilités.
Vrai.
Qu’est-ce qu’un échantillon?
Fraction d’une population statistique sur laquelle des mesures (observations) sont effectuées dans le but d’estimer les propriétés de cette population.
Qu’est-ce qu’une unité d’échantillonage?
Le plus petit niveau sur lequel est effectué un échantillonnage.
Qu’est-ce qu’une population statistique?
Ensemble des éléments représentés par l’échantillonnage = la « vraie » population d’intérêt.
Qu’est-ce qu’un paramètre?
Mesure ou caractéristique calculée selon la population. Représentée par une lettre grècque (moyenne = μ).
Qu’est-ce qu’une statistique (estimateur)?
Mesure ou caractéristique calculée selon un échantillon. Représentée par une lettre standard (moyenne = X-)
Quelle est la différence entre la précision et l’exactitude?
Précision: l’erreur d’échantillonage.
Exactitude: Biais.
Qu’est-ce que l’échantillonage aléatoire simple?
Une méthode qui consiste à prélever au hasard (probabilité identique pour tous) et de façon indépendante(la probabilité d’être tirée ne dépend pas des autres) n individus d’une population qui en comprend N.
Que sont les étapes de l’échantillonage aléatoire simple?
- Créer une liste des individus de la population N et leur attribué un numéro.
- Décider de la quantité à échantilloner n.
- Utiliser un générateur de nombre aléatoires: n entiers entre 1 et N.
- Échantilloner les individus dont le numéro correspond aux nombres aléatoires générés.
Quel est la différence entre une variable qualitative et une variable quantitative?
Qualitative: ne peux pas être rapporté par un nombre - elle décrit une catégorie. Peut être placée sur plusieurs échelles (binomiale, nominale, ordinale, etc.(
Quantitative: Fournit une variable numérique sur une échelle de mesure. Inclut plusieurs sous-catégories (variable discrète (énumération), variable continue (nombres réels incluant des décimales), variable d’intervalle, variable de rapport, etc.)
Nommez les trois classes de variables pour les analyses statistiques.
Variable explicative, variable contrôlée, variable réponse.
Qu’est-ce qu’une distribution de fréquence?
Fréquence d’apparition des différentes valeurs dans les données.
Qu’est-ce qu’un effectif/taille d’échantillon?
Nombre total d’observation (n) ou nombre d’observations par classe ou catégorie (ni)
Qu’est-ce qu’un pourcentage (%)?
Fraction (fi) de l’effectif (n) qui appartient à la classe ou catégorie i (ni).
Qu’est-ce qu’une fréquence?
Désigne l’effectif OU le pourcentage (quand on parle de %, on parle de fréquence relative).
Nommez les deux façons de décrire la fréquence.
- Coefficient d’asymmétrie (skewness: négatif si vers les valeurs fortes, posifit si vers les valeurs faibles)
- Coefficient d’aplatissement (kurtosis: positif = pointu, négatif = aplatie)
Quelle est la formule pour la moyenne arithmétique? Que représente chaque variable?
X_ = 1/n sum(n, i-1)xi, où: X_ = moyenne arithmétique (la bar est sensé être par dessus le x) n = effectif
Qu’est-ce que la valeur médiane?
La valeur au centre d’une distribution.
Qu’est-ce que le mode d’une distribution de fréquence?
La valeur la plus fréquente d’une distribution.
Quelle est la formule pour la variance? Que représente chaque variable?
s^2 = (sum (xi - x_)^2) / n - 1, où: s^2 = Variance xi = valeur pour l'observation i x_ = moyenne (la bar est sensé être par dessus le x) n = taille de l'échantillon
Quelle est la formule pour l’écart-type? Que représente chaque variable?
s = (racine-carrée)s^2, où: s = l'écart-type s^2 = variance
Quelle est la formule pour le coéfficient de variation? Que représente chaque variable?
CV = (s / x_) x 100, où: CV = coéfficient de variation s = l'écart-type x_ = moyenne (la bar est sensé être par dessus le x)
Qu’est-ce qu’un quartile? Qu’est-ce que l’écart interquartile?
Quartile: division de la distribution en quatre partie égales (Q1 est le quartile inférieur, Q2 est le quartile médiane, Q3 est le quartile supérieur)
Écart interquartile: La différence entre Q1 et Q3.
Que sont les 4 principes de base pour un bon graphique?
- Montrer les données
- Représenter les grandeurs honnêtement
- Rendre les patrons facilement détectables
- Dessiner les éléments graphiques clair
Quel type de graphique devrait être utilisé quand on a deux variables numériques? Quand on a 2 variable qualitatives? Quand on a 1 variable quantitative et une variable qualitative?
2 variables numériques: Nuage de points, lignes (temps ou espace), cartes (espace)
2 variables qualitatives: Diagramme en bâton regroupés, Mosaïque
1 de chaque: Strip Chart, Box Plot, Histogramme/Fréquence cumulées multiples