Cours 2 - Échantillonage, variables, statistiques descriptives et graphiques Flashcards

1
Q

Vrai ou Faux: Le contenu d’un échantillon est influencé par le hasard et les probabilités.

A

Vrai.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est-ce qu’un échantillon?

A

Fraction d’une population statistique sur laquelle des mesures (observations) sont effectuées dans le but d’estimer les propriétés de cette population.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qu’est-ce qu’une unité d’échantillonage?

A

Le plus petit niveau sur lequel est effectué un échantillonnage.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’est-ce qu’une population statistique?

A

Ensemble des éléments représentés par l’échantillonnage = la « vraie » population d’intérêt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Qu’est-ce qu’un paramètre?

A

Mesure ou caractéristique calculée selon la population. Représentée par une lettre grècque (moyenne = μ).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qu’est-ce qu’une statistique (estimateur)?

A

Mesure ou caractéristique calculée selon un échantillon. Représentée par une lettre standard (moyenne = X-)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quelle est la différence entre la précision et l’exactitude?

A

Précision: l’erreur d’échantillonage.

Exactitude: Biais.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qu’est-ce que l’échantillonage aléatoire simple?

A

Une méthode qui consiste à prélever au hasard (probabilité identique pour tous) et de façon indépendante(la probabilité d’être tirée ne dépend pas des autres) n individus d’une population qui en comprend N.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Que sont les étapes de l’échantillonage aléatoire simple?

A
  1. Créer une liste des individus de la population N et leur attribué un numéro.
  2. Décider de la quantité à échantilloner n.
  3. Utiliser un générateur de nombre aléatoires: n entiers entre 1 et N.
  4. Échantilloner les individus dont le numéro correspond aux nombres aléatoires générés.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quel est la différence entre une variable qualitative et une variable quantitative?

A

Qualitative: ne peux pas être rapporté par un nombre - elle décrit une catégorie. Peut être placée sur plusieurs échelles (binomiale, nominale, ordinale, etc.(
Quantitative: Fournit une variable numérique sur une échelle de mesure. Inclut plusieurs sous-catégories (variable discrète (énumération), variable continue (nombres réels incluant des décimales), variable d’intervalle, variable de rapport, etc.)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Nommez les trois classes de variables pour les analyses statistiques.

A

Variable explicative, variable contrôlée, variable réponse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Qu’est-ce qu’une distribution de fréquence?

A

Fréquence d’apparition des différentes valeurs dans les données.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qu’est-ce qu’un effectif/taille d’échantillon?

A

Nombre total d’observation (n) ou nombre d’observations par classe ou catégorie (ni)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qu’est-ce qu’un pourcentage (%)?

A

Fraction (fi) de l’effectif (n) qui appartient à la classe ou catégorie i (ni).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est-ce qu’une fréquence?

A

Désigne l’effectif OU le pourcentage (quand on parle de %, on parle de fréquence relative).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Nommez les deux façons de décrire la fréquence.

A
  • Coefficient d’asymmétrie (skewness: négatif si vers les valeurs fortes, posifit si vers les valeurs faibles)
  • Coefficient d’aplatissement (kurtosis: positif = pointu, négatif = aplatie)
17
Q

Quelle est la formule pour la moyenne arithmétique? Que représente chaque variable?

A
X_ = 1/n sum(n, i-1)xi, où:
X_ = moyenne arithmétique (la bar est sensé être par dessus le x)
n = effectif
18
Q

Qu’est-ce que la valeur médiane?

A

La valeur au centre d’une distribution.

19
Q

Qu’est-ce que le mode d’une distribution de fréquence?

A

La valeur la plus fréquente d’une distribution.

20
Q

Quelle est la formule pour la variance? Que représente chaque variable?

A
s^2 = (sum (xi - x_)^2) / n - 1, où:
s^2 = Variance
xi = valeur pour l'observation i
x_ = moyenne (la bar est sensé être par dessus le x)
n = taille de l'échantillon
21
Q

Quelle est la formule pour l’écart-type? Que représente chaque variable?

A
s = (racine-carrée)s^2, où:
s = l'écart-type
s^2 = variance
22
Q

Quelle est la formule pour le coéfficient de variation? Que représente chaque variable?

A
CV = (s / x_) x 100, où:
CV = coéfficient de variation
s = l'écart-type
x_ = moyenne (la bar est sensé être par dessus le x)
23
Q

Qu’est-ce qu’un quartile? Qu’est-ce que l’écart interquartile?

A

Quartile: division de la distribution en quatre partie égales (Q1 est le quartile inférieur, Q2 est le quartile médiane, Q3 est le quartile supérieur)
Écart interquartile: La différence entre Q1 et Q3.

24
Q

Que sont les 4 principes de base pour un bon graphique?

A
  1. Montrer les données
  2. Représenter les grandeurs honnêtement
  3. Rendre les patrons facilement détectables
  4. Dessiner les éléments graphiques clair
25
Q

Quel type de graphique devrait être utilisé quand on a deux variables numériques? Quand on a 2 variable qualitatives? Quand on a 1 variable quantitative et une variable qualitative?

A

2 variables numériques: Nuage de points, lignes (temps ou espace), cartes (espace)
2 variables qualitatives: Diagramme en bâton regroupés, Mosaïque
1 de chaque: Strip Chart, Box Plot, Histogramme/Fréquence cumulées multiples