Cours 2: Échantillonnage, variables, statistiques descriptives et graphiques Flashcards

You may prefer our related Brainscape-certified flashcards:
1
Q

Qui-suis-je? « Fraction d’une population statistique sur laquelle des mesures (observations) sont effectuées dans le but d’estimer les propriétés de cette population.»

A

Échantillon

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qui-suis-je? «Plus petit niveau sur lequel est effectué l’échantillonnage. Par exemple un individu, une cellule à l’intérieur d’un individu, une famille, une école, etc»

A

unité d’échantillonnage

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qui-suis-je? « Mesure (ou caractéristique) calculée sur la population, souvent représentée par une lettre grecque (par exemple: moyenne = µ). »

A

paramètre statistique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Dans quel cas est-il nécessaire de prendre un échantillon?

A

lorsqu’on ne peut pas prendre des mesures sur l’ensemble d’une population.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Sélectionner le ou les énoncés qui est vrai :

a) Deux échantillons, même différents, ne proviennent pas nécessairement de deux populations différentes
b) Deux échantillons, même semblables, ne proviennent pas nécessairement de deux populations semblables.
c) toutes les réponses sont vraies

A

C) toutes ces réponses

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quels sont les intérêts principaux de l’échantillonnage?

A
  • calculer des inférences (estimations) sur la population statistique à l’aide de tests d’hypothèses
  • nombre limité d’observations
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

La qualité d’un échantillon se mesure selon deux caractéristiques, nomme-les

A
  1. erreur d’échantillonnage

2. le biais d’échantillonnage.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qui-suis-je? «émerge de la variabilité des mesures et de l’effectif (taille) de l’échantillon et affecte la précision des estimations faites à partir de l’échantillon. »

A

erreur d’échantillonnage

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Vrai ou faux : En général, plus l’échantillon est grand, plus l’erreur d’échantillonnage augmente (la précision diminue ).

A

faux : plus l’échantillon est grand, plus l’erreur d’échantillonnage diminue (la précision augmente).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Qui-suis-je? « écart systématique des estimations résultant d’une sélection inappropriée des individus formant notre échantillon par rapport à celle de la population et affecte l’exactitude (accuracy) des estimations.

A

Biais d’échantillonnage

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quel est le moyen le plus efficace pour minimiser les biais d’échantillonnage?

A

Échantillonnage aléatoire

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Qui-suis-je? « méthode qui consiste à prélever au hasard et de façon indépendante »

A

Échantillonnage aléatoire

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Comment obtenir un échantillon aléatoire en pratique ? (4 étapes)

A
  1. On crée une liste des individus de la population (N) et on leur attribuer un numéro allant de 1 à N
  2. On décide de la quantité à échantillonner n
    comprise entre 1 et N
  3. On utilise un générateur de nombres aléatoires pour n entiers compris entre 1 et N
  4. On échantillonne les individus dont le numéro correspond à un numéro qui a été généré aléatoirement.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qui-suis-je? « propriété mesurable qui varie (le plus souvent) de manière naturelle.

A

Variable

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Vrai ou faux : on ne peut mesurer qu’une variable à la fois par unité d’échantillonnage.

A

Faux : Il est important de noter que plus d’une variable peut être mesurée sur une unité d’échantillonnage.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Vrai ou faux : le type de variable n’a pas d’impact sur le traitement statistique des données

A

faux

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Quelles sont les deux grandes classes de variables?

A
  • Variable qualitative

- Variable quantitative

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Qui-suis-je? « variables catégorielles, sont des variables ne pouvant pas être mesurées quantitativement »

A

Variables qualitatives

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Quels sont les seuls calculs qu’on puisse faire avec des variables qualitatives?

A

Calculs impliquant le nombre d’éléments par catégorie et les différentes proportions parmi les catégories.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Les variables qualitatives peuvent être…(3)

A
  • Binaire
  • Nominale
  • Ordinale
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Classez les définitions suivantes avec le bon type de variables qualitatives (binaire, nominale ou ordinale)

A. Variables qualitatives offrant plusieurs possibilités ordonnées.
B. Variables qualitatives offrant deux possibilités.
C. Variables qualitatives offrant plusieurs possibilités non ordonnées.

A

A. Ordinale
B. Binaire
C. Nominale

22
Q

Qui-suis-je? « variables numériques pouvant être mesurées et fournir une valeur numérique sur une échelle de mesure »

A

Variables quantitatives

23
Q

Quels sont les deux types de variables quantitatives

A
  • Discrète

- Continue

24
Q

Qui-suis-je? « Variables quantitatives décrivant une série de nombres entiers. Par exemple, on pourrait vouloir mesurer le nombre de petits par portée d’un échantillon de taille n issue de la population de taille N»

A

Variable qualitative discrète

25
Q

Qui-suis-je? « Variables quantitatives décrivant une série continue de nombres réels. Par exemple, on pourrait vouloir mesurer la taille, l’âge ou le poids d’un échantillon. »

A

Variables quantitatives continues

26
Q

Vrai ou faux : il existe 2 sous-types de variables quantitatives continues.

A

Vrai, variable continue d’intervalle et variable continue de rapport

27
Q

Quelles sont les différences entre les variables continues d’intervalles et celles de rapports?

A

Intervalles : valeurs continues pour lesquelles une différence d’une unité a la même signification tout au long de l’échelle de mesure, quelle que soit la valeur de référence. Le statut de la valeur nulle est arbitraire.

Rapports : Il s’agit de valeurs continues pour lesquelles le zéro de l’échelle de mesure n’est pas arbitraire et mesure bien un « rien » qui a un sens physique.

28
Q

Vrai ou faux : lorsqu’on effectue une analyse statistique, il y a toujours une variable indépendante, une variable dépendante.

A

Vrai

29
Q

Vrai ou faux : dans le cadre expérimental, il y a rarement des variables contrôle

A

Faux, il y a souvent des variables contrôles

30
Q

Associez les définitions suivantes au bon terme (variable dépendante, indépendante ou contrôle)

A. Variable qui devraient rester constantes durant l’expérience et qui ne devrait pas influencer les résultats.
B. variable exogène que nous utiliserons pour expliquer la variabilité de la variable endogène.
C. variable endogène, c’est celle que l’on observera sur notre échantillon et dont on cherche à expliquer la variabilité grâce à nos analyses statistiques.

A

A. Variable contrôle
B. Variable indépendante
C. Variable dépendante

31
Q

Qui-suis-je? « Nombre de mesures qui ont une valeur particulière (ou incluses dans un intervalle). »

A

Distribution de fréquence absolue

32
Q

Qui-suis-je? « Proportion de mesures qui ont cette valeur (incluses dans l’intervalle). Les proportions sont bien sûr comprises entre 0 et 1 »

A

Distribution de fréquence relative

33
Q

Qui-suis-je? « Proportion des mesures inférieures ou égales à la valeur considérée (l’intervalle). Dans ce cas-ci, les proportions croissent de façon monotonique (la suivante est toujours > à la précédente) de 0 à 1 »

A

Distribution de fréquence cumulée

34
Q

Quels sont les principaux paramètres de tendance centrale en statistique?

A
  • Moyenne
  • Médiane
  • Mode
35
Q

Quels sont les principaux paramètres de dispersion en statistique?

A
  • Variance

- Écart-type

36
Q

Qui-suis-je? « somme de toutes les valeurs divisées par l’effectif n. »

A

Moyenne

37
Q

Qui-suis-je? « indique à partir de quelle valeur nous avons 50% de valeurs plus petites et 50%
de valeurs plus grandes. »

A

Médiane

38
Q

Qui-suis-je? « valeur d’une variable ayant la plus forte fréquence. »

A

Mode

39
Q

Qui-suis-je? « la moyenne des carrés des écarts »

A

Variance d’échantillonnage

40
Q

Qui-suis-je? « noté S, racine carrée de la variance. »

A

Écart-type

41
Q

Vrai ou faux : la médiane semble fournir une vision plus “juste” parce qu’elle n’est pas influencée par les valeurs extrêmes.

A

Vrai

42
Q

Qui-suis-je? « est l’écart type exprimé en pourcentage de la moyenne. »

A

Coefficient de variation (CV)

43
Q

Vrai ou faux : Le coefficient de variation est très utile afin de comparer la dispersion entre des variables d’ordre de grandeur ou d’unités différentes.

A

vrai

44
Q

L’analyse graphique devrait se faire de façon : (3)

A
  • rapide
  • précise
  • efficace
45
Q

Quels sont les 4 principes à respecter lorsqu’on présente des données sous forme de graphique?

A
  1. Montrer les données de façon pertinente
  2. Graduation fournissant des données de grandeurs honnêtes
  3. Patrons détectables (pas de données cachées, légende trop petites et RIEN en 3D)
  4. Graphiques clairs
46
Q

Qui-suis-je ? « type de graphique utilisé pour obtenir des renseignements sur le type de distribution de fréquence d’une variable continue. »

A

Histogramme

47
Q

Qui-suis-je ? « type de graphique utilisé pour les données qualitatives qui sont représentées par un nombre défini de catégories (peut être ordinale ou non ordinale) »

A

diagramme à bâtons

48
Q

Qui-suis-je ? « type de graphique utilisé pour permettre d’illustrer l’association entre 2 variables qualitatives. »

A

tableau de contingence

49
Q

Qui-suis-je ? « meilleure façon de représenter les données contenues dans un tableau de contingence »

A

diagramme mosaïque

50
Q

Qui suis-je? « idéal pour montrer l’association entre 2 variables numériques (quantitatives). »

A

nuage de points

51
Q

Qui suis-je? « montre la distribution de fréquence d’une variable quantitative ET l’association avec une variable qualitative. »

A

boxplot