Examen 2 Flashcards

1
Q

Selon Vessereau, la statistique « ne s’appuie pas toujours sur des faits très nombreux, mais sait, par une analyse subtile, tirer parti d’un petit nombre de données judicieusement choisies » Expliquez ce que cela signifie sous l’angle inférentiel.

A

À partir de données provenant d’un petit échantillon, il est possible d’extrapoler un constat général pour l’ensemble d’une population. On note toutefois qu’il y a une possible marge d’erreur.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Sous l’angle descriptif

A

Cela renvoie à la sélection judicieuse de quelques données qui résument bien une situation : par exemple, les valeurs maximale et minimale d’une distribution pour obtenir l’étendue, ou encore la valeur du point milieu des scores ordonnés pour repérer la médiane, etc.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Le salaire de Sidney Crosby augmente de 12 millions à 15 millions, avec cette augmentation, il demeure le joueur le mieux payé. Décrivez si cela a un impact sur l’écart-type et l’étendue interquartile, expliquez pourquoi àl’aide du calcul de ceux-ci

A

Cela a un impact sur l’écart-type puisque la somme des scores est plus grande modifiant ainsi la moyenne à la hausse. Comme l’écart-type constitue la moyenne des écarts à cette moyenne, la modification de 12 à 15 millions a un grand impact sur cette mesure. Sur l’étendue interquartile, par contre, Sidney Crosby se retrouve déjà dans le dernier quartile, soit le plus élevé. Comme l’étendue interquartile correspondant au calcul Q3-Q1, son salaire fait partie du Q4, son augmentation ne fait donc pas modifier la mesure.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

La réussite (par exemple scolaire, etc.) peut être mesurée de différentes façons (niveaux de mesure), donnez un exemple qualitatif et quantitatif. (Il faut que tu spécifies aussi quel niveau de mesure (ex: ordinale, de ratio, etc.), que tu nommes la variable choisie et que tu dises des valeurs potentielles de réponses).

A
1. La réussite scolaire: qualitatif ordinal
Pas du tout réussi
Peu réussi
Quelque peu réussi
Réussi
Très réussi
Extrêmement réussi
2. La réussite scolaire: quantitatif d’intervalle
Moins de 30%
Entre 30 et 59%
Entre 60 et 89
90 et plus
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Est-ce pertinent de mesurer le pourcentage cumulatif pour une variable d’intervalles?

A

Oui, car le pourcentage cumulatif est pertinent à partir du moment où les valeurs peuvent être ordonnées. Il est donc possible pour les variables ordinales, d’intervalles et de ratio.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

La couleur des yeux est une constante? (Vrai ou faux, pourquoi?)

A

Faux, car elle peut varier selon les répondants. Une personne peut avoir les yeux bleus et une autre, les yeux bruns.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Les salaires au public sont plus hétérogènes que les salaires au privé? (Vrai ou faux, pourquoi)

A

Vrai, selon la distribution, si l’écart-type est élevé, alors les résultats sont dispersés et hétérogènes. Alors que si l’écart-type est bas, les résultats sont agglomérés et homogènes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

L’écart type des résultats d’une évaluation individuelle a plus de chance d’être petit que celle d’une évaluation réalisée en équipe? (Vrai ou faux, pourquoi)?

A

Faux, lorsque les évaluations sont réalisées en équipe, il y a moins de scores, donc la probabilité que les scores soient plus dispersés est moins grande que si l’évaluation était réalisée individuellement.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est-ce que ça veut dire « mutuellement exclusive » et « collectivement exhaustive »?

A

Mutuellement exclusives, les catégories ne se chevauchent pas.

Collectivement exhaustif, l’ensemble des catégories inclut tous les cas possibles

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

(…) est le processus par lequel nous trouvons les valeurs d’une variable pour des cas différents.

A

La mesure

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Question sur l’asymétrie (Vrai ou faux): le mode se situe entre la moyenne et la médiane dans une asymétrie?

A

Faux, le mode sera plus grand que la médiane dans une asymétrie à gauche et plus petit que la médiane dans une asymétrie à droite.

Quand la distribution est symétrique, la moyenne, la médiane et le mode sont pareils.

Quand la distribution est asymétrique vers la gauche, la moyenne est plus basse que la médiane. (Moyenne, médiane, mode)

Quand la distribution est asymétrique vers la droite, la moyenne est plus élevée que la médiane. (Mode, médiane, moyenne)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Un salaire passe de 20 000$ à 25 000$, l’augmentation est de combien de pour cent?

A

L’augmentation est de 25%

(25 000-20 000) x100 / 20 000.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

En quelle marque de voiture avez-vous le plus confiance? Toyota, Honda, etc. Quel est le niveau de mesure?

A

Qualitatif nominale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Comment calcule-t-on la moyenne? Quelles sont ses forces et faiblesses?

A

La somme des scores divisé par le nombre de scores total.

Force: la plus représentative et démocratique, car chaque score a son mot à dire, a de l’influence sur la distribution. Permet d’équilibrer la distribution

Faiblesse: Fragile quant aux scores déviants

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Le sexe est une constante? Vrai ou faux, expliquez

A

Faux. La constante est “quelque chose qui ne varie pas” (Fox, 1999 : 9), tandis que le sexe (masculin / féminin) “varie” d’un cas à l’autre.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

À quoi renvoie le mot statistique?

A

Renvoie à des informations résumés numériquement mais aussi aux méthodes qui permettent de résumer.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Différence entre unité d’analyse et Cas?

A
  • l’Unité d’analyse est la personne, l’objet ou l’événement sur lequel porte l’analyse.
  • Le cas sont les unités réelles à partir desquelles les données sont colligées.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Quels sont les deux types de statistiques?

A
  1. Statistiques descriptives

2. Statistiques inférentielles

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Différence entre les statistiques descriptives et les statistiques inférentielles?

A

Descriptive : résume l’information (graphique et logo)

Inférentielle : Généralise un constat à partir des données d’un échantillon

20
Q

Pourquoi se bâtir sur des échantillons?

A

Il est difficile de recueillir des informations sur une population entière

21
Q

Qu’est-ce que la mesure?

A

Le processus par lequel nous trouvons les valeurs d’une variable pour des cas différents
valeurs mesurées : score

22
Q

Qu’est-ce qu’une échelle?

A

L’ensemble des valeurs d’une variable

23
Q

Quels sont les trois types de mesure centrale?

A

Mode
Médiane
Moyenne

24
Q

Est-ce que l’asymétrie affecte la médiane?

A

Non, la médiane est préférable à la moyenne dans le cas de distribution hautement asymétrique

25
Q

Qu’est-ce qu’une variable?

A

Caractéristique au propriété qui peuvent prendre plus d’une valeur
Variable à la propriété de varier

26
Q

Quels sont les 4 niveaux de mesure

A
Variable nominale (valeurs et attributs diffèrent des autres)
Variable ordinale (dont les valeurs peuvent être ordonnées)
Variable d'intervalle (valeurs données mais elles se mesurent également à l'aune d'une unité de mesure fixe ou standard. 
Variable de ratio (se mesure grâce à une unité standard zero non-arbitraire)
27
Q

Qu’est-ce qu’une constante?

A

Quelque chose qui ne varie pas

28
Q

Qu’est-ce qu’un paramètre?

A

Un paramètre est un résumé basé sur une population , c’est une caractéristique d’une population qui caractérise un échantillon.

29
Q

Qu’est qu’un niveau de mesure?

A

Les variables sont classées selon la façon dont elles mesurent, ce qu’on appelle les niveaux de mesure (nominal, ordinal, d’intervalle, ratio)

30
Q

Qu’est-ce qu’une variable dichotomique?

A

Une variable dichotomique a deux valeurs à l’origine. Elle a subi un regroupement par lequel le nombre de valeurs à l’origine a été réduit à deux.

31
Q

Est-ce que les variables ordinales sont un niveau de mesure supérieur aux variables nominales?

A

Non, c’est la variable ration parce qu’on peut interpréter et sélectionner plusieurs tests statistiques.

32
Q

Qu’est-ce qu’une variable continue?

A

Une variable continue peut revêtir différentes fractions entre le nombres entiers (ex : note globale)

33
Q

Qu’est-ce qu’une variable discrète?

A

Une variable discrète ne peut revêtir qu’un nombre limité de valeurs entières.

34
Q

Différence entre analyse univariée, bivariée et pluvariée

A
  1. Méthode qui permet d’analyser une à la fois
  2. Relation entre deux variables
  3. Lien entre trois variables et plus
35
Q

Étendues Interquartile (description, forces et faiblesses)

A

Mesure de dispersion robuste en présence d’une distribution asymétrique (Q3-Q1)
Force : + stable que l’étendue.
Faiblesse : N’utilise qu’une partie de l’information disponible et non toutes les valeurs

36
Q

Étendue (description, forces et faiblesses)

A

Mesure de dispersion sommaire qui calcule simplement l’écart entre les valeurs minimales et maximales.

Forces : facilité de calcul, évaluation rapide
Faiblesse : mesure grossière (infirme partie des infos)

37
Q

Médiane (description, forces et faiblesses)

A

La valeur qui divise en deux parties égales un ensemble de données de scores. (milieu/point central)

Forces : plus robuste, résiste aux scores déviants
Faiblesses : elle tient compte de la position des scores et non pas des valeurs.

38
Q

Mode (description, forces et faiblesses)

A

Le score qui apparait le plus souvent

39
Q

Moyenne (description, forces et faiblesses)

A

La mesure de tendance centrale que l’on obtient en additionnant tous les scores et en divisant cette somme par le nombre de scores.

Forces : Représentative, démocratique et équilibre
Faiblesses : Scores déviants

40
Q

Mesure tendance centrale

A

Servent à préciser l’allure générale d’une distribution (valeur typique ou représentative d’un ensemble de scores)

41
Q

Mesure de variations

A

Aident à évaluer si les valeurs sont concentrées ou dispersées

42
Q

Variation

A

Mesurer la divergence des scores par rapport à un score typique, le score moyen.

43
Q

Score moyen

A

Renvoie à l’utilisation de la moyenne comme point de référence à partir duquel on mesure les écarts

44
Q

Écart type (description, forces et faiblesses)

A

L’écart type constitue la moyenne des écarts

Forces : Représentative et réaliste (plus adéquat pour les données simples)

Faiblesses : Fragile aux scores déviants

45
Q

Écart type élevé

A

Dispersé et hétérogène

46
Q

Écart type bas

A

Homogène et aggloméré

47
Q

Variance

A

Plus utile en analyse bivariée et multivariée

Propriétés mathématiques supérieures