Description et exploration des données 1 Flashcards

1
Q

Qu’est-ce qu’une distribution de fréquences?

A

-Tableau où figure chaque valeur d’une série stat. accompagnée de sa fréquence
(Combien de personnes ont eu CETTE valeur?)

-Possible pour variables nominales, ordinales et continues

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Pourquoi est-il parfois moins pertinent d’avoir une distribution de fréquence pour les variables continues?

A

Parfois il y a trop de valeurs, donc peu de fréquence

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qu’est-ce que la fréquence absolue/effectif?

A

C’est le nombre de fois qu’une valeur numérique apparaît dans une série

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quelle est la différence entre “n” et “N”?

A

n: une partie de l’échantillon
N: l’échantillon total

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qu’est-ce qu’une fréquence relative?

A
  • Pourcentage des données qui prennent cette valeur
  • Permet de comparer les résultats = présenter toutes les catégories

*Rapporté dans le texte ou entre parenthèses

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Que faut-il mettre devant un “%”?

A

Un espace insécable!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Qu’est-ce que la fréquence cumulée (fc) ou cumulée en pourcentage (fc %)?

A

Nombre de données qui prennent une valeur inférieure ou égale à cette valeur

**Important de rapporter le pourcentage valide (exclure données manquantes) ET indiquer valeurs manquantes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quels sont les types de fréquences possibles?

A
  • Fréquence absolue
  • Fréquence relative
  • Fréquence cumulée
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

En quoi consiste le groupement des valeurs en classe?

A
  • Intervalles de nombres consécutifs délimitées par valeurs min et max
  • Utile pour variables quantitatives ayant un grand nombre de valeurs (ex: âge)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Pourquoi devons-nous uniquement faire des groupements de valeurs en classes avec une variable continue si c’est demandé par un chercheur?

A

Parce qu’il y aune perte de précision de cette variable

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quelles sont les différentes composantes du groupement des valeurs en classe?

A

Amplitude: Différence entre sup. et inf. (max - min)
Frontières: 2 nombres au bout d’une classe
Centre (point milieu): Moyenne des limites inférieures et supérieures

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quelle est l’échelle de mesure si les classes regroupées sont toutes égales?

A

Variable continue

**Dès qu’au moins un classe est ouverte ou d’amplitude inégale: valeur ordinale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Dans quels cas observons-nous des classes inégales?

A
  • Si il y a des valeurs extrêmes/aberrantes

- Frontière ouverte: juste 1 spécifiée (ex: moins de 18 ans)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Vrai ou faux: les graphiques sont essentiels dans les articles scientifiques?

A

Faux, ils sont plus rares. Utilisés davantage pour la vulgarisation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Sur quoi repose le choix d’un type de graphique?

A

Sur l’échelle de mesure!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Quels graphiques utilisons-nous pour les variables nominales ou ordinales?

A

Contiennent peu de valeurs!

  • Diagramme en bâtons
  • Diagramme en secteurs (tarte)
15
Q

Quels graphiques utilisons-nous pour les variables continues?

A
  • Histogramme
  • Diagramme en tiges et feuilles
  • Boîtes et moustaches
16
Q

En quoi consiste le diagramme à bâtons?

A

Axe horizontal/abscisse: Valeurs nominales (niveaux) ou ordinales (classes/rangs)
Axe vertical/ordonnée: Fréquence absolue ou relative

*Indiquer fréquence à chaque bâton

17
Q

En quoi consiste le diagramme en secteurs?

A
  • Portrait rapide des fréquences relatives (ou absolues)
  • Plus pour affiches scientifiques
  • Moins pertinent si trop (+ 10) ou si dichotomique
18
Q

En quoi consiste l’histogramme?

A

Axe horizontal/abscisse: Représente frontières des classes (écrire frontières ou centres de classes)
Axe horizontal/ordonnées: Fréquence relative ou absolue (indiquer sur rectangle)

**Pas d’espace entre rectangles

19
Q

En quoi consiste le diagramme en tiges et feuilles?

A

Tige (vertical): chiffres principaux (dizaine, unité) + avoir même largeur
Feuille (horizontal): chiffres secondaires (décimales)

**Permet d’avoir une idée rapide de la courbe (regarder côté)

20
Q

Quelles sont les limites auxquelles le diagramme à tiges et feuilles permet de pallier?

A
  • Histo. masque différences à l’intérieur des classes (pas assez détaillé mais avec feuilles oui)
  • Distribution de fréquence ne résume pas assez (trop de détail)
  • Réorganise données brutes
21
Q

Quels sont les deux types d’asymétrie?

A

Asymétrie négative: s’étend vers la gauche (-)
Asymétrie positive: s’étend vers la droite (+)

*Symétrie = 0

22
Q

Quels sont les types d’aplatissement?

A

Mésocurtique: Normale (valeur 0)
Platycurtique: Large et aplatie (-)
Leptocurtique: Pointue (+)

23
Q

Quels sont les mesures de tendance centrale?

A
  • Moyenne
  • Médiane
  • Mode
24
Q

Que devons-nous nous souvenir de la moyenne (M)?

A
  • Seulement pour variables continues!!!
  • Sensible aux valeurs extrêmes (ex: loterie)
  • Importance de l’interpréter en fonction de l’échelle (élevé ou non?)
25
Q

Que devons-nous nous souvenir de la médiane (Md)?

A
  • Sépare à la moitié (50% des observations)
  • Si ordinale, dire à quoi ça correspond
  • Impair = Md est valeur centrale, Pair = Md est moyenne 2 valeurs centrales
26
Q

Qu’est-ce que le mode (Mo)?

A

C’est la valeur qui revient le plus grand nombre de fois:

  • Surtout pertinent pour variables nominales ou ordinales
  • Peut avoir plusieurs modes (unimodale, bimodale, plurimodale)
27
Q

Quels liens pouvons-nous faire avec les trois mesures de tendance centrale?

A

Unimodale et symétrique: M, Md et Mo sont les mêmes
Bimodale symétrique: M et Md sont les mêmes + 2 Mo
Asymétrie + ou -: 3 mesures diffèrent (moyenne se déplace vers asymétrie)

28
Q

Quand devons-nous présenter les mesures de tendances centrales?

A

Symétrie: Juste M (tous pareils)
Asymétrie: Ajouter Md
Bimodale: Ajouter modes