Cours 4 Flashcards

1
Q

Quel sont les 3 type d’analyse ? **

A

Univariée = 1 variable
Bivariée = 2 variables (si l’âge du délinquant influence le taux de crime)
Multivariée = 3 variables ou plus

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quel est l’utilité de l’analyse univariée?**

A
  • Ne vise pas à expliquer
  • De décrire et de présenter les données

Ces variables servent à décrire notre population à l’étude (sociodémographique: âge, revenu familial, nationalité) comme dans travail avec variable autres que celle choisi

Ex: Le 3⁄4 de la population carcérale au Québec est constituée de détenus de moins de 35 ans.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quel sont les 3 type de mesures ?

A

Mesures de tendance centrale
Mesures de position
Mesures de dispersion

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quel est l’utilité et le type de mesure de: Mesure de tendance centrale

A

Permettent de résumer en un seul nombre la valeur la plus représentative d’une série statistique.

De mesurer;
Moyenne
Mode
Médiane

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quel est l’utilité et le type de mesure de: mesure de position

A

Renseignent sur la position d’une donnée par rapport aux autres données d’une distribution ordonnée.

Quartiles (divisé par 4)
Quintiles (divisé par 5)
Déciles (divisé par 2)
Centiles (divisé par 1)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quel est l’utilité et le type de mesure de:mesure de dispersion

A

Mesurent le niveau de variation ou de dispersion des variab

Étendue
Variance
Écart-type

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Expliquer le mode (mesure de tendance centrale)

A

Valeur ou modalité de la variable la plus fréquente dans la distribution

Peut seulement utiliser;

Variable intervalle
Variable continue
Variable ordinale
Variable nominale (plus facile à trouver)

Ne fait sens que si la valeur du mode se distingue réellement des autres valeurs ou modalités

Il peut y avoir plusieurs modes (Unimodale vs multimodale)

Unimodale: une donnée (catégorie) qui va ressortir plus que les autres

Multimodale: plusieurs catégories qui vont ressortir

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Expliquer la médiane (mesure de tendance centrale)

A

Valeur qui divise une distribution ordonnée en 2 parties égales. On retrouve 50% des données au- dessus et 50% en dessous

Peut seulement utiliser;

Variable intervalle
Variable continue
Variable ordinale (plus facile à trouver)

Utile dans les cas de distribution très asymétrique

Bon complément à la moyenne
puisque la moyenne n’apporte une vision très précises, donc la médiane aide

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Expliquer la moyenne (mesure de tendance centrale)

A

La somme des données divisée par leur nombre

Peut seulement utiliser;

Échelle intervalle(plus facile à trouver)
Échelle continue (plus facile à trouver)

Idéale lorsque la distribution est relativement symétrique et unimodale

Très influencée par les valeurs extrêmes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quel sont les avantages et les inconvénients du Mode ?

A
  1. Avantages: Simple; facile à identifier; s’utilise avec tous les types d’échelle de mesure
  2. Inconvénient: Ne prend pas en considération toute l’information disponible sur la distribution
    Donc ne donne pas une vision globale comme la moyenne
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quel sont les avantages et les inconvénients de la médiane ?

A
  1. Avantage: Peu influencée par les valeurs extrêmes
  2. Inconvénient: Prend seulement en considération l’ordre des données/valeurs
    - nous ne savons pas ou les données se situent par rapport à la moyenne. Aussi comme le Mode, il n’est pas possible d’avoir une vision globale.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quel sont les deux façon de mesurer la médiane ?

A

(1) Données groupées/variable ordinale
- Se fier au pourcentage cumulatif
- Doit se fier à la catégorie qui dépasse le 50%, dans ce cas ce serait la catégorie 26-35 qui serait la médiane.

  • Identification du 50ème percentile (50%)

(2) Variable continue
Md= (n+1)/2; n= nombre d’unités d’analyse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quels sont les avantages et inconvénients de la moyenne ?

A

Prend en considération toutes les valeurs mais… grandement influencée par valeurs extrêmes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Expliquez qu’est qu’un quantile ?

A

Quantiles: valeurs qui partagent une distribution en un certain nombre de parties égales.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Expliquer l’étendue

A

Renseigne sur l’étalement des données

Différence entre la valeur observée la plus élevée et la valeur observée la moins élevée d’une distribution

Plus l’étendue est grande, plus les valeurs possibles sont différents

-Exemple
La faible étendue (20$) du prix de l’héroïne qui varie entre 30 et 50$ le gramme témoigne d’une certaine entente entre les vendeurs.

30$ est la valeur minimale
50$ valeur maximale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Expliquez la variance

A

Renseigne sur la variabilité/l’homogénéité des données

Mesure la distance de chaque observation par rapport à la moyenne – la concentration

Sensible aux valeurs extrêmes

Difficile à interpréter!

S2 élevée= hétérogénéité de la distribution

S2 faible= homogénéité de la distribution

Le chiffre obtenu dans la variance nous mène à perdre notre mesure/unité métrique ( ex ; $, %, etc).

17
Q

Expliquer l’écart type

A

Renseigne sur la variabilité/l’homogénéité des données

Mesure la distance de chaque observation par rapport à la moyenne.

Sensible aux valeurs extrêmes.

Même “métrique” que la variable

S élevée= hétérogénéité de la distribution

S faible= homogénéité de la distribution

Plus les veleurs sont éloignés de la moyenne, plus l’écart type l’écart type est élevée

18
Q

Quel sont les différentes manières de présenter visuellement les variables ?

A

(1) Diagrammes circulaires
Surtout pour variables nominales (peu de catégories)

(2) Diagrammes en bâtons
Surtout pour variables ordinales

(3) Histogramme
Variables continues