Séance 2 Flashcards

1
Q

Quel est l’avantage et le désavantage du graphique de distribution de fréquences?

A

Av :

  • Permet de voir les valeurs réelles (les fréquences)
  • Permet de voir les valeurs extrêmes et le maximum facilement

Dés. :

-Beaucoup de fluctuation
entre les valeurs adjacentes sur
l'axe des x => plus diff de visualiser
la forme générale de la distribution
(incapable de former une courbe)

-Beaucoup de trous, valeurs sans observation (moins élégant)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quel est l’avantage et le désavantage de l’histogramme ?

A

Av. :

  • Il regroupe les valeurs adjacentes : ce qui règle le problème de fluctuation
  • Donne une idée plus juste de la forme de la distribution donnée (où se situent ex la 1/2 des données)

Dés:

-Masque les valeurs réelles (on ne peut pas voir spécifiquement lequel résultat est le plus dans l’intervalle)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quel est l’avantage et le désavantage du diagramme en tiges et feuilles?

A

Av.:

-Permet d’accéder aux valeurs brutes, on peut voir les donnés extrêmes et tracer la courbe des données (en tournant)

Dés:

-Présentation assez encombrée et lecture difficile

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quel sont les deux caractéristiques qu’on se sert pour différencier les distributions et les noms selon le degré?

A
  1. Symétrie : Équivalence des deux côtés de la courbe (ligne au centre tracerait 2 copies)

=> Symétrique (normale)
=> Asymétrique négative (queue pointe vers données inférieures)
=> Asymétrique positive (queue pointe vers données supérieures)
=>Bimodale (2 modes = 2 sommets (pas besoin d’être égaux))

2.Voussure : concentration des données (plutôt vers le mieux ou vers les extrémités = moins concentrée)

=> Mésokurtique (normale)
=> Leptokurtique (concentration au centre près de la moyenne = étirée)
=>Platikurtique (concentration aux extrémités = aplatie)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Qu’est-ce que la notation statistique Xij

A

x est une unité d’observation particulière qui se situe à la ligne i et la colonne j dans un tableau

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Que représente le symbole de somme ++?

A

La somme de tous les Xi de i à n

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Que représente SigmaXY?

A

La somme de chaque produit de XY (pas le produit des somme x et somme y)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Comment prouver SommeC = nC?

A

Additionner la constante, puis multiplier la constante avec le nbr de n puis égaler

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Comment prouver SommeCX = CsommeX?

A

Multiplier la constante avec chaque variable puis additionner , faire la somme des x et apres multiplier avec la constante , puis égaler

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Comment prouver Somme(X+Y) = Sommex + Sommey ?

A

Additionner tous les x et y ensemble puis additionner les résultats , additionner tous les x ensemble, tous les y ensemble et additionner les sommes, puis égaler

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qu’est-ce qu’une mesure de tendance centrale ? Quelles sont les 3?

A

Mesure indiquant l’endroit où est centrée la distribution sur l’échelle de la variable. (ne peuvent décrire pleinement une distribution de données seules)

Mode
Médiane
Moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Qu’est-ce que le mode?

A

Le résultat qui est le plus fréquent. (unimodale ou bimodale)
• (+) Non influencé par les données extrêmes;
• (-) Peu représentatif de la distribution.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Que faire lorsqu’on a deux modes adjacents? Est-ce bi ou unimodale?

A

Unimodale, on fait la moyenne de deux valeurs = le mode

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qu’est-ce que la médiane? Comment la calculer?

A

Le point sur l’échelle des données
ordonnées numériquement (en ordre croissant) au-dessous duquel se
situent 50% des cas.

(+) Pas affectée par les données extrêmes
(-) Représentatif

(n+1)/2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

V ou F : La médiane est la donnée la plus proche de tous les autres scores que eux entre eux ?

A

Vrai, la somme des distances entre chaque score et la médiane, en valeur absolue, est toujours plus petite ou égale à la somme des distances en valeur absolue entre chaque score et tout autre score (excluant la médiane).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Comment prouver Somme(x-médiane) <= somme(x-a) ou a = pas md

A

Soustraire la médiane de chaque x, puis additionner ; soustraire a (m donnée) de chaque x, puis additionner

17
Q

Qu’est-ce que la moyenne?

A

La somme des données d’une distribution
pondérée par le nombre de données.

Affectée par les données extrêmes

18
Q

Que sont des indices de dispersion? Que sont les 3?

A

Indices permettant de savoir le degré de
déviation des données individuelles par rapport à la tendance centrale (p. ex, la moyenne).
=> indiquent à quel point il y a de la variabilité à l’intérieur de l’échantillon

ex: écart-type, variance, étendue

19
Q

Qu’est-ce que l’étendue ? Ses propriétés?

A

Distance entre la donnée la plus élevée et la donnée la moins élevée d’une distribution

Propriétés :

  • Ignore presque toute la distribution;
  • Calculé à partir des données extrêmes;
  • Utilisé en complément à d’autres mesures (jamais seul)
20
Q

Qu’est-ce que l’écart moyen et l’écart moyen absolu?

A

Écart-moyen: Moyenne des écarts à la moyenne (inutile car revient toujours à 0)

Solution 1 :Écart-moyen absolu : Moyenne des écarts en valeur absolue entre chaque donnée et la moyenne (permet la division, mais difficilement manipulable algébriquement)

21
Q

Qu’est-ce que la variance?

A

Solution 2 : Variance : Moyenne des carrés des écarts à la moyenne (élimine aussi les négatifs

22
Q

Quelle est la différence entre la variance/écart-type de l’échantillon et de la population?

A

Pour la variance, on divise par n-1 (car ds échantillon cest vrm une estimation,
donc probablement que la variabilité sera bcp
plus petite que celle ds la réalité (Plus variable si plus grd pop = biais)

23
Q

Qu’est-ce que l’écart-type et pourquoi on l’utilise?

A

Racine carrée de la variance ou √ s2. (plus utile et interprétable car s’exprime dans la même échelle que le données)

24
Q

Qu’est-ce que le coefficient de corrélation?

A

Indice de dispersion qui
permet de comparer la variabilité entre des
échantillons dont les moyennes ou les échelles de mesure diffèrent.

25
Q

Quel est l’avantage et le désavantage du diagramme en boite et moustaches?

A

AV :

  • Permet de bien voir la forme de la distribution (boite symétrique ou non) + moustache représente extrêmes (voussure)
  • Pas lourde (vs tiges et feuilles) car n’est pas influencé par taille de la population

DÉS:
-Ne permet pas de voir les données individuelles