Cours 2 Flashcards
Qu’est-ce que la distribution de fréquences?
C’est lorsqu’on décide d’afficher nos données, toute nos données, sur un graphique.
Cependant, avec des 100aine de données, ça peut être lourds, il peut aussi y avoir des trou et beaucoup de fluctuation entre les valeurs adjacentes.
Qu’est-ce qu’un histogramme?
C’est lorsqu’on regroupe les valeurs adjacentes dans un graphique. Ex : Toutes les données situé en 60 et 70 sont regroupé ensemble.
Quels sont les avantages et désavantage d’un historgramme?
Avantage
- En regroupant les données, on évite la fluctuation entre les données
- Permet de voir la tendance
Désavantage :
1. On ne voit plus les données réelles
Vrai ou Faux
Le diagramme en tiges et feuilles permettent de comparer deux groupes en même temps. Cependant, il ne permet pas de voir la forme de la distribution des données
Faux
Le diagramme en tiges et feuilles permettent de comparer deux groupes en même temps. Il permet aussi de voir la forme de la distribution des données (lorsqu’on le tourne de côté)
Quelle est le représentation graphique la plus informative?
La diagramme en boite et moustache!
Quels sont les avantages du diagramme boite et moustache?
- On peut y voir Q2 (la médiane) ainsi que tout les autres quartiles
- Permet de couper la distribution en 4 partie égales (les quartile
- Permet de voir les valeurs extrêmes *
Que signifie le fait d’avoir des moustache très longues?
Cela signifie qu’il y a beaucoup de variabilité à l’intérieur des données.
Donc, beaucoup de dispersion autour de la moyenne
Si j’ai une moustache plus grande que l’autre, cela signifie quoi?
Qu’il y a une asymétrie dans nos données. Donc un plus grand nombre de nos données se trouve dans la plus grande moustache.
Dans un asymétrie … la queue se trouve à droite et dans une asymétrie … la queue se trouve à gauche
Dans un asymétrie positive la queue se trouve à droite et dans une asymétrie négative la queue se trouve à gauche
Comment appelle-t-on une distribution normale, selon son degré de voussure?
Mésokurtique
Comment appelle-t-on une distribution haute et mince, selon son degré de voussure?
Leptokurtique
Comment appelle-t-on une distribution large et plate, selon son degré de voussure?
Platikurtique
Une … … représente une variable et une … … représente une donnée de cette variable
Une lettre majuscule représente une variable et une lettre minuscule représente une donnée de cette variable
Comment peut-on lire x34?
La donnée de la variable X à la ligne 3 colonne 4
Truc: Les lignes c’est toujours couchées et les colonnes c’est toujours debout
Que signifie le sigma majuscule (le drôle de E)?
La sommation
Que signifie le n?
C’est le nombre total d’observation
Que signifie i = 1
Toutes les valeurs de X allant de la première données à la dernière donnée
Que signifie i = 3
Toutes les valeurs de X allant de la 3e donnée à la dernière donnée
Que signifie : La somme de tous les Xi pour les valeurs de i= 4 jusqu’à n = 9
Qu’on additionne toutes les données de X allant de la 4e donnée à la 9e donnée
Il est important de respecter l’ordre des opérations mathématique. Quel est cet ordre?
Parenthèse Exposant Multiplication Division Addition Soustraction
PEMDAS –> Panda
Qu’est-ce qu’une mesure de tendance centrale?
C’est une mesure indiquant l’endroit où est centrée la distribution sur l’échelle de la variable
Quels sont les 3 types de mesure de la tendance centrale?
- Le mode
- La médiane
- La moyenne
Qu’est-ce que le mode?
C’est le résultat le plus fréquent
Nommez les avantages et désavantages du mode
+ Il est non influencé par les données extrêmes
- Il est peut représentatif de la distribution
Lorsqu’il y a un seul mode, c’est une distribution … et lorsqu’il y en a 2 c’est une distribution …
Lorsqu’il y a un seul mode, c’est une distribution unimodale et lorsqu’il y en a 2 c’est une distribution bimodale
Que fait-on lorsqu’il y a 2 modes adjacents?
On considère qu’il y a 1 seul mode. Pour obtenir la valeur du mode, on fait la moyenne entre les 2 valeurs
Ils doivent vrm être un à côté de l’autre
La … est le point sur l’échelle des données … … au dessous duquel se … … des cas
La médiane est le point sur l’échelle des données ordonnées numériquement au dessous duquel se situent 50% des cas
- Ordonnées numériquement veut dire qu’on doit avoir les données en ordre croissant devant nous
À moins d’avoir une boite et moustache, il n’est pas possible d’observer la médiane sur un graphique
Quelle est la formule pour localiser la médiane
(n+1) / 2
Quand n est pair, faire la moyenne des 2 données centrales
Nommez un avantage et un désavantage de la médiane
+ : N’est pas influencé par les données extrèmes
- : Ne prend pas en compte la forme de la distribution
Qu’est-ce que la moyenne?
C’est la sommes des données / par le nombre de données
Nommez les avantages et les désavantages de la moyenne
- La moyenne est affectée par les données extrême.
+ Se prête à des manipulation algébrique
+ est stable d’un échantillon à l’autre
À quoi serve les indices de dispersions?
Connaître le degré de déviation des données individuelles par rapport à la tendance centrale (ex :Moyenne)
Qu’est ce que l’étendue?
C’est la distance entre la donnée la plus élevée et la données la moins élevée
Qui suis-je?
Je suis inutile car je suis toujours égal à 0
L’écart moyen –> La moyenne des écarts à la moyenne
Qu’est-ce que la variance?
C’est la moyenne des carrés des écarts à la moyenne
Plus la variance est élevée, plus l’écart des gens par rapport à la moyenne est élevé
Qu’est-ce que l’écart type?
C’est la racine carrée de la variance
Un … de … est une indice de … qui permet de comparer la variabilité entre des … dont les … ou les échelles de mesure …
Un coefficient de variation est une indice de dispersion qui permet de comparer la variabilité entre des échantillons dont les moyennes ou les échelles de mesure diffèrent
Qui suis-je?
Je peux être apliqué à des échelles nominales
Le mode
À quoi sert la coefficient de variation?
À comparer la variabilité entre des échantillons dont les moyennes ou les échelles de mesures diffèrent
Quelle est la formule pour calculé un coefficient de variation?
CV = (s/moyenne) * 100
Quelle est la formule de la variance?
s2 = Sommation (donné-moyenne)2/n-1