Cours 2 Flashcards
Parle-moi de la distribution des fréquences
- Première étape pour organiser les données
- Fluctuation importante des fréquences avec des valeurs adjacentes
- Difficile de visualiser la forme générale parce qu’il y a trop de différence
- Il y a beaucoup de trous
- On voit chaque donnée et combien de personne on obtenues tel score
- Permet de voir les valeurs extrêmes
Parle-moi de l’histogramme
- Permet de voir les valeurs extrêmes
- On ne voit pas les données brutes
- Meilleure vision de la forme générale
- Les intervalles doivent être de la même grandeur
Parle-moi du diagramme à tige et feuilles
- On voit la forme de la distribution
- On voit toutes les données
- On voit les données extrêmes
- Utile pour comparer deux distributions différentes
Parle-moi du diagramme en boîte-et-moustaces
- La représentation graphique la plus représentative
- Permet de voir l’étendue
- Permet de voir la médiane
- Permet de voir les valeurs extrêmes
- Permet de voir la forme
Comment peuvent être différenciées les différentes distributions?
Avec le degré de symétrie (skewness) et le degré de voussure (kurtosis) (aplatissement)
- Une symétrie normale aura beaucoup au centre et peu sur les côtés. et la forme de chaque côté sera identique
Selon le degré de symétrie, comment une distribution peut-elle être?
- Normale (symétrique)
- Bimodale (2 sommets prédominants)
- Asymétrique négative (la queue pointe vers les petites valeurs)
- Asymétrique positive (la queue pointe vers les les valeurs positives)
Selon le degré de voussure, comme les distributions peuvent-elles être?
- Mésokurtique (normale)
- Leptokurtique (très pointu) (pas beaucoup de variabilit.)
- Platikurtique (très plat) (très variable)
Une lettre majuscule représente quoi?
Représente une variable
Une lettre minuscule représente quoi?
Une unité d’observation (donnée) de cette variable
Qu’est-ce qu’une mesure de tendance centrale?
mesure indiquant l’endroit où est centrée la distribution sur l’échelle de la variable
Quels sont les types de tendance central?
mode, médiane et moyenne
Qu’est-ce que le mode?
- le résultat qui est le plus fréquent
- non influencé par les données extrêmes
- mais peu représentatif de la distribution
- si les deux modes sont pas adjacents on parle de mode bimodal
- si les modes sont adjacents, il faut faire la moyenne des deux (unimodal)
Qu’est-ce que la médiane?
- le point sur l’échelle des données ordonnées numériquement au dessous duquel se situent 50% des cas
- correspond au 50e percentile d’une distribution
- c’est la donnée qui divise la distribution en 2, lorsque les données sont ordonnées numériquement
- pour localiser la médiane: s’assurer que les nombres soit en ordre et ( n+1 )/2
- si le nombre est pair on choisit la donnée, si le nombre est impair on doit choisir les deux données et faire la moyenne
- pas affectée par les valeurs extrêmes
Qu’est-ce que la moyenne?
- la somme des données d’une distribution pondérée par le nombre de données
- affecté par les données extrêmes
Qui suis-je? je suis influencé par les données extrêmes?
la moyenne
Qui suis-je? ma valeur correspond toujours à un score enregistré?
le mode sauf en cas de distribution bimodale
Qui suis-je? je peux m’appliquer à des échelles nominales?
le mode
Qui suis-je? je me prète à des manipulations algébriques?
la moyenne
je suis stable d’un échantillon à l’autre
la moyenne, si réplique l’étude avec le même nombre de participants
Quels sont les indices de dispersion?
l’étendue, la variance et l’écart-type
Pourquoi utiliser les indices de dispersion?
- parce que les mesures de tendance centrale ne peuvent décrire pleinement une distribution de données
- il est également intéressant de savoir le degré de déviation des données individuelles par rapport à la tendance centrale
Qu’est-ce que l’étendue?
- la distance entre la donnée la plus élevée et la donnée la moins élevée d’une distribution
- la donnée maximum - la donnée minimum
Quelles sont les propriétés de l’étendue?
- ignore presque toute la distribution
- calculée à partir des données extrêmes
- utilisé en complément à d’autres mesures
Qu’est-ce que l’écart-moyen
moyenne de écarts à la moyenne (inutile, car toujours égal à 0 (2ème propriété de la moyenne)
Qu’est-ce que l’écart moyen absolu?
moyenne des écarts en valeur absolue entre chaque donnée et la moyenne (peu utile, car difficilement manipulable algébriquement (en raison des absolue)
Qu’est-ce que la variance?
moyenne des carrés des écarts à la moyenne
Qu’est-ce que l’écart-type?
racine carrée de la variance ou racine carré de s à la 2
Qu’est-ce que le coefficient de variantion?
indice de dispersion qui peret de comparer la variabilité entre des échantillons dont les moyennes ou les échelles de mesure diffèrent.