Chapitre 2 Flashcards
Statistique descriptive
Tendance centrale, de dispersion et de caractérisation de la distribution de fréquence d’un échantillon
Constante vs Variable
Constante = même pour tous les individus d’une population
Variable = Peut être différent pour différents individus d’une population
Types de variables
Qualitative: non numérique
Quantitative discrète: entier, nb de comptes
Quantitative continue: bilan, rapport, pourcentage
Type de mesures de tendance centrale
Moyenne (arithmétique)
Médiane: valeur milieu (50% à gauche, 50% à droite)
Mode: valeur la plus fréquente
Caractéristique de distribution symétrique
Moyenne = médiane = Mode
Mesures de dispersion
Information sur la dispersion/éparpillement des données autour du centre
Étendue
Variance
Écart type
Coefficient de variation
Erreur type
Intervalle semi-interquartile
Type de lettre population vs échantillon
Population = lettre grec (ex. sigma)
Échantillon = lettre romaine (ex. S)
Pourquoi la variance de l’échantillon on divise par r-1
Car c’est impossible d’avoir une variance de 1 individu donc on divise par le degré de liberté (r-1)
Paramètres de forme
Nous informe sur la symétrie
Voir pdf
Voir pdf/présentation
Nommer le but de la distribution de fréquence ainsi que les caractéristiques d’un histogramme
Distributions de fréquence servent à décrire, à classifier et à distinguer les individus d’une population.
But: présenter les données sous forme synthétique, sans perdre l’essentiel de l’information contenue dans les valeurs prises par la variable à l’étude.
Histogramme: façon la plus utilisée d’illustrer la distribution d’une fréquence.
- Rectangles de même largeur juxtaposée, représentant chaque classe
- Hauteur = fréquence des classes
Vrai ou faux.
La médiane et le mode sont des mesures de tendances centrales plus robustes que la moyenne arithmétique?
Expliquez
Vrai
Parce qu’elles sont peu (ou pas pour mode) biaisées par la présence de valeurs extrêmes/données aberrantes
Règle empirique entre distribution normale et écart type?
+- 1 écart type = 68.3% des observations
+- 2écart type = 95.4% obs
+- 3 écart type = 99.7% obs