Cours 2: Description des données Flashcards
Quelles sont les 3 fonctions de la représentation graphique?
- Organisr les données selon un ordre logique
- Examiner la forme de la distribution
- Déterminer s’il existe des données extrêmes/aberrantes
Nomme les 4 types de représentationa graphiques utilisées en statistiques.
- Distribution de fréquences
- Histogramme
- Diagramme en tige-et-feuilles
- Diagramme et boîte-et-moustaches
Nomme les forces et faiblesses de la représentation graphique
Distribution des fréquences
Force: Permet de visualiser rapidement la distribution de l’ensembles des données
Faiblesse: Difficile à lire si grand nb de scores et variation des fréquences adjacentes
Nomme les forces et faiblesses de la représentation graphique
Histogramme
Force: Simplifie la figure tout en préservant les tendances importantes
Faiblesse: Ne permet pas de voir les données individuelles
Nomme les forces et faiblesses de la représentation graphique
Diagramme en Tige-et-feuilles
Force: Permet de visualiser à la fois la forme et les valeurs individuelles
Faiblesse: Aucune nommée
Nomme les forces et faiblesses de la représentation graphique
Diagramme en Boîte-et-moustaches
Force: Permet d’identifier la symétrie de la distribution et permet d’identifier les données extrêmes
Faiblesse: La forme n’est pas facilement visible et ne présente pas les valeurs individuelles
V/F Il est important d’utiliser plusieurs méthodes graphiques
Vrai, cela permet une meilleure représentation de la distribution de données
Quelles sont les 2 cactéristiques qui différencient les distributions?
- Symétrie
- Voussure (concentration des scores)
Quels sont les 4 degrés de symétrie?
- Normale (^)
- Bimodale (^^)
- Asymétrie NEG(-^)
- Asymétrie POS (^-)
Quels sont les 3 degrés de voussure?
- Leptokutique (haut mince): peu de variabilité
- Mésokurtique (normale): scores centrés et quelques extrêmes
- Platikurtique (bas large): données étendues
Notation
Que siginifie une lettre minuscule (Y) vs une lettre minuscule (y)?
Majuscule: Variable
Minuscule: Donnée de la variable
Ex: G=[5, 7, 8, 9]
g1= 5 et g3=8
Notation
V/F Lorsqu’il y a plus d’une variable, on précise la donnée avec plusieurs indices.
Vrai, ex: xij
Notation
Que signifie Σ?
Sommation
Comment se lit:
9
ΣXi
i=3
La somme de tous les Xi pour les valeurs de i allant de 3 jusqu’à 9.
Propriété de la sommation?
(ΣX)^2=ΣX^2 ?
NON
Propriété de la sommation
ΣXY = ΣX·ΣY ?
NON
Quelles sont les 3 propriétés de la sommation?
- Σc=nC (la sommation de constante = n fois la constante)
- ΣcX=cΣX (la sommation d’une constante multipliée par une variable = constante multipliée par la sommation de la variable)
- Σ(x+y)=Σx + Σy (la sommation d’une somme de plusieurs quantités = la somme des sommations)
Tendance centrale
Définit ce qu’est une mesure de tendance centrale
Mesure indiquant l’endroit où est centrée la distribution sur l’échelle de la variable
Quels sont les 3 types de mesure de tendance centrale
Mode, médianne et moyenne
Définit le mode
Résultat le plus fréquent
C’est LA réponse la plus populaire
Comment nomme-t-on une ditribution à un mode? À deux modes?
Unimodale et bimodale
V/F Lorsque deux modes sont adjacents, la distribution est bimodale.
FAUX, la ditribution est unimodale
Il faudra alors faire la moyenne des 2 valeurs
Définit la médianne
Le point sur l’échelle des données ordonnées numériquement au-dessous duquel se situent 50% des cas
50e percentil d’une distribution
Quels sont les calculs de la médianne?
- Localiser la POSITION de la valeur: (n+1)/2
- Noter la valeur (attention, si n est pair, la médianne est ;a moyenne des 2 données centrales)
Quelles sont les 2 propriétés de la médianne?
- Elle n’est PAS affecté par les données extrêmes
- La somme des distances en valeur absoule entre chaque score et la médianne est toujours plus petite ou égale à la somme des distances en valeur absolue entre chaque score et tout autre score (EXCLUANT la médiane)
Définit la moyenne
La somme des données d’une distribution pondérée par le nb de données
Quelles sont les 5 propriétés de la moyenne?
- La somme de toutes les données est égale au nb de données multiplié par la moyenne
- La somme des distances entre chaque score et la moyenne est égale à 0.
- Addition/soustraction d’une constante à chaque donnée de la distribution produit une nouvelle moyenne égale à la moyenne originale additionnée par cette constante
- Multiplication/division d’une constante à chaque donnée de la distribution produit une nouvelle moyenne égale à la moyenne originale additionnée par cette constante
- Moyenne est affectée par les données extrêmes, contrairement à médiane ou mode.
Nomme avantages du mode
- S’applique à des données nominales
- Représente le plus grand nb de données
- Non influencé par données extrêmes
Nomme avantages de la médiane
- Non influencée par données extrêmes
Nomme avantages de la moyenne
- Manipulations algébriques possibles
- Estimateur plus stable de la tendance centrale lorsqu’on prélève plusieurs échantillons dans une population
Nomme désavantages du mode
- Souvent peu représentatif de la distribution
- Se prête difficilement aux manipulations algébriques
Nomme désavantages médiane
Se prête difficilement aux manipulations algébriques
Nomme désavantages de la moyenne
Biaisée par les scores extrêmes
Quelles sont les 3 indices de dispersions?
- Étendue
- Variance
- Écart-type
Définit ce qu’est un indice de dispersion
Degré de déviation des données individulles par rapport à la tendance centrale
Définit l’étendu et nomme sa formule
Distance entre donnée plus élevée et donnée la moins élevée d’une distribution
Étendue= Xmax-Xmin
Quelles sont les propriétés de l’étendue?
- Ignore presque toute la distribution
- Calculée à partir des données extrêmes (peut déformer)
- Utilise avec une distribution naturellemnt bornée, comme l’âge
Qu’est-ce que l’écart-moyen?
Moyenne des écarts à la moyenne
Inutile CAR TJRS ÉGAL À 0
Quelle est le défaut de l’écart-moyen? Quelle est la solution pour y remédier?
Est inutile car est tjrs égal à 0. SOlution: Écart-moyen ABSOLU
Qu’est-ce que l’écart-moyen absolu? Quel est son défaut?
Moyenne des écarts en valeur absolue entre chaque donnée et la moyenne.
Difficilement manipulable algébriquement.
Qu’est-ce que la variance?
Moyenne des carrés des écarts à la moyenne
Quelle est la différence entre la formule de la variance d’une population et d’un échantillon?
Population: divisé par N
Échantillon: divisé par n-1 (corriger biais créé par estimation faite avec des petits nbs)
Qu’est-ce qu’est l’écart-type?
Racine carrée de la variance
Quelle est la différence entre la formule de l’écart-type d’une population et d’un échantillon?
Population: divisé par N
Échantillon: divisé par n-1 (corriger biais créé par estimation faite avec des petits nbs)
Complète l’affrimation
Lorsqu’une distribution est normale et symétrique, ____________ des données se situent à +/- un écart-type de la moyenne et ____________ des données se situent à +/- 2 écart-type de la moyenne.
- 1/3
- 95%
Quelles sont les 3 propriétés de la variance et écart-type?
- Très affectés par données extrêmes
- Addition d’une constante à chaque donnée de la distribution NE modifie PAS la variance/écart-type.
- La multiplication d’une constante à chaque donnée de la distribution produit une nouvelle variance égale à la variance originale multipliée par cette constante au carré et** un nouvel écart-type égal à l’écart-type original multiplié par cette constante.**
Qu’est-ce que le coefficient de variation?
Indice de dispesion qui permet de comparer écarts-types qui proviennent d’échantillons dont les moyennes ou les échalles de mesure diffèrent.
V/F La variance de la population et de l’échantillon sont tjrs égales.
Faux, à cause du N et n-1
VRAI OU FAUX ? Un diagramme en tige-et-feuilles permet de visualiser les données individuelles d’une distribution, mais il ne permet pas de visualiser la forme de la distribution
Faux, permet de visualiser la forme.
Le/la/l’ ________________ permet de visualiser rapidement toutes les données d’un ensemble à l’aide de barres verticales, tandis que le/la/l’ ____________________ permet de simplifier la représentation des données en les regroupant en intervalles.
- Distribution de fréquence
- Histogramme
Quels indices de tendance centrale sont égaux lorsque la distribution est symétrique ?
Médiane et moyenne
PAS mode, car distribution peut être symétrique et bimodale