Chapitre 7: représentation graphique de données continues Flashcards
Mesures de tendance centrale
Moyenne arithmétique Moyenne harmonique Moyenne géométrique
Comment calculer le mode ?
- Compter l’occurrence de chaque valeur
- Mode = valeur la plus fréquente
Comment calculer la médiane ?
- Ranger les n valeurs par ordre croissant
- Si n impair : médiane = valeur située à la position (n+1)/2
- Si n pair : médiane = moyenne des deux valeurs situées aux positions n/2 et (n+2)/2
Comment calculer une moyenne tronquée ?
- Ranger les n valeurs par ordre croissant
- Retirer les (1%, 5%, 10%) des valeurs les plus extrêmes
- Calculer la moyenne arithmétique sur les valeurs restantes
la précision est grande quand ?
quand les différentes estimations d’une même quantité sont proches de la moyenne des estimations..
Biais
le biais est l’écart entre la vraie valeur et la valeur estimée en moyenne sur une infinité d’estimation.
Ex de biais
Si on demandait à une infinité de personnes d’estimer l’âge de quelqu’un, le biais serait la décalage entre la vraie valeur et la moyenne des estimations.
Exactitude
absence de biais
Les différents types de variables
Variable aléatoire
Variable discrète
Variable continue
Variable
expression qui peut prendre plusieurs valeurs différentes.
Variable aléatoire
variable dont la prochaine valeur ne peut être prédite.
Variable discrète
Nombre fini de valeurs possibles dans un intervalle
Variable continue
Nombre infini de valeurs possibles dans un intervalle
Comment calculer la déviation absolue médiane ?
- Calculer la médiane d’une série
- Mesurer, pour chaque valeur, les écarts à la médiane
- Prendre la médiane de ces écarts à la médiane
Quelles sont les données les plus fréquentes ?
Les données continues sont plus fréquentes que les données d’autres types.
Comment calculer une moyenne ?
il suffit d’additionner toutes les valeurs et de diviser la somme obtenue par le nombre de valeurs.
Si les données sont contaminées par une valeur aberrante, la moyenne ne sera pas très représentative.
Comment trouver la médiane ?
Il faut ordonner les valeurs de la plus petite à la plus grande afin d’identifier celle du milieu.
Si nombre de valeurs pair, la médiane est égale à ?
la médiane est égale à la moyenne des deux valeurs centrales
Comment obtenir la moyenne géométrique ?
s’obtient en prenant d’abord le logarithme de toutes les valeurs, puis en calculant la moyenne arithmétique de ces logarithmes et enfin en prenant l’antilogarithme de cette moyenne.
Pour quelles valeurs ne peut-on pas calculer la médiane ?
La moyenne géométrique ne peut pas être calculée si certaines valeurs sont nulles ou négatives.
Comment calculer la moyenne harmonique ?
en prenant l’inverse de chaque valeur et en calculant ensuite la moyenne arithmétique de ces inverses.
Pour quelles valeurs ne peut-on pas calculer une moyenne harmonique ?
Il n’est pas possible de calculer cette moyenne dans le cas où certaines valeurs sont nulles et elle n’a pas de sens si certaines valeurs sont négatives.
La moyenne tronquée
La moyenne tronquée est la moyenne de la plus grande partie des valeurs obtenues en ignorant les valeurs extrêmes.
Mode
la valeur la plus fréquente dans l’ensemble de données
Le mode est utile dans quel cas ?
Le mode peut être utile dans le cas de variables qui ne peuvent prendre que des valeurs entières.
Quelles sont les termes utiles qui expliquent la variabilité ?
Variabilité biologique
Précision
Biais
Erreur
Variabilité biologique
les humains diffèrent les uns des autres et ces différences sont importantes.
Précision
précis = répétable, reproductible.
Une méthode est précise lorsque plusieurs mesures donnent un résultat très semblable.
Erreur expérimentale : variation observée dans une suite de mesures répétées.
Biais
cela fait référence à tout ce qui conduit à des erreur systématiques.
Les données biaisées ne sont pas exactes.
Quand est-ce que un résultat est précis ?
un résultat est précis lorsqu’il est proche du chiffre correct
Erreur
ce terme est en relation avec toute source de variabilité, comme un synonyme de dispersion ou variabilité.
La médiane est le quantième centile ?
La médiane est le 50e centile. Le 50e centile est la valeur du milieu.
Comment appelle-t-on les 25e et 75e centiles ?
quartiles
L’écart interquartile
C’est la distance entre le 1e et le 3e quartile.
La moitié des valeurs se trouvent dans l’intervalle ainsi déterminé.
Diagramme en nuage de points
On peut voir la valeur la plus basse, la plus élevée et la distribution.
Une ligne horizontale est habituellement tracée au niveau de la moyenne ou de la médiane et parfois des barres d’erreur
Avantage d’une boite à moustache par rapport à un diagramme en nuage de points ?
Une boite à moustache donne une bonne idée de la distribution des données sans reprendre chaque valeur
Qu’indique la ligne horizontale de la boite à moustache ?
Une ligne horizontale indique la médiane de chaque groupe
Les boites à moustaches s’étendent de où à où ?
Les boites s’étendent du 1e au 3e quartile et incluent donc la moitié des valeurs.
Les valeurs indiquées individuellement par des points dans les boites à moustaches représentent quoi ?
Les valeurs inférieures au 5e centile et supérieures au 95e centile sont indiquées individuellement par des points.
Que représente les traits noirs dans un diagramme en violon ?
Les médiane et les quartiles sont indiqués par des traits noirs
C’est quoi une moyenne glissante, moyenne mobile ou données lissées ?
Lorsqu’on représente graphiquement des données qui évoluent au cours du temps, il est tentant de supprimer une grande partie de la variabilité de manière à rendre plus visible la tendance globale.
Quel est le problème avec le lissage ?
le lissage fait perdre de l’information