statistiques descriptives Flashcards
quel est le but des statistiques?
=> répondre à une question concernant un collectif
une statistique ?
= état quantitatif qui décrit une caractéristique de la pop étudiée en se basant sur des observations
la statistique ?
= ensemble des méthodes permettant de réaliser de présenter d’analyser un état quantitatif afin de repondre a la question posée concernant un collectif
population ?
- ensemble sur lequel porte l’étude statistique = collectif
- peut être trans-temporelle
individus
- = éléments qui coomposent la population
- =mt appelé ind statistique ou unité satistiques
- peuvent être des objets ou vivant
échantillon
= une partie de la pop
variable aléatoire
ou caractère étudié
= propriétés qu’on va observer chez ind
modalités
- les différentes valeurs prises par la variable
- il existe différents types de variables aléatoire
variable aléatoire nominale
(caractériser par un nom)
- propriété étudiée est non chiffrable = qui ne peut pas se mesurer/ se chiffrer
que ne peut- on pas utilisé pour les variables aléatoire qualitative?
on ne peut PAS utiliser les indicateurs numériques SAUF les variables et les modes
est-ce qu’on peut dire qu’il y a une infinité dénombrable en theorie?
oui, mais en pratique on a unnombre fini de valeurs
variable aléatoire quantitative
- propriété étudiée est une variable numérique = qui peut se mesurer/ se chiffrer
- 2 types : VA quantitatives discrètes
VA quantitatives continues
VA quantitatives discrètes
- elles sont dénombrables
- prennent qu’un nombre fini de valeurs en pratique (mais en théorie une infinité dénombrale°
VA quantitatives continues
- elles sont indénombrables
- elles peuvent prendre toutes les valeurs possibles: finité de modalité possible
- peuvent discrétisées en classes = VA quantitatives continues que l’on rassemble dans desintervalles [vinf ; vsup[
quels sont les 4 grands principes pour réaliser une bonne études statistiques
- bien poser le problème: une question unique, contexte précis
- observations non biaisée : on réalise l’étude au plus près des réalités
- méthodes adaptées et définies: respect des conditions de validité / assurer honnêté des présentation
- conclusions claires avec intervalles d’incertitudes
les stat ont-elles des limites?
oui, qui sont la causes de méfiance de la pop et qui déteriorent réputation des stat
comment appelle-t-on le fait de faire pencher le résultat en sa faveur ?
= biais volontaire
c’est quoi le biais volontaire?
le fait de faire pencher les résultats en sa faveur
echantillonage c’est quoi?
- on n’étudie qu’un échantillon de la pop
- induit un écart aléatoire de réponse
- échantillon est grand - il y a de fluctuations
problème de l’echantillonage ?
comme on n’étudie qu’un échantillon il n’est pas identique à la population et les réponses diffèrent d’un échantillon à l’autre
comment on sait que échantillon estreprésentatif de la pop ?
c’est avoir un écart de réponse le + petit qu’il soit
que nécessite une représentavité de la pop?
il faut une équité de choix : chaque personne a la même probabilité de chance d’être intégrée dans l’échantillon
comment faire pour avoir une équité de choix
on effectue une randomisation : on prend des ind au hasard, il faut que tout le monde est la même chance d’être intégrer dans l’échantillon
que fait-on quand équité est respecté?
une analyse probabiliste
comment note-on une variable?
V
comment note-on une modalité
M
comment note-on les modalité de V indicée
J(1àM)
comme note-on la taille de l’échantillon?
N
comment note-on l’ind indicé
I(1 à N)
comment note-on la valeur de V pour l’ind i
Vi
une classe c’est quoi ?
une modalité d’expression
c’est quoi la valeur représentative d’une classe?
c’est le centre de la classe
formule de la modalité d’une classe
vj = vsup + vinf /2
à quoi correspond l’effectif
(de la modalité vj de V)
- note nj
- = nombre d’ind de l’échantillon ayant comme modalité vj
à quoi correspond l’effectif total
- = le nombre d’individus de l’échantillon
- souvent noté N
à quoi correspond la fréquence
( de la modalité vj de V)
- noté fj
- = fraction d’ind de l’échantillon ayant comme modalité vj
- = rapport de l’effectif d’une modalité par l’effectif total
formule de la fréquence ?
fj= nj/N ∈ [0;1]
en multipliant fréquence par 100, on obtient fréquence en %
avec quelles variables on peut utilisées la fréquence
quantitative ou qualitative
la moyenne c’est quoi ?
- noté me
- =quotient de la sommes de toutes les valeurs de la serie par l”effectif total N
avec quoi on peut calculer la moyenne ?
autre chose que l’effectif
avec la fréquence pour des valeurs par classes
me=f1v1+f2v2…+fMvM
V= modalité
à quoi est sensible la moyenne ?
aux valeurs extrêmes
elle donne une taille typique =mesure de la tendance centrale
la médiane ou centile 50
- noté med ou C50
- = au nombre qui sépare la serie statistique en deux
- 50% valeurs en dessous de la médiane et 50% au dessus
la médiane peut-elle être une valeur qui ne soit pas dans la série ?
oui
que nécessite la médiane
il faut ordonner modalité vi avant de la calculer
si n est pair comment savoir la médiane ?
on prend la moyenne des 2 valeurs du milieu
K=N/2
C50=(Vk+1)/2
si n est impair comment savoir la médiane?
K=(N-1)/2 et C50=Vk+1
la médiane est… …. d’où son utilisation en biologie
insensible au valeurs extrêmes
que ce passe-t-il si on a des valeurs symétriques ?
pour la moyenne et la médiane
la moyenne et la médiane seront identique!
que ce passe-t-il si les valeurs sont asymétrique
- c’est un indice d’asymétrie
- la médiane et la moyenne seront différenes
c’est quoi le mode ?
= la modalité vj de la variable ayant un maximum local de fréquence
=modalité ayant + grand nombre d’effectif ou la plus gde fréquence localemt
comment appelle-t-on le mode pour une VA quantitative
(discrétisée en classe)
on parle de classe modale
c’est quoi la distribution multimodale
(bimodalte, trimodale…)
il peut avoir plusieurs sommets( plusieurs effectifs / fréquences qui ressortent) il y a autant de modes que de pics
même si sommet pas égaux chaque sommet est considéré comme un mode
c’est quoi la variance?
(d’échantillon)
- notée Se^2
- =mesure de dispersion des valeurs de V par rapport à la moyenne
variance formule
=moyenne des carrés des écarts entre la modalité vi et la moyenne me
Se² = n1(x1-me)²+…+nn(xn-me)² / N
formule écart entre la moyenne de la variable au carré et la moyenne au carré :
Se^2 = n1x1^2+…nnxn^2/N - me^2
formule variance de la fréquence
pour des valeurs classés
Se^2= (f1.x1^2)+…+ (fn.xn^2)-me^2
par quoi est attiré la médiane ?
par le pic modal (elle se rapproche des valeurs avec beaucoup d’effectif)
cf p26 cours imprimé du tutorat
par quoi est attiré la moyenne ?
la traîne (elles est plus sensible aux valeurs extrèmes)
cf p26 cours imprimé du tutorat
comment sont les résultats de la variance?
la variance donne les résultat au carré
que caractérise l’écart type?
- la dispersion des valeurs autour de la moyenne
- c’est la racine carré de la variance
- on conserve l’unité
formule écart type ?
√Se^2
que fait-on quand on normalise valeurs de la VA?
- on divise les valeurs de la VA
- on prend Se pour unité
- V’=V/Se Se sans unité
c’est quoi l’étendue ?
la différence entre la modalité de la variable la plus élevée et la modalité de la variable la plus basse
formule de l’étendue?
etendue = max(vi)-min(vi)
c’est quoi la valeur absolue
= moyenne de la valur absolue des écart de la moyenne
particularité l’écart moyen en valeur absolu?
- il conserve l’unité
- il peut donner idée de la valeur de la valeur absolue
indicateurs de liaison_
la covariance c’est quoi ?
- =indicateur de liaison de 2 caractères quantitatifs X et Y
- il permet d’établir un lien ou non entre 2 variables
- caratérise une relation linéaire endtre 2 variables
indicateurs de liaison_
formule de la covariance
= écart entre la moyenne des produits de X et Y et le produit des moyennes de X et de Y
covexy = (1/N Σ xi.yi)-xe.ye
indicateurs de liaison_
qu’obtient-on avec la covariance?
une unité bizarre qui correspond à l’association des uintés de chaque variable
indicateurs de liaison_
la corrélation c’est quoi?
=au rapport de la covariance de X et de Y par le produit des écarts types de X et de Y
indicateurs de liaison_
formule corrélation
correxy= covExy/ Sex.Sey
indicateurs de liaison_
qu’obtient-on avec la corrélation?
- une mesure sans unité et sans dimension
- indépendante du choix d’unité, on peut donc s’affranchir des unité
indicateurs de liaison_
comment seront les valuers de la corrélation?
entre -1 et +1
indicateurs de liaison_
valeur de la correlation si il n’y a pas de correlation?
- =0
- X varie indépendamment de Y=> les deux variables sont indépendantes
indicateurs de liaison_
si corrélation est positive ?
- les 2 variables se suivent dans le même sens
- X augmente quand Y augmente et inversement
si corrélation est négative
les 2 variables se suivent en sens opposé
X diminue quand Y augmente ou inversemnt
si ‘lon a une relation linéaire/ de proportionnalité
- on obtient -1lorsque X et Y sont inversement proprtionnels parfait
- on obtien +1 lorsque X et Y sont proportionnels parfaits
pourquoi les tables sont intéresantes à étudier?
elles donnent une information morphologique élevée sur la répartition des valeurs de V
les tables de fréquences simples montrent quoi?
- effectif nj et/ou fréquence fj associé a la modalité (lignes)
- m modlaités d’une variable V (colonnes)
cf p 29 cours tuto imprimés
à quoi servent les tables de fréquences simples?
donner la répartion des valeurs de chaques classes
les tables de fréquences cumulées c’est quoi?
chaque effectif remplacé par la somme de tous les précédents pour les tables cumulées croissantes
ou la somme de tous les suivants pour les tables cumulées décroissantes
cf p 30 cours tuto imprimé
À quoi servent les tables croisées?
(ou de contingence)
à visualiser la relation entre 2 variables quantitatives ou entre 2 variables qualitative
comment on fait une table croisée?
- en tête de colonne on met les modalités m1j de la variable 1
- en tête de ligne on met les modalités m2k
- dans chaque case se place effectif/ou fréquence de la combianison des modalités m1j et m2k
cf p 31 cours tuto imprimé
que représente une marge ?
=totaux d’une ligne ou d’une colonne donc d’une m1j ou m2k
que représente les totaux d’une ligne ou d’une colonne
une marge
comment appelle-t-on les valeurs qu’on obtient suite à la marge ?
les valeurs marginales
c’est quoi les valeurs marginales ?
c’est les valeurs qu’on obtient suite à la marge
que montrent les tables croisées?
elles montrent un lien possible entre les variables = relation de dépendance
c’est quoi une relation de dépendance ?
un lien possible entre les variables
quelle information vont donner les graphiques ?
m^me info que les tables, mais on a appréciation visuelles instantanée=> risque d’erreurs d’interprétation
le graphique en barre c’est quoi ?
- comme un histogramme sauf que **seule hauteur des barres compte, surface des barres n’a aucune importantce )
on l’utilise avec quelle types de variables ?
quantitative ou qualitative , mais il est + interessant avec var qualitatice
au niveau de l’axe des abscisses et ordonnées que va-t-on retrouvés pour graphique en barre ?
- axe abs : modalités de la var
- axe ordo : effectifs
c’est quoi le graphique en batons ?
même que celui en barre mais on peut utiliser plus de modalités.
effectifs proportionelles aux hauteurs
pour quelle type de variables graphique en bâtons est utilisé ?
var quantitative discrètes
graphique des centiles c’est pour quel type de variables ?
var quantitatives
que va-t-on avoir sur l’axe des abscisses et des ordonnées pour graphique centile ?
la série de valeurs (n valeurs vi) est placée au préalabe dasn ordre csst
* axe abs: n valeurs de vi mises en ordre
* axe ordo: graduations de 0 à 1 correspondant aux centiles
que va-t-on imaginer pour graphique des centiles ?
un escalier à n marches, hauteur marche = 1/n.
un point est placé au milieu de la montée d’une marche
escalier peut-être éffacé si on a peu de point
centile de valeur k est obtenu en rendant la valeur d’abscisse qui donne k/100
À chaque fois qu’on monte une marche =1ne valeur
voir p 32 cours imp tuto
le graphique des centils est il une courbe ?
non c’est une suite de points
grap des centiles
que ce passe-t-il qaund la pente est forte ?
il y a bcp d’ind quand pente est faible on a peu d’ind
le graphique des centiles c’est l’image expérimentale de quoi ?
fonction de repartition ( var quanti discèrete )car il montre répartition cumulée.
quels sont les avantages qu graphique du centiles ?
- pas nécessaire de mettre en classe
- on voit directement où il y a le plus de valuers (la pente est forte donc bcp de valeurs)
avec quelle var on va utiliser le graphique cartesien ou XY ?
var quanti continues ou discrètex
que permet le graphique cartésien ?
- mettre en relation 2 var X et y quanti
- étude corrélation des 2 var
que va-t-il avoir en abs et en ordo pour graph cartésien ?
- abs :variable X
- ordonée var Y
- un ind est représenté par un point de coordonée (xi,yi)
dans le graph cartésien que va-t-on regarder pour étudier ce graph ?
- linéarilité ou non du nuage de points .
- si points sont ordonées => dépendance
- ce grap permet de ne pas calculer à mauvais escient une corrélation linéaire
quelle var pour histogramme ?
caractères quantitatif continue discrétisée en classes => var continues
c’est quoi un histogramme ?
- effectifs de la var sont répartis en classe
- surface des rectangles proportionelle à l’effectif total et la surface de chaque rectangle est proportionelle à l’effectif de la classe
- représentation expérimentale de la fonction de densité
quand les effectifs vont êtres proportionnelles aux hauteurs pour graph histo ?
quand les classes sont de mêmes largeurs
c’est quoi un polygone de fréquence ?
- obtenu en traçant des segments joignant les milieux des sommets des rectangles
- surface sous les polygones = surface des rectangles
- correspond à une fonction de densité
quels graphique utilisé pour graphique de fréquence ?
graphique circulaire
que permet de visualiser le graph circulaire ?
l’importance d’un modalité pour un tout = repérer les parties d’un tous
quelle est sa forme au graph circulaire ?
- un disque dont la surface correspond à la taille de l’échantillon
- le secteur du disque et son angle est proportionnel à la fréquence de la modalité ou à l’effectif
- possible convertir en histo mais moins bien et var doit être continue discrétisée en classe
quels sont les autres graphiques ?
- courbes ( X et Y quantitatives)
- graphes polaires (r quantitatif)
- À boîtes à moustaches ( Y quantitatif, X quantitatif classé ou quali )
- en violons (var qaunti )