Statistiques descriptives Flashcards
3 façon de classer les distributions decdonnés
forme
moyenne
dispersion
Distribution de données à 2 piques
bimodale
pourquoi trier des données en ordre croissant
Un tableau avec les données classé dans un certain ordre permet de voir plus facilement les données extrême et une idée de la dispersion des données
Après avoir trier les données (plus petit au plus grand) on fait quoi?
un tableau de fréquence
comme un diagramme à bâton
Comment faire la boite moustache
séparer les données en 25e percentile
Que permettent les mesures de tendances centrale?
Ils permettent de se faire une idée plus complète sur une série statistique que ne peuvent le faire les graphiques et les tableaux seuls.
Utilité des tableaux vs les graphiques
Les tableaux servent à organiser les données et…
… les graphiques servent à donner une vue d’ensemble.
Quels indices permettent de savoir autour de quelles valeurs se
situent les valeurs d’une variable statistique
mode, médiane et moyenne
C’est quoi le mode
Mode (valeur dominante)
la valeur qu’on voit le plus souvent
Médiane c’est quoi et comment calculer
(chiffre au milieu) : (n+1)/2 si impair et Moyenne 2 chiffres au milieu si pair
c’est la moyenne ou la médiane qui n’est pas affecté par les valeur extrêmes
médiane
Qu’indique des valeurs similaires de mode médiane et moyenne?
la distribution est presque symétrique
C’est quoi l’étendu
max - min
mesure de la dispersion autour de la moyenne
écart type
C’est quoi le carré de l’écart type?
la variance
Qu’obtient-on en divisant l’écart type par la moyenne
le coefficient de variation
Une dispersion faible des données c’est un CV …
en bas de 15 %
Quartiles, nomme les et comment les calculer
Q1 sépare le 1er du 2e quart, n/4 (arrondi à l’ entier au dessus)
Q2 est la médiane sépare le 2e du 3e quart,
Q3 sépare le troisième du dernier quart
C’est la plus importante distribution en biostatistiques.
La distribution normal ou gaussienne
2 paramètre dont dépend la distribution gaussienne
moyenne et écart type
Dans la distribution normale, si la moyenne est de 0, l’écart type est de
1 = écart type
comment les paramètre de la distribution normale font bouger la courbe
moyenne : la fait glisser de gauche à droite sans modifier la forme de la cloche
écart type : modifie la forme de la cloche (plus étroite lorsqu’elle diminue) sans la déplacer de droite à gauche
Pourquoi il est préférable d’utiliser l’estimation par intervalle pour préciser l’intervalle à l’intérieur duquel le paramètre de la population est susceptible de se trouver.
Qu’on utilise la moyenne, le mode ou la médiane pour décrire la valeur de notre échantillon, il existe toujours un degré d’erreur sur l’estimation de cette valeur.
Un intervalle de confiance (IC) est
une gamme de valeurs dans
laquelle devrait se trouver le paramètre de la population.
Niveau de confiance est exprimer en %, lequel
IC > 95%, ==> conviction que la vraie moyenne de la population se situe dans l’IC
Comment calculer l’IC
IC= moyenne ± (1,96) (écart-type)
Pratique toi à calculer le trucs
oui okay cool
Différence entre H1 et H0
H1 : Basée sur cadre conceptuel (connaissances actuelles)
Postule sur l’existence de relations entre des variables (études corrélationnelles) ou de différences entre des groupes (études expérimentales)
H0 : Hypothèse contraire à l’hypothèse de recherche
C’est quoi un test d’hypothèse?
Dire que HO c’est de la merde pour que H1 ait de sens
C’est quoi l’erreur de type 1
erreur omission
on rejette l’hypothèse nulle alors qu’elle
est vraie.
C’est quoi l’erreur de type 2
Quand on ne rejette pas (accepte) l’hypothèse
nulle alors qu’elle est fausse.