Cours 6 - Statistiques descriptives et inférentielles Flashcards
statistiques descritptives
- permet de décrire, démontrer, résumer données
- permet de détecter émergence de patterns dans échantillon
- svt en préambule à l’émission des hypothèses
nomme 4 grandes familles des statistiques descriptives
- mesures de fréquence
- mesures de tendance centrale
- mesures de dispersion
- mesures de position
statistiques inférentielles
permet d’effectuer généralisation, à partir d’un échantillon, vers une pop ou sous-pop
avec quoi calcule-t-on statistiques inférentielles
statistiques descriptives
peut-on utiliser statistiques descriptives pour établir relation de causalité
NON JAMAIS !!
comment sont présentées mesures de fréquence
souvent en forme de tableau ou graphique : en absolu ou relatif (%)
mesures de fréquence : comment présenter les données si sont continues
histogramme
mesures de fréquence : comment présenter les données si sont discrètes
diagramme à bâtons
mesures de tendance centrale
théorème limite central, loi normale, distribution normale ou courbe normale
mesures de tendance centrale : moyenne
somme des valeurs divisées par le nombre d’observation
mesures de tendance centrale : médiane
point milieu d’une distribution de données : 50% des données sont en inférieures à la Md et 50% sont supérieures à la Md
mesures de tendance centrale : mode
donnée la + populaire
dans une courbe normale, moy, md et mode sont comment
similaires!
skew (coefficient d’asymétrie) positif
prépondérance accrue des valeurs positives
skew (coefficient d’asymétrie) négatif
prépondérance accrue des valeurs négatives
mesure de position
quartiles !
quand utilise-ton quartiles
surtout utile pour distribution asymétriques
intéressant de se questionner si asymétrie est secondaire à phénomène clinique réel OU si secondaire à l’échantillonnage ou hasard
décris les moyennes, écarts-types, étendues
étendue de la distribution
distance entre la plus petite mesure et la plus grande mesure
concept de kurtose à revoir
lorsqu’élevé = courbe pointue // bas = courbe aplatie
médianes d’une distribution (avec quartiles)
Q1, Q2, Q3
étendue interquartile
longueur du rectangle : Q3 - Q1
variance de la distribution
somme des écarts par rapport à la moyenne au carré divisée par nombre d’observations.
sert à déterminer à quel point il y a différence entre données dans un groupe
sert à calculer écart-type
comment calculer l’écart-type (standard deviation) de la distribution
racine carrée de (somme des écarts par rapport à la moyenne au carré divisée par nombre d’observations)
ravine carrée de la variance
avantage du calcul de l’écart-type
donne une mesure positive! facilite opérations mathématiques ultérieures
écart-type de la pop versus de l’échantillon
erreur-type (standard error)
mesure de précision des observations
mesure de certitude sur la moyenne de ton échantillon
plus l’erreur type est petite, plus tu es certain que la moyenne que tu as calculé est juste
écart-type divisé par le nombre d’observation
influence de la taille de l’échantillon sur l’erreur-type
+ n est grand, plus SE est petit (bien!)
comment l’erreur-type nous aide à calculer in IC à 95%
score Z qui correspond à 95% = 1,96
IC à 95% = 1,96 x SE
erreur de type 1 (erreur alpha)
rejeter Ho à tort
on dit qu’il y a un effet alors qu’il n’y en a pas (faux positif)