Statistiques Flashcards
Quel est la différence entre une population et un échantillon?
-Population : toutes observations possibles pour un groupe défini
-Échantillon : sous-groupe de la population (sélectionné aléatoirement
Quelles sont les statistiques qui décrivent une distribution de fréquence?
-moyenne
-médiane (0% de la distribution d’un bord, 50% de l’autre)
-mode (point le plus haut/classe plus fréquente)
-intervalle
-écart type
-variance
-CV
-intervalle interquartile
Qu’est-ce qui distingue une distribution unimodale et bimodale?
La distribution bimodale a 2 modes mais juste une médiane et une moyenne.
Qu’est-ce que la variance?
Écart type au carré
EXAM. Qu’est-ce que le CV et quelle est l’équation pour le calculer?
dispersion autour de la moyenne, écart-type relatif à la moyenne
CV = (écart-type / moyenne) x 100
Qu’est-ce que l’intervalle interquartile et comment on le calcule?
Mesure de dispersion pour distribution non gaussienne, intervalle entre 25e centile et 75e centile (représente le 50% du milieu de la distribution)
EI = Q3-Q1
À quoi sert un test de normalité et nomme une test pour calculer la normalité?
-Test permettant de savoir si tes résultats forme une cloche gaussienne (distribution symétrique autour de la moyenne).
-Test de Kolmogorov-Smirnov
Comment augmenter la normalité de ton test?
Augmenter la quantité de données ou raffiner les classes
J’ai une distribution normale, quel type de test devrais-je faire?
Un test paramétrique
J’ai des données qui ne semblent pas avoir une distribution normale, qu’est-ce que je peux faire?
Faire un graph en transformant les données (les mettre au carré ou faire le log)
Dans une distribution normale, quels sont les % des données dans +/-1, +/-2 et +/-3 écart-type?
+/- 1 écart type = 68.26% de la population
+/- 2 écart type = 95.44% de la population
+/- 3 écart type = 99.72% de la population
**on a environ 0.3% de chance d’être à plus de 3 écart-type de la moyenne, donc souvent on va refaire la mesure ou l’analyse avant de rejeter la données.
Qu’est-ce que l’erreur standard de la moyenne (SEM) et comment on la calcule?
Déterminer l’intervalle de confiance autour de la moyenne calculée (donne une idée si la moyenne est bonne ou pas)
SEM = écart type/ (racine carré de N)
Comment déterminer une vraie moyenne?
Exercice: en évaluant 31 contrôles de qualité, vous avez obtenu une moyenne de 210umol/L et un écart-type est de 4.2umol/L. Quel est le CV et entre quelles valeurs se situent la vrai moyenne?
Vraie moyenne = moyenne échantillon ± t* SEM (puisque pas possible de savoir la vraie moyenne d’une population)
CV = 4.2/210*100 = 2%
SEM = 4.2/√31 = 0,75 umol/L
Dans tableau de référence: t pour 95% de probabilité, bilatéral, avec 30 degrés de liberté (N-1) = 2,04
Donc: vrai moyenne = 210 umol/L ± (2,04 * 0,75 umol/L) = entre 208,5 à 211,8 umol/L, avec 95% de probabilité
Quand on compare 2 échantillons provenant de 2 populations, on observe des différences entre les moyennes et les écarts-types des 2 échantillons. Quelles sont les différentes hypothèses à tester pour savoir si la différence est réelle?
Hypothèse nulle ou alternative
Hypothèse nulle (Moyenne 1 = Moyenne 2, Variance 1 = Variance 2)
Hypothèse alternative (moyenne et variance différente)
-bilatérale (Moyenne 1 ≠ Moyenne 2)
-unilatérale: Moyenne 1 > Moyenne 2 ou Moyenne 1 < Moyenne 2
Dans quelle situation peut-on utiliser un test de T et quelles sont les 2 prérequis?
-utilisé pour comparer la moyenne de deux groupes
-les données doivent être distribuées de façon normale et avoir des variances similaires (tester avec test F)