6. Comparaisons de moyennes Flashcards
Distribution Student
Base plusieurs tests comparaison moyennes
Raison : intervalle confiance autour moyenne estimé à partir échantillon obtenu avec
Test de Student (t-test)
Compare moyenne 1 échantillon à valeur seuil (H0)
Conditions
1. Échantillonnage indépendant/aléatoire
2. Varaible distribuée normalement
Vérifie si distribution unimodale/sans valeurs extrêmes/symétrique
Procédure : t-test
- Définit résultats attendu -> est-ce que moyenne significativement différent valeur seuil
- Pose H0/H1
H0 : pas différence entre moyenne et valeur attendue ( μ0 = ) -> H1 inverse ( μ0 ≠ ) - Caclul statistique de test : t
Formule : tcal = (X¯ − μ0) / SE -> proche 0 si pas différence significative
Où, X¯ : moyenne estimé
μ0 : valeur nulle/seuil
SE : s / √n - Choisi seuil significativité (α)
- Trouve t critique ou p-value
t critique -> table student, selon dl et α
p-value -> avec R (pt() ou t.test()) - Conclu
| t cal | > t crit -> rejette H0 (plus extrême)
Utilise absolue par t -/+, dû moyenne à 0 distribution Student
Rôle valeur critique/p-value
Comparer statistique de test avec distribution probabilité selon hypothèse nulle
Bilatéral
Zone de rejet répartie deux parties égales chaque côté distribution nulle
Donc α/2
Test de t pour 2 échantillons appariés
Compare moyenne réponse à 2 traitements pour même échantillon
Ex : avant/aprés, effet 2 doses, …
Permet minimiser influence facteurs confondants/covariables
Donc compare moyenne différences entre 2 jeux mesures à μ0 = 0 (valeur nulle/seuil)
Possible puisque même échanitllon
Pas différence -> moyenne différences = 0
Unité échanitllonnage : paire
Conditions
- Échantillonnage paires indépendant/aléatoire
- Différence paires distribuée normalement
Procédure : t-test 2 échantillons appariés
- Définit résultats attendu -> moyenne différences entre 2 échantillons appariés (d¯) significativement différente 0/hasard
Formule : d¯ = (∑n, i=1 (x1, i − x2, i)) / n - Pose H0/H1
H0 : d¯ = 0 (pas effet), H1 : d¯ ≠0 (effet) - Caclul statistique de test : t
Formule : tcal = (d¯ − 0) / SE - Choisi seuil significativité (α)
- Trouve t critique ou p-value
- Conclu
Vérification conditions applications
Suite pose H0/H1
Suite obtient mesures à utiliser (ex : d¯) Avec graphique (ex : histogramme)
Test de t pour 2 échantillons indépendants
Compare moyenne échantillons 2 populations différentesç
Différence dans calcul dl et SE
Fréquent conditions peut pas répété traitement sur mêmes individus
Ex : poids bébé selon consommation alcool
Condtions
- Échantillonnage paires indépendant/aléatoire
- Différence paires distribuée normalement
- Variance similaire 2 échantillon (homoscedasticité)
Statitique de test pour test 2 échantillons indépendants
Doit calculer variance conjointe (S2p)
Calcul : S2p = ( (n1−1)S21 + (n2−1)S22) / ((n1−1) + (n2−1))
S2p utilise calcul de SE
Calcul : SEp = √ (S2p (1 / n1 + 1 / n2))
Procédure : t-test 2 échantillons indépendants
- Définit résultats attendu -> est-ce que moyenne μ1 et μ2 significativement différente
- Pose H0/H1
H0 : μ1 et μ2 = 0 (pas différence), H1 : μ1 et μ2 ≠0 (différence) - Caclul statistique de test : t
Formule : tcal = μ1 - μ2 / SEp
Besoin S2p et SEp - Choisi seuil significativité (α)
- Trouve t critique ou p-value
dl = dl1 + dl2 = n1 + n2 - 2 -> distribution correspond dl conjoint - Conclu
| t cal | et t crit ou pvalue et α
Comparaisons indirectes
Parce que échantillons pas significativement différente autres, veut pas dire ce qui s’applique un s’applique à l’autre
Doit toujours comparer échantillon à valeur seuil, pas à autre échantillon
Ex :
Violations de conditions
Solutions;
- Ignorer violations
- Transformer données
- Utiliser test non paramétrique
- Utiliser test numérique de permutation
Ignore violations
Problème pose lorsque test formel
2 tests utilise vérifié conditions pour tests de Student
1. Test de Shapiro-Wilk -> normalité
2. Test de Levene -> égalité variance 2 ou + échantillons
Ignore si
- Normalité : symétrique et n > 30
- Variances : S difère max facteur 3 (S2 = 3 x S1)
Test comparaison moyenne reste robuste malgré non-respect des conditions
Test Shapiro-Wilk
Test ajustement données à Normale de même S et μ
Calcul : W = (∑n,i=1 (ai * x(i)) )^2 / ∑n,i=1 (xi − x¯)^2
x(i) -> (i) réfère i ème valeur plus petite, soit valeur ordre i
Donc valeur en ordre croissant
xi -> i réfère ligne i de échantillon
H0 : échantillon issu population normalement distribuée
Pas différence entre échantillon et distribution Normale même S et μ
H1 : échantillon pas issu population normalement distribuée
Rejet H0 avec p-value -> pas table de W
Calcul R : shapiro_test()