6. Comparaisons de moyennes Flashcards

1
Q

Distribution Student

A

Base plusieurs tests comparaison moyennes

Raison : intervalle confiance autour moyenne estimé à partir échantillon obtenu avec

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Test de Student (t-test)

A

Compare moyenne 1 échantillon à valeur seuil (H0)

Conditions
1. Échantillonnage indépendant/aléatoire
2. Varaible distribuée normalement
Vérifie si distribution unimodale/sans valeurs extrêmes/symétrique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Procédure : t-test

A
  1. Définit résultats attendu -> est-ce que moyenne significativement différent valeur seuil
  2. Pose H0/H1
    H0 : pas différence entre moyenne et valeur attendue ( μ0 = ) -> H1 inverse ( μ0 ≠ )
  3. Caclul statistique de test : t
    Formule : tcal = (X¯ − μ0) / SE -> proche 0 si pas différence significative
    Où, X¯ : moyenne estimé
    μ0 : valeur nulle/seuil
    SE : s / √n
  4. Choisi seuil significativité (α)
  5. Trouve t critique ou p-value
    t critique -> table student, selon dl et α
    p-value -> avec R (pt() ou t.test())
  6. Conclu
    | t cal | > t crit -> rejette H0 (plus extrême)
    Utilise absolue par t -/+, dû moyenne à 0 distribution Student
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Rôle valeur critique/p-value

A

Comparer statistique de test avec distribution probabilité selon hypothèse nulle

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Bilatéral

A

Zone de rejet répartie deux parties égales chaque côté distribution nulle
Donc α/2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Test de t pour 2 échantillons appariés

A

Compare moyenne réponse à 2 traitements pour même échantillon
Ex : avant/aprés, effet 2 doses, …
Permet minimiser influence facteurs confondants/covariables

Donc compare moyenne différences entre 2 jeux mesures à μ0 = 0 (valeur nulle/seuil)
Possible puisque même échanitllon
Pas différence -> moyenne différences = 0

Unité échanitllonnage : paire

Conditions

  1. Échantillonnage paires indépendant/aléatoire
  2. Différence paires distribuée normalement
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Procédure : t-test 2 échantillons appariés

A
  1. Définit résultats attendu -> moyenne différences entre 2 échantillons appariés (d¯) significativement différente 0/hasard
    Formule : d¯ = (∑n, i=1 (x1, i − x2, i)) / n
  2. Pose H0/H1
    H0 : d¯ = 0 (pas effet), H1 : d¯ ≠0 (effet)
  3. Caclul statistique de test : t
    Formule : tcal = (d¯ − 0) / SE
  4. Choisi seuil significativité (α)
  5. Trouve t critique ou p-value
  6. Conclu
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Vérification conditions applications

A

Suite pose H0/H1

Suite obtient mesures à utiliser (ex : d¯)
Avec graphique (ex : histogramme)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Test de t pour 2 échantillons indépendants

A

Compare moyenne échantillons 2 populations différentesç
Différence dans calcul dl et SE

Fréquent conditions peut pas répété traitement sur mêmes individus
Ex : poids bébé selon consommation alcool

Condtions

  1. Échantillonnage paires indépendant/aléatoire
  2. Différence paires distribuée normalement
  3. Variance similaire 2 échantillon (homoscedasticité)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Statitique de test pour test 2 échantillons indépendants

A

Doit calculer variance conjointe (S2p)
Calcul : S2p = ( (n1−1)S21 + (n2−1)S22) / ((n1−1) + (n2−1))

S2p utilise calcul de SE
Calcul : SEp = √ (S2p (1 / n1 + 1 / n2))

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Procédure : t-test 2 échantillons indépendants

A
  1. Définit résultats attendu -> est-ce que moyenne μ1 et μ2 significativement différente
  2. Pose H0/H1
    H0 : μ1 et μ2 = 0 (pas différence), H1 : μ1 et μ2 ≠0 (différence)
  3. Caclul statistique de test : t
    Formule : tcal = μ1 - μ2 / SEp
    Besoin S2p et SEp
  4. Choisi seuil significativité (α)
  5. Trouve t critique ou p-value
    dl = dl1 + dl2 = n1 + n2 - 2 -> distribution correspond dl conjoint
  6. Conclu
    | t cal | et t crit ou pvalue et α
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Comparaisons indirectes

A

Parce que échantillons pas significativement différente autres, veut pas dire ce qui s’applique un s’applique à l’autre

Doit toujours comparer échantillon à valeur seuil, pas à autre échantillon

Ex :

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Violations de conditions

A

Solutions;

  1. Ignorer violations
  2. Transformer données
  3. Utiliser test non paramétrique
  4. Utiliser test numérique de permutation
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Ignore violations

A

Problème pose lorsque test formel
2 tests utilise vérifié conditions pour tests de Student
1. Test de Shapiro-Wilk -> normalité
2. Test de Levene -> égalité variance 2 ou + échantillons

Ignore si

  1. Normalité : symétrique et n > 30
  2. Variances : S difère max facteur 3 (S2 = 3 x S1)

Test comparaison moyenne reste robuste malgré non-respect des conditions

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Test Shapiro-Wilk

A

Test ajustement données à Normale de même S et μ
Calcul : W = (∑n,i=1 (ai * x(i)) )^2 / ∑n,i=1 (xi − x¯)^2
x(i) -> (i) réfère i ème valeur plus petite, soit valeur ordre i
Donc valeur en ordre croissant
xi -> i réfère ligne i de échantillon

H0 : échantillon issu population normalement distribuée
Pas différence entre échantillon et distribution Normale même S et μ
H1 : échantillon pas issu population normalement distribuée

Rejet H0 avec p-value -> pas table de W

Calcul R : shapiro_test()

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Limite Shapiro-Wilk

A

Si nombre observations assez grand chque échantillon (30-50) et pas trop asymétrique ignore Shapiro-Wilk
Fie juste graphique

Plus n grand, plus intervalle confiance étroit -> petite variation cause rejet H0
Test devenu trop puissant

17
Q

Test Levene

A

Permet tester si variance 2 groupes égale/similaire -> si hétéroscédasticité

H0 : variance similaire
H1 : variance différente

Rejette H0 si p-value < α

Calcul R : leveneTest (), package car
p-value = Pr( >F )

18
Q

Transformations données

A

Doit effectuer transformations à tous jeux de données
Fait tests sur données trasnformées

  1. Transformation logarithmique
  2. Transformation racine-carré
  3. Transformation arcsinus
19
Q

Transformation logarithmique

A

Transforme avec log (log 10, ln, …)
Calcul : Y′=log( Y + 1 )
+1 si présence 0
Pas possible valeurs négatives

Efficace Y avec grande étendue et quelques valeur élevées (skew négatif)
À utiliser avec valeurs distribué log-normale
Avantage : aide obteni variances similaires
Première à essayer
Donc applique à : masse, taille, concentration, données étendues, ratios, taux, distribution asymétrique, groupe plus grande moyenne aussi plus grande variance

20
Q

Transformation racine carré

A

Calcul : Y′ = √Y
Pas possible valeurs négatives

Efficace pour donnée énumération
Ex : # oeufs pondus, # proies capturées, …

21
Q

Transformation arcsinus

A

Calcul : Y’ = arcsin(√Y)

Presque juste pour proportions

  • Pas distribué normalement
  • Entre 0 et 1
  • Échantillons moyennes proportions différentes tendance avoir variances différentes
22
Q

Utiliser test non paramétrique

A

Permet affranchir majorité conditions applications
Dû travail avec rang valeurs pas valeurs elle-même
Donc utilise pas fonction de densité comme distribution nulle

Moins contraignant -> moins puissant
Un peu plus dure rejette H0 si fausse

Utilise lorsque

  • Pas possible admettre distribution paramétrique aux données
  • Échantillon aléatoire et indépendant
23
Q

Test des rangs signés de Wilcoxon (noté V)

A

Pour échantillons appariés/une moyenne
Principe : quantifier si différence réponses traitements chacun individu i grande
Plus différence grande, plus V grand

Veut comparer effets 2 traitements sur même échantillon
(X1,Y1), (X2,Y2), …, (Xn,Yn)

Hyp 1 : cas bilatéral
H0 : traitement équivalent/pas différences
H1 : un meilleur autre
Hyp 2 : cas unilatéral
H0 : traitement équivalent/pas différences
H1 : A meilleur B

24
Q

Procédure : test rangs signés de Wilcoxon

A
  1. Pose H0/H1
  2. Place différence couple ordre croissant
    Calcul : Di = Xi − Yi
  3. Attribue rang
    Si Di négatif -> rang négatif
    Si Di = 0 -> rang 0

Avec R : wilcox.test ()

25
Q

Test de Mann-Whitney

A

Test non-paramétrique pour échantillons indépendants

Calcul R : wilcox.test( modèle ( … ~ … ), paired = FALSE)

26
Q

Procédure : test de Mann-Whitney

A
  1. Pose H0/H1
  2. Mélange toutes les valeurs
  3. Classe valeurs ordre croissant et attribue rang
    Si Di négatif -> rang négatif
    Si Di = 0 -> rang 0
  4. Calcul somme rang pour chaque échantillons
  5. Calcul statistique test U
  6. Compare à valeur critique suit loi de distribution U
  7. Conclu