Chapitre 5 Flashcards
Définir les concepts de variabilité intra échantillon et variabilité inter échantillon
Intra = la différence entre les individus d’un même échantillon par rapport à la moyenne de l’échantillon. Interprété comme une variation d’erreur, attribuable au hasard, non contrôlable.
Inter = la différence entre les différentes moyennes des échantillons et la moyenne de toutes les données. Cette valeur est attribuable aux différents traitements appliqués. Pas d’effet d’hazard.
Expliquer la relation existante entre la différence réelle des moyennes des échantillons à comparer et la différence entre les estimés de la variance (intra et inter) utilisés pour calculer la valeur F.
La différence réelle influence directement la variance réelle inter-échantillon. Donc lorsque la différence réelle entre les moyennes d’échantillons augmentent, plus la valeur de F augmente
Identifier différente sources de variations et de décomposer les degrés de liberté correspondants
Quel est le minimum de dl associés au terme d’erreur afin d’obtenir une puissance minimale
Variation intra échantillon, source d’erreur, aléatoire
Variation inter échantillon, relatif aux traitements
DL intra = [ nb observation -1 ] * nb traitement
DL inter = nb traitement - 1
DL total = [ traitement * obs ] - 1
dl min intra = 10
Effectuer les calculs relatifs à une analyse de la variance. Quels sont les étapes pour ce calcul?
- Calculer pour chaque traitement: Somme, Moyenne, Somme des carrés
- Calculer les sommes pour Somme, Somme carrés et faire la moyenne des moyennes
- Calcul de C = (somme des sommes)^2 / (rt)
- SCtot = Somme des sommes carrés - C
- SCtrait. = (somme des carrés des sommes) / r - C
- SCerr = SCtot - SCtrait
- d.l. traitement (inter) = (t-1)
d.l. erreur (intra) = r(t-1)
d.l. tot = somme des d.l. - Carrées moyens = S.C. / d.l.
- F = CM inter / CM intra
- Voir table de F et calculer P
Tableau ANOVA
Ligne sup = inter échantillons (traitements)
Ligne inf = intra échantillons (erreur)
Colonne 1 = source variation
Colonne 2 = d.l.
Colonne 3 = SC
Colonne 4 = CM
Colonne 5 = F
Colonne 6 = P
Lecture table F
Colone selon v1 = d.l. inter échantillon (trait)
Ligne selon v2: d.l. intra échantillon (erreur)
Le tableau donne la valeur F à une proba 1 - alpha P <
Relation entre test F et t
Si on a deux traitements, les résultats seront les même avec les 2 tests.
Aussi, t^2alpha(n2) = Falpha(1,n2)
Calcul d’erreur type d’une moyenne de traitements avec résultat ANOVA
S(y barre) = racine (S^2/r)
où S^2 = CM erreur
Calcul de l’erreur type d’une différence entre deux moyennes de traitements
S (Ybarre i et Ybarre i’) = racine (2 * S^2/r)
où S^2 = CM erreur
Calcul de coeff de variation de l’expérience
CV (%) = S/ybarre * 100
S = racine (S^2)
où S^2 = CM erreur
Différence entre un modèle mathématique type I et type II de l’ANOVA
Type 1, effets fixes (descriptif):
-Traitement fixe sur population fini
- Si on répète l’expérience, on prendra le même ensemble de traitements étudiés 0
Type 2, effets aléatoires (prédictif) :
- Traitement son une sélection aléatoire d’une population de traitements
- Une répétition de l’expérience portera sur un nouvel ensemble de traitements, mais tirés aléatoirement de la même population de traitement
Modèle mixte:
- Hybride avec effets fixes et aléatoires
Nommer et expliquer les différents postulats de l’analyse de variance.
- Échantillon représentatif. Sélection aléatoire
- Homogénéité de la variance de l’erreur expérimentale. Tous les groupes expérimentaux doivent avoir la même variance. Sinon perturbe l’équilibre entre les différentes comparaisons possibles. (groupes pas avec le même poids) F=inter/intra
- Distribution normale de l’erreur expérimentale. L’échantillon doit provenir d’une population normale. Moins important pour modèle à effets fixes
- Additivité des effets. Le modèle mathématique de l’ANOVA décrit une relation linéaire
Équation fondamentale ANOVA (2 équations, avec SC aussi)
SCtot = SCtrait + SCerreur ou sinon,
Yij = moyenne générale + effet du ieme traitement + erreur aléatoire jeme obs et ieme traitement
Ou erreur suis une distribution normale avec moyenne de 0 et variance de sigma^2
Nommer les différents tests de vérification de l’homogénéité de la variance et d’énoncer les principales règles relatives à la décision de transformer ou non les données.
Examen des données (graph var vs moyenne)
Analyse des résidus (régression)
Tests d’homogénéité de la var
- Bartlett
- Levene
Seulement ANOVA voie simple
Nommer les principales actions à prendre pour remédier à un problème d’hétérogénéité de la variance.
1.Transformation des données pour rendre les variances homogènes
2. Séparer les données en groupes, afin que les var à l’intérieur des groupes soient homogènes. Analyser chaque groupe séparément.
3. Éliminer données aberrantes
4. Pondérer des moyennes en fonction des variances
5. Tests non paramétriques, ou transformation en rang
6. Modèles mixtes
Nommer les principaux types de transformations des données possibles et de dire en quelles occasions chacune de ces transformations doit être utilisée.
Log: lorsque les effets des traitements sont multiplicatifs
Racine carrée: lorsque les données suivent un distribution de Poisson (nb compte). Ceci fait en sorte que l’écart-type = racine (moyenne). Souvent Racine(x + 0.5). Surtout lorsque 0 est fréquent
Cas fréquents de non-homogénéité de la variance
- Mise en commun de plusieurs expériences (essaie cultivars multi-sites)
- Témoin sans traitement
- Donnée aberrante
- Échantillon taille variable
Quand est-ce qu’il est pertinent de faire une transformation de données ?
Non-homogénéité de la variance de l’erreur
Non-normalité de l’erreur expérimentale
Non-additivité des effets
Aucune transformation peut compenser la non-indépendance des erreurs
À quoi sert le postulat d’indépendance des erreurs expérimentales ?
Erreur = Variation non contrôlée
- distribution aléatoire des traitements et des U.E.
Condition essentielle à la validité de l’ANOVA
Permet calcul des valeurs P associées aux SC
À quoi sert le postulat d’homogénéité de la variance de l’erreur expérimentale?
Validité de l’ANOVA
Condition fondamentale permettant la construction du test de F
À quoi sert le postulat de la distribution normale de l’erreur expérimentale ?
Échantillon provient d’une population normale (de moyenne 0 et variance sigma^2)
À quoi sert le postulat de l’additivité des effets?
Suivre le modèle mathématique linéaire de l’ANOVA