analyse de variance (5) Flashcards
utilité du test student T
comparer 2 groupes indépendants
condition pour pouvoir utiliser le test student
homogénéité des variances (égalité)
suppositions du test student (4)
- normalité des moyennes (on veut distribution normale)
- homogénéité des variances
- indépendance des observations
- indépendance des échantillons
hypothèses du test student
H0 : deux moyennes sont égales (µo = µ1)
H1 : deux moyennes sont différentes (test bilatéral)
dans quel cas utiliser le test ANOVA
lorsqu’on a plus que 2 moyennes à évaluer
que signifie analyse de variance
variabilité totale est décomposée en plusieurs composantes (somme de carrés) selon le modèle utilisé.
à quoi s’applique anova
mesure d’une ou plusieurs variables discrètes explicatives (indep) dont les différentes modalités sont appelées niveaux et influencent la distribution d’une variable continue à expliquer (dép)
dans quel cas anova est = au test T?
lorsqu’on veut comparer 1 facteur à 2 niveaux
anova 1 facteur : que représente i et j
i : niveau de tx (a)
j : individu (n)
hypothèse qu’on cherche à rejetter
H0
anova : unique source de variabilité
groupe de tx
anova : méthode pour décomposer la variabilité totale et mesurer la variabilité globale des données
somme de carrés
différence entre Yi et Yi (avec barre)
Yi : somme des groupes
Yi avec barre : moyenne des groupes
variabilité totale vs inter-groupe vs intra-groupe
- totale : distance de chq observation p/r à la moy globale
- inter-groupe : compare les moyennes des groupes avec la moyenne globale
- intra-groupe : compare les valeurs à l’intérieur de chq groupe p/r à la moy du groupe
que fait la somme de carrés due au facteur A
compare les moyennes ds tx entre elles
cmt sera la somme des carrés si les moyennes diffèrent bcp
grande (donc le facteur aura un effet)
que fait la somme de carrés résiduels
mesure ampleur des erreurs aléatoires (à quel point les données sont variables dans chaque groupe)
degré de liberté
nbr de valeurs dans le calcul final d’une statistique qui ne sont pas fixes. si on connait la valeur d’une statistique, c’est le nbr de valeurs requises pour connaitre toutes les valeurs
statistique de test F
degrés de liberté associés aux sommes de carrés avec lesquels on peut construire les carrés moyens puis la statistique du test
inconvénient ANOVA
- permet pas de détecter les différences de moyennes 2 à 2 –> comparaisons multiples
analyse de la covariance
mélange de anova et régression linéaire permettant d’analyser l’effet du groupe tout en corrigeant pour une ou plusieurs tierce variable continue.
si la covariable n’est pas d’intérêt, pk on l’utilise
elle peut influencer la variable dep et doit être prise en compte
expliquer le concept de la répartition de la variabilité
une partie de la variabilité résiduelle est remplacée par la covariance, ce qui va augmenter la précision en réduisant la variance due aux erreurs (aug test F)
hypothèses quant à la covariable (3)
- covariable (x) doit être reliée à la variable dépendante (y), sinon : pente horizontale et la covariable est inutile
- relation entre x et y est linéaire
- effet de la covariable est le même pour tous les groupes (parallélisme des pentes)
avantages du plan factoriel
- plus de précision pour estimer les effets principaux
- possibilité d’étudier les interactions entre facteurs
exemple de situation qui nécessite anova à 2 facteurs
savoir si la prise de repas aura un effet sur la réponse PK. 2 formulations (réf vs test) et l’effet du repas (repas vs à jeun) donc 4 groupes au total
que permet de faire anova à 2 facteurs?
tester la présence d’interaction entre les 2 facteurs
anova à 2 facteurs : que signifie l’absence d’interaction
différence des moyennes obtenue en variant un facteur est la même quelque soit la modalité fixée de l’autre facteur
pk l’interprétation de l’effet d’un facteur principal est simplifié sans interaction
avec une interaction, l’effet d’un facteur dépend du niveau de l’autre facteur
déf interaction
l’effet d’un facteur dépend du niveau d’un autre facteur
anova à mesures répétées
- lorsqu’on prend plusieurs mesures sur une même unité expérimentale (ex: individu)
- dépendance entre les observations
exemple d’anova à mesures répétées
- prise de glycémie chez un patient chaque 6 mois pour savoir si la [sucre] diminue avec le temps
- admin successive de tous les niveaux de tx au patient
avantages de anova à mesures répétées
- moins de sujets nécessaires
- moins de variabilité
- augmente précision
- effet comparable pour chaque sujet (sujet est son propre contrôle)
désavantage de anova à mesures répétées
faut bien capturer et modéliser la dépendance entre les données
anova à facteur répété
sert à évaluer l’effet de tx différentes sur un paramètre d’intérêt, mesurer plusieurs fois chez un même sujet
anova à facteur répété : sources de variabilité
- groupe de tx
- répétition chez sujet
anova à facteur répété : somme des carrés
sera encore plus décomposée (variabilité intra-sujets est séparé en 2)
anova à facteur répété : effet de la somme des carrés décomposée
augmenter la valeur de la statistique F et augmente puissance du test qui détecte différences entre moyennes
bloc randomisé
- utilisé quand il pourrait y avoir de la variabilité quant à un facteur
- on ajuste le facteur en le séparant en morceaux (blocs) pour avoir des unités homogènes à l’intérieur desquelles on fait de la randomisation
bloc randomisé : cmt sont les tx
les tx sont soumis à différentes conditions de façon équivalente et chaque bloc contient tous les tx
carré latin
extension du bloc randomisé qui permet de contrôler pour 2 facteurs de nuisance
exemple d’utilisation du carré latin
- on veut mesurer l’effet de l’humidité mais il se peut qu’elle soit pas répartie également dans toute la cage
- il faut que chaque niveau de tx soit représenté sur chq étage et chq zone d’humidité
chassé croisé
- chaque sujet recoit successivement les 2 tx et devient son propre témoin
- faut étudier l’effet des tx en tenant compte de l’ordre d’admin
avantages chassé croisé
- chq sujet = son propre témoin (- de variaibilité)
- moins de sujets nécessaires (plus efficaces)
désavantages chassé croisé
- période de wash out
- difficile pour le patient
- souvent pour maladies chroniques
V ou F : chassé croisé est une extension du carré latin
V
chassé croisé : sources de variabilité
- intra-sujets : variabilité des résultats obtenus pour A et B dans le même sujet
- inter-sujet : variabilité des résultats obtenus entre sujets A et B séparément
effets fixes
modalités utilisées sont les seuls intérêts pour lesquels on veut une conclusion
effets aléatoires
modalités utilisées pour l’effet aléatoire sont un échantillon de toutes celles dispo. on veut pas comparer les modalités entre elles