Cours 11 : Extension des méthodes vues à plusieurs variables explicatives Flashcards
Vrai ou faux? « Dans la plupart des situations réelles de recherche, la variable dépendante étudiée dépend de plusieurs variables explicatives potentielles (variables indépendantes). »
Vrai
Quels sont les 3 designs expérimentaux qui permettent de mesurer la réponse d’un système à plus d’une variable explicative?
- Blocking : permet d’améliorer la détection d’un effet en répartissant aléatoirement les sources de variabilité entre les blocs;
- Design factoriel : permet d’étudier l’impact de 2 traitements (ou plus) et de leurs interactions;
- Design qui ajuste pour l’impact de variables confondantes (ou covariables) lorsqu’on compare 2 ou plusieurs groupes (match and adjust).
Quel est le point en commun entre l’ANOVA et la régression?
elles impliquent une variable réponse Y
qui peut être représentée par un modèle linéaire +
un terme d’erreur (résidus)
Nommez les 3 précisions qui s’appliquent au modèle linéaire général?
- La variable réponse doit être numérique;
- La constante peut être différente selon le modèle : par ex. l’ordonnée à l’origine (régression) ou une moyenne générale (ANOVA);
- Les variables explicatives peuvent être numériques (régression) ou catégorielles/factorielles (ANOVA), ou même les deux (ANCOVA).
L’effet des variables est inclus dans le terme associé qui correspond à une « pente ».
Comment fait-on pour tester la significativité d’un modèle linéaire?
on compare sa performance à un modèle nul (modèle sans aucune variable explicative)
Quelle est la SEULE différence notable entre l’ANOVA et la régression
ANOVA : variables explicatives sont catégorielles (des facteurs)
Régression : variables explicatives numériques et continues.
Vrai ou faux? « Les modèles linéaires généraux peuvent représenter les interactions entre les variables explicatives, que l’on représente par le produit des effets des variables »
Vrai
Parmi ces différents paramètres possiblement retrouvés dans un modèle linéaire général, nommer la fonction de chacun.
a) Y
b) μ
c) Xj
d) A et B
e) a et b
a) Y = réponse
b) μ = constante
c) Xj = Variable explicative numérique, avec j∈ [1,n]
d) A et B = Facteurs fixes (niveaux contrôlés dans des expériences)
e) a et b = Facteurs aléatoires (blocking ou autre effet non contrôlé)
Vrai ou faux? « Les conditions d’application des modèle linéaires généraux sont les mêmes que celles pour l’ANOVA et la régression linéaire »
Vrai
Quelles sont les conditions d’applications à respecter pour les modèles linéaires généraux?
- Pour chaque combinaison de valeurs des variables explicatives Xj l’échantillonnage de la variable réponse Y est indépendant et aléatoire;
- À chaque combinaison de valeurs des variables explicatives Xjcorrespond une distribution de valeurs Yi
normalement distribuée.
normalité & linéarité; - Pour chaque combinaison de valeurs des variables explicatives Xj, la variance de Y est indépendante de X ⟹homoscédasticité.
Quel est l’autre façon de se référer à l’ANOVA à 2 facteurs?
2-way ANOVA
Vrai ou faux? « On peut se servir de l’analyse graphique des résidus pour estimer si les conditions d’application sont remplies pour le MLG? »
Vrai
Quels sont les 3 choses à observer sur le graphique pour pouvoir estimer que les conditions d’applications sont respectées?
- Un nuage de points à peu près symétrique de part et d’autre de la ligne horizontale de zéro (normalité)
- Pas de tendance notable selon les valeurs prédites (relation linéaire)
- Étendue similaire des points de part et d’autre de la ligne horizontal de zéro = homogénéité des variances
Pour quel types d’expériences (2) utilise-t-on le 2-way ANOVA?
- Expérience de blocking
2. Expérience avec design factoriel
Quelle est la formule pour une ANOVA à 2 facteurs, dans une expérience de blocking?
RÉPONSE = CONSTANTE + BLOCK + TRAITEMENT
Vrai ou faux? « Dans un design par bloc typique, chaque niveau de traitement n’est présent qu’une fois par bloc (pas de réplicas). »
Vrai
Vrai ou faux? « Lorsqu’on fait un plan de blocking avec une ANOVA à 2 facteurs, on ne peut pas calculer la variance associée à la combinaison des niveaux de traitement et les blocs »
Vrai
Vrai ou faux? « La méthode de calcul des variances pour l’ANOVA est toujours la même, que les facteurs soient à effet fixe ou aléatoire »
Faux, changent selon que les facteurs sont à effet fixe ou aléatoire
Quelle est la formule pour une ANOVA à 2 facteurs, dans une expérience avec design factoriel?
RÉPONSE = CONSTANTE + A + B + A*B
où A et B correspondent à des traitements différents
Quel est le but ultime de l’ANOVA à 2 facteurs pour une expérience avec design factoriel ?
Mesurer l’interaction entre les facteurs
Vrai ou faux? « Dans le cas d’une ANOVA à 2 facteurs utilisée pour détecter les effets individuels et combinés (interaction) des variables d’un design factoriel, nous allons tester 3 jeux d’hypothèses nulles et alternatives. »
Vrai.
- Hypothèses relatives au premier facteur
- Hypothèses relatives au deuxieme facteur
- Hypothèses relatives à l’interaction entre les facteurs
Qu’est-ce que la régression linéaire multiple?
une extension de la régression linéaire simple
Vrai ou faux? « Une régression linéaire reste linéaire même si une variable dépendante ou indépendante subit une transformation »
Vrai
Quel problème peut-on possiblement rencontrer lors de l’analyse de régressions linéaires multiples?
Multicolinéarité
Qu’est-ce que la multicolinéarité?
Problème qui survient lorsqu’aucun des coefficients estimés bj sont statistiquement significatif (t-test), mais que le modèle est quand même globalement significatif (test de F)
Vrai ou faux? « Le problème de multicolinéarité est couvert par les conditions d’applications »
Faux, il ne l’est pas et c’est pour ça qu’on doit absolument vérifier qu’on a pas de problème
Vrai ou faux ? « Quand la multicolinéarité est forte, les erreurs standards des coefficients estimés sont grandes et le risque est fort que les intervalles de confiance ne puissent pas exclure 0. »
Vrai
Comment peut-on déterminer s’il y a multicolinéarité?
- inspecter la matrice de corrélation entre les variables indépendantes Xj
OU
- Utiliser le principe de parcimonie
Comment peut-on calculer le principe de parcimonie dans R?
En calculant le critère d’Information d’Akaike (AIC).
Plus il est faible, meilleur est le modèle
Quelles sont les étapes (7) de la régression linéaire multiple?
- Définir les résultats attendus;
- Définir les hypothèses statistiques;
- Calculer les paramètres β̂j de la régression et les tester;
- vérifier la colinéarité des variables Xj
⟹ recommencer à l’étape #3 si besoin - séléctionner le meilleur modèle;
⟹ recommencer à l’étape #3 si besoin - Vérifier les conditions d’application avec les résidus;
- Évaluer le pouvoir explicatif des variables Xj sur la variable Y avec la valeur de R2
.
Vrai ou faux? « En biologie/écologie, des analyses de régression produisant un R2 > 0.5 représentent des relations fortes. »
Vrai
Vrai ou faux? « Comme une ANOVA, une ANCOVA cherche à déterminer l’effet d’un facteur sur une variable réponse numérique. »
Vrai
Dans quel cas est-ce que c’est utile d’effectuer une ANCOVA au lieu d’une ANOVA?
lorsqu’on ne peut pas réduire expérimentalement l’influence d’une covariable par blocking ou une autre méthode.
Quelles sont les hypothèses statistiques de l’ANCOVA?
H0 = le facteur n’a pas d’influence sur la moyenne de la variable réponse une fois l’effet de la covariable corrigée
H1 = il y a un effet du facteur sur la moyenne de la variable réponse une fois l’effet de la covariable corrigée.
Quel est le modèle linéaire correspondant à une ANCOVA?
Réponse = Constante + Covariable + Facteur
Quelle est la condition qui est propre à l’ANCOVA?
il faut s’assurer de l’absence d’interaction entre la covariable et le facteur
Vrai ou faux? « L’ANCOVA est souvent utilisée pour tester l’égalité des pentes de régressions entre la variable réponse et une covariable parmi différents groupes »
Vrai