Cours 11 : Extension des méthodes vues à plusieurs variables explicatives Flashcards by frédérique Mathieu

Vrai ou faux? « Dans la plupart des situations réelles de recherche, la variable dépendante étudiée dépend de plusieurs variables explicatives potentielles (variables indépendantes). »

Vrai

How well did you know this?

Not at all

Perfectly

Quels sont les 3 designs expérimentaux qui permettent de mesurer la réponse d’un système à plus d’une variable explicative?

Blocking : permet d’améliorer la détection d’un effet en répartissant aléatoirement les sources de variabilité entre les blocs;
Design factoriel : permet d’étudier l’impact de 2 traitements (ou plus) et de leurs interactions;
Design qui ajuste pour l’impact de variables confondantes (ou covariables) lorsqu’on compare 2 ou plusieurs groupes (match and adjust).

How well did you know this?

Not at all

Perfectly

Quel est le point en commun entre l’ANOVA et la régression?

elles impliquent une variable réponse Y
qui peut être représentée par un modèle linéaire +
un terme d’erreur (résidus)

How well did you know this?

Not at all

Perfectly

Nommez les 3 précisions qui s’appliquent au modèle linéaire général?

La variable réponse doit être numérique;
La constante peut être différente selon le modèle : par ex. l’ordonnée à l’origine (régression) ou une moyenne générale (ANOVA);
Les variables explicatives peuvent être numériques (régression) ou catégorielles/factorielles (ANOVA), ou même les deux (ANCOVA).
L’effet des variables est inclus dans le terme associé qui correspond à une « pente ».

How well did you know this?

Not at all

Perfectly

Comment fait-on pour tester la significativité d’un modèle linéaire?

on compare sa performance à un modèle nul (modèle sans aucune variable explicative)

How well did you know this?

Not at all

Perfectly

Quelle est la SEULE différence notable entre l’ANOVA et la régression

ANOVA : variables explicatives sont catégorielles (des facteurs)

Régression : variables explicatives numériques et continues.

How well did you know this?

Not at all

Perfectly

Vrai ou faux? « Les modèles linéaires généraux peuvent représenter les interactions entre les variables explicatives, que l’on représente par le produit des effets des variables »

Vrai

How well did you know this?

Not at all

Perfectly

Parmi ces différents paramètres possiblement retrouvés dans un modèle linéaire général, nommer la fonction de chacun.

a) Y
b) μ
c) Xj
d) A et B
e) a et b

a) Y = réponse
b) μ = constante
c) Xj = Variable explicative numérique, avec j∈ [1,n]
d) A et B = Facteurs fixes (niveaux contrôlés dans des expériences)
e) a et b = Facteurs aléatoires (blocking ou autre effet non contrôlé)

How well did you know this?

Not at all

Perfectly

Vrai ou faux? « Les conditions d’application des modèle linéaires généraux sont les mêmes que celles pour l’ANOVA et la régression linéaire »

Vrai

How well did you know this?

Not at all

Perfectly

Quelles sont les conditions d’applications à respecter pour les modèles linéaires généraux?

Pour chaque combinaison de valeurs des variables explicatives Xj l’échantillonnage de la variable réponse Y est indépendant et aléatoire;
À chaque combinaison de valeurs des variables explicatives Xjcorrespond une distribution de valeurs Yi
normalement distribuée.
normalité & linéarité;
Pour chaque combinaison de valeurs des variables explicatives Xj, la variance de Y est indépendante de X ⟹homoscédasticité.

How well did you know this?

Not at all

Perfectly

Quel est l’autre façon de se référer à l’ANOVA à 2 facteurs?

2-way ANOVA

How well did you know this?

Not at all

Perfectly

Vrai ou faux? « On peut se servir de l’analyse graphique des résidus pour estimer si les conditions d’application sont remplies pour le MLG? »

Vrai

How well did you know this?

Not at all

Perfectly

Quels sont les 3 choses à observer sur le graphique pour pouvoir estimer que les conditions d’applications sont respectées?

Un nuage de points à peu près symétrique de part et d’autre de la ligne horizontale de zéro (normalité)
Pas de tendance notable selon les valeurs prédites (relation linéaire)
Étendue similaire des points de part et d’autre de la ligne horizontal de zéro = homogénéité des variances

How well did you know this?

Not at all

Perfectly

Pour quel types d’expériences (2) utilise-t-on le 2-way ANOVA?

Expérience de blocking

2. Expérience avec design factoriel

How well did you know this?

Not at all

Perfectly

Quelle est la formule pour une ANOVA à 2 facteurs, dans une expérience de blocking?

RÉPONSE = CONSTANTE + BLOCK + TRAITEMENT

How well did you know this?

Not at all

Perfectly

Vrai ou faux? « Dans un design par bloc typique, chaque niveau de traitement n’est présent qu’une fois par bloc (pas de réplicas). »

Vrai

Vrai ou faux? « Lorsqu’on fait un plan de blocking avec une ANOVA à 2 facteurs, on ne peut pas calculer la variance associée à la combinaison des niveaux de traitement et les blocs »

Vrai

Vrai ou faux? « La méthode de calcul des variances pour l’ANOVA est toujours la même, que les facteurs soient à effet fixe ou aléatoire »

Faux, changent selon que les facteurs sont à effet fixe ou aléatoire

Quelle est la formule pour une ANOVA à 2 facteurs, dans une expérience avec design factoriel?

RÉPONSE = CONSTANTE + A + B + A*B

où A et B correspondent à des traitements différents

Quel est le but ultime de l’ANOVA à 2 facteurs pour une expérience avec design factoriel ?

Mesurer l’interaction entre les facteurs

Vrai ou faux? « Dans le cas d’une ANOVA à 2 facteurs utilisée pour détecter les effets individuels et combinés (interaction) des variables d’un design factoriel, nous allons tester 3 jeux d’hypothèses nulles et alternatives. »

Vrai.

Hypothèses relatives au premier facteur
Hypothèses relatives au deuxieme facteur
Hypothèses relatives à l’interaction entre les facteurs

Qu’est-ce que la régression linéaire multiple?

une extension de la régression linéaire simple

Vrai ou faux? « Une régression linéaire reste linéaire même si une variable dépendante ou indépendante subit une transformation »

Vrai

Quel problème peut-on possiblement rencontrer lors de l’analyse de régressions linéaires multiples?

Multicolinéarité

Qu'est-ce que la multicolinéarité?

Problème qui survient lorsqu'aucun des coefficients estimés bj sont statistiquement significatif (t-test), mais que le modèle est quand même globalement significatif (test de F)

Vrai ou faux? « Le problème de multicolinéarité est couvert par les conditions d'applications »

Faux, il ne l'est pas et c'est pour ça qu'on doit absolument vérifier qu'on a pas de problème

Vrai ou faux ? « Quand la multicolinéarité est forte, les erreurs standards des coefficients estimés sont grandes et le risque est fort que les intervalles de confiance ne puissent pas exclure 0. »

Vrai

Comment peut-on déterminer s'il y a multicolinéarité?

1. inspecter la matrice de corrélation entre les variables indépendantes Xj OU 2. Utiliser le principe de parcimonie

Comment peut-on calculer le principe de parcimonie dans R?

En calculant le critère d’Information d’Akaike (AIC). | Plus il est faible, meilleur est le modèle

Quelles sont les étapes (7) de la régression linéaire multiple?

1. Définir les résultats attendus; 2. Définir les hypothèses statistiques; 3. Calculer les paramètres β̂j de la régression et les tester; 4. vérifier la colinéarité des variables Xj ⟹ recommencer à l’étape #3 si besoin 5. séléctionner le meilleur modèle; ⟹ recommencer à l’étape #3 si besoin 6. Vérifier les conditions d’application avec les résidus; 7. Évaluer le pouvoir explicatif des variables Xj sur la variable Y avec la valeur de R2 .

Vrai ou faux? « En biologie/écologie, des analyses de régression produisant un R2 > 0.5 représentent des relations fortes. »

Vrai

Vrai ou faux? « Comme une ANOVA, une ANCOVA cherche à déterminer l’effet d’un facteur sur une variable réponse numérique. »

Vrai

Dans quel cas est-ce que c'est utile d'effectuer une ANCOVA au lieu d'une ANOVA?

lorsqu’on ne peut pas réduire expérimentalement l’influence d’une covariable par blocking ou une autre méthode.

Quelles sont les hypothèses statistiques de l'ANCOVA?

H0 = le facteur n’a pas d’influence sur la moyenne de la variable réponse une fois l’effet de la covariable corrigée H1 = il y a un effet du facteur sur la moyenne de la variable réponse une fois l’effet de la covariable corrigée.

Quel est le modèle linéaire correspondant à une ANCOVA?

Réponse = Constante + Covariable + Facteur

Quelle est la condition qui est propre à l'ANCOVA?

il faut s’assurer de l’absence d’interaction entre la covariable et le facteur

Vrai ou faux? « L’ANCOVA est souvent utilisée pour tester l’égalité des pentes de régressions entre la variable réponse et une covariable parmi différents groupes »

Vrai