Anova à plan factoriel à mesures répétées et régression linéaire (3) Flashcards

1
Q

Quelle est la différence en l’ANOVA à plan factoriel et l’ANOVA à plan factoriel à mesures répétées?

A

Plan factoriel: les participants sont classés selon deux critères

Plan factoriel à mesure répété: les participants participent à plus d’une condition

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

V/F Dans l’ANOVA «standard», la variance intra-groupe était considérée comme de la variance due à l’erreur.

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

V/F L’erreur est réduite dans l’ANOVA simple à mesures répété. Explique

A

VRAI, Dans l’ANOVA à mesures répétées, le fait que l’on ait plusieurs mesures pour chaque personne fait en sorte
que l’on peut éliminer la variance due aux participants du terme d’erreur.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Dans l’ANova à plan simple à mesures répétées, en quoi se sépare la variation intra sujets?

A

Intertraitement + erreur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Dans l’ANova à plan simple à mesures répétées, en quoi se sépare la variation totale?

A

Inter sujets + intra-sujets

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Dans l’ANova à plan simple à mesures répétées, comment se calcul le SC erreur?

A

Scerreur= Sctotal - scsujets -sc temps

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Comment sont répartis les dl dans ANOVA à plan simple à mesures répétées?

A

Variation totale: kn-1
Inter-sujet: n-1
Intra-sujet: n (k-1)
Inter-traitement: k-1
erreur: (n-1)(k-1)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quelle est la différence entre le modèle de base et le modèle réaliste de Anova à plan simple à mesures répétées?

A

Ajout de π tij (interaction sujet x traitement)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Le rapport F ne permet pas d’isoler la contribution…… Le rapport F permet d’isoler la contribution…

A

1.Inter-sujet
2.Traitement

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Dans l’ANOVA à plan simple à mesure répétées, quelle est une condition d’application supplémentaire?

A

Symétrie composée des covariances. Cela signifie que les variances (diagonale) sont constantes et que les covariances (hors diagonale) sont constantes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

V/F La symétrie composéee de la matrice des covariances est souvent trop strictes.

A

VRAI
On la remplace généralement pas une condition plus souple : la «sphéricité» qui s’intéresse à la variance des différences entre traitements, plutôt qu’à la covariance entre les traitements.
* Si la symétrie composée de la matrice des covariances est respectée, alors la sphéricité l’est aussi
* Par contre, le contraire n’est pas toujours vrai.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quel test est utilisé pour vérifier la sphéricité?

A

Test de Mauchly, doit ne PAS être significatif

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qu’est-ce que la covariance

A

Degré auquel deux variables varient ensemble.
* Idée similaire à celle de la variance, mais pour deux variables

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Pourquoi la condition d’homogénéité des covariances n’est pas utilies dans les anova à groupes indépendants?

A

Dans le cas de groupes indépendants, les covariances seront de 0 si les cellules sont indépendantes
* On pourra donc s’intéresser seulement à l’homogénéité des variances (la diagonale)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Dans une Anova à plan factoriel à mesures répétées à plusieurs temps de mesure, quelles sont les 2 sources d’erreurs?

A
  1. Variation inter-sujet
  2. Variation temp X inter-sujet
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Dans une Anova à plan factoriel à mesures répétées à plusieurs temps de mesure, en quoi se divise la variation intra-sujet?

A

Temps, Temps X groupe et temps X inter-sujets

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Quelles sont les deux corrections possibles si la sphéricité n’est pas respectée? Quand utilise-t-on l’une ou l’autre?

A
  • Si E > 0.75, utilisez la correction de Huynh Feldt
  • Si E < 0.75, utilisez la correction de Greenhouse Geisser
18
Q

Qu’est-ce que la régression linéaire multiple? Compare la à la simple

A

La régression linéaire multiple reprend les mêmes principes de base de la régression simple, mais avec plusieurs prédicteurs (mais encore un seul critère).

Simple: On cherche «a» et «b» qui minimisent Σ (Y − ^Y)2
^Y = bx +a

Multiple: On cherche les «b» qui minimisent Σ (Y − ^Y)2
^Y = bo + b1x1 + b2x2 +….

19
Q

Dans la regression linéaire multiple, qu’est-ce que l’ordonnée à l’origine? Le coefficient de régression?

A

Ord à l’origine: bo

Coeff. de régression/pente: b1, b2, ….

20
Q

V/F Dans la régression simple, on veut minimiser l’erreur de prédiction.

A

Vrai, on veut minimiser ce que l’on appelle l’erreur résiduelle, ou «résidu». (minimiser Sommation de Y-^Y)^2
*Y= point observé pour un x
^Y=point sur la droite qui est prédite pour x

21
Q

Qu’est-ce qu’on recherche avec la régression linéaire multiple?

A

Proportion de variabilité «uniquement» expliquée par les variables

22
Q

Comment fait-on pour transformer un b en B (standardisé)?

A

B= bi Si (écart-type prédicteur) / Si0(écart-type critère)

23
Q

Comment fait-on un test de signification de b?

A

test t avec H0: bj = 0
t = bj - b
j/ sbj

24
Q

Quelle est l’une des grandes forces des régressions linéaires multiples?

A

Elles permettent de voir la contribution de chaque prédicteur en contrôlant statistiquement pour l’effet des autres.

En d’autres mots, les coefficients b ou Beta représentée la contribution unique de cette variable à l’équation de régression. Si une variable contribue conjointement avec une ou plusieurs autres variables à l’équation de régression, cette contribution n’est pas représentée par les coefficients b ou Beta .

25
Q

V/F Les coefficients b et B sont des
coefficients de régression partielle

A

Vrai, b (ou B, si vous préférez) est le coefficient de régression partielle qui représente la régression de Y en X1 lorsque l’on contrôle l’effet de X2

26
Q

v/F Habituellement, on utilise une de correction pour tests multiples lorsqu’il s’agit de tester le degré de signification des coefficients b d’une régression multiple

A

Faux, on peut le faire, mais ce n’est pas ce qu’on choisit habituellement.

Cette manière de faire est surtout basée sur la tradition. Traditionnellement, les régressions sont un outil utilisé par des chercheurs d’orientation «observationnelle», tandis que les ANOVAs (par exemple) sont avantage utilisées par les chercheurs d’orientation «expérimentale».
* La recherche observationnelle est heureuse de faire des découvertes fortuites, tandis que la recherche expérimentale cherche à contrôler le processus dans la mesure du possible.
* Dans la régression multiple, la valeur des coefficients (et dont leur pouvoir explicatif) nous intéresse davantage que l’idée de savoir s’ils sont significativement différents de 0

27
Q

Comment rapporte-on la régression linéaire multiple

A

R2 = [valeur], F([dlnumérateur], [dldénominateur]) = [valeur F], p = [valeur p] (R2 ajusté = [valeur])

28
Q

Quelles sont les conditions d’apllication de la régression linéaire multiple?

A
  1. Ratio cas : prédicteur (N ≥ 50 + 8m pour tester le coefficient de corrélation multiple N ≥ 104 + 8m pour tester les prédicteurs individuels, si a = 0,05 et puissance de 0,8)
  2. Absence de données extrêmes ou aberrantes (sur critière et prédicteur)
  3. Absence de multicolinéarité et de singularité
  4. Normalité, linéarité et homoscédasticité des résidus (vérifier en observant diagramme de points ayant valeurs prédites du critère en Y et les résidus en X.)
  5. Indépendance des erreurs (La statistique de Durbin-Watson peut être utilisée pour vérifier cette condition.)
  6. Absence de données extrêmes ou aberrantes dans la solution
29
Q

Différencie l’absence de données extrêmes ou aberrantes univarié et multivarié

A

DEA univariées : on peut calculer le score Z de chaque valeur et trouver les données avec les plus grands scores Z.

DEA multivariées : On peut utiliser le D de Cook pour le vérifier (il s’agit d’un indice qui représente l’influence de chaque unité d’observation sur l’équation de régression). Les valeurs de Cook qui semblent particulièrement grandes en comparaison aux autres peuvent indiquer la présence d’une donnée extrême ou aberrante.

30
Q

Différencie le principe du levier extrème et le principe de levier

A

Extrème: point loin du nuage de donné qui fait bouger la droite MAIS pas son angle (change ordonnée à origine)

Levier: Loin du nuage de point et influence l’angle (soit renforce la position existante OU SI levier + extrème va changer angle)

31
Q

Quelles sont les deux façon de vérifier l’absence de multicolinéarité et de singularité

A
  1. Observer les matrices de corrélations (Si les variables sont trop corrélées entre elles (colinéarité), cela peut poser problème.)
  2. Observer le VIF ( pas de barème unique accepté par tous, mais VIF >10 pourrait indiquer un problème).
32
Q

La statistique de Durbin Watson se tient entre…

A

0 et 4, mais plus souvent entre 1,5 et 2,5

33
Q

Nomme et défini les méthodes d’entrée des variables dans une régression linéaire multiple

A

Standard : On entre tous les prédicteurs dans l’équation en une seule étape et on interprète le modèle résultant.

Procédures pas-à-pas :
1. Méthode séquentielle par élimination : On entre tous les prédicteurs dans l’équation et on les retire une à une en commençant par celles qui contribuent le moins à l’équation de régression (et qui ne sont pas significatives). On essaie de maximiser le rapport R2 : nombre prédicteurs, ou de minimiser le rapport CMrésiduel : nombre de prédicteurs.
o On peut aussi utiliser une procédure séquentielle par entrée successive (on les entre une à une dans le modèle.

Méthode statistique (régression pas-à-pas) : On entre les prédicteurs un à un dans le modèle, en commençant par celui qui a la corrélation la plus élevée avec le critère. À l’aide de méthodes statistiques, on cherche la variable qui augmenterait le plus le plus le R2 du modèle, si elle y était ajoutée. On l’ajoute alors. On continue ainsi de suite jusqu’à ce que plus aucun ajout de variable n’apporte d’augmentation significative au R2 du modèle. Notez qu’à chaque étape, on se demande si l’une des variables doit être retirée du modèle puisqu’elle ne contribue plus significativement depuis l’addition des autres.

34
Q

Quelles sont les types de variables utilisées dans une régression linéaire multiple?

A

Souvent utilisé avec des prédicteurs continus ou approximativement continus. Cependant, on peut aussi utiliser des prédicteurs catégoriels en les codifiant de la bonne manière

35
Q

Dans l’ANOVA à plan simple à mesures répétées, comment se calcul la SC total?

A

Sc total= Sommation de (X-moyenn)^2

36
Q

Dans l’ANOVA à plan simple à mesures répétées, comment se calcul la SC intersujet?

A

Scsujet=t x (Sommation de (xsujet-moyenne)^2
t= temps/nb de temps de mesure

37
Q

Dans l’ANOVA à plan simple à mesures répétées, comment se calcul la SC intertraitement?

A

Sctemps=nx (Sommation de (xtemps-moyenne)^2
n= taille échantillon

38
Q

Dans l’ANOVA à plan simple à mesures répétées, comment se calcul le Finter-sujet dans le modèle de base VS le modèle réaliste?

A

Modèle de base
Fintersujet=E(CMinter-sujet)/E(CMerreur) = variance erreur +kvariance de constante sujet/ variance erreur

Modèle réaliste
Fintersujet=E(CMinter-sujet)/E(CMerreur) = variance erreur +kvariance de pi/ variance erreur + variance de constante sujet x constante traitement

39
Q

Dans l’ANOVA à plan simple à mesures répétées, comment se calcul le Ftraitement dans le modèle de base VS le modèle réaliste?

A

Modèle de base
Ftraitement=E(CMtraitement)/E(CMerreur) = variance erreur +nvariance de constante sujet/ variance erreur

Modèle réaliste
Ftraitement=E(CMtraitement-sujet)/E(CMerreur) = variance erreur +kvariance de pi + variance de constante sujet x constante traitement/ variance erreur + variance de constante sujet x constante traitement

40
Q

Dans l’ANOVA à plan simple à mesures répétées, les sujets varient en fonction de … (3 éléments)?

A

1- Effet du temps
2-Interaction temps x groupe
3- Interaction entre temps x inter-sujet(intragroupe) (bref caractéristiques perso)

41
Q

Dans l’ANOVA à plan simple à mesures répétées, si on prend la variabilité intra-sujet, qu’on extrait …(1)… ET ….(2)…., il ne reste que …(3), soit l’erreur.

A
  1. variabilité du au temps
  2. variabilité du a Interaction temps x groupe
    3.Interaction entre temps x inter-sujet(intragroupe) (bref caractéristiques perso)
42
Q

Par quel processus indentifie-t-on la droite qui minimise l’erreur de prédiction dans une régression linéaire multiple

A

calculs complexes qui demandent une bonne compréhension de l’algèbre matricielle