Examen 2 Flashcards

1
Q

Les degrés de liberté associés à un test t dépendant sont n1 + n2 – 2, alors que ceux associés à un test t indépendant équivalent à n – 1.

A

Faux, c’est l’inverse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Le test t pour échantillons dépendants porte souvent sur des échantillons ayant subit des mesures
répétées.

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Un test t dépendant peut ne pas être effectué avec les mêmes sujets.

A

Vrai. C’est le cas lorsque l’on utilise des sujets dits appariés, i.e. des sujets très fortement corrélés
par rapport à certaines caractéristiques précises (p. ex., le QI, le sexe, le niveau de scolarité,
l’âge).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Un des postulats primordiaux lorsque l’on effectue un test t pour échantillons indépendants est de s’assurer au préalable de l’hétérogénéité des variances de chacun des échantillons.

A

Faux. Il faut s’assurer de l’HOMOGÉNÉITÉ des variances.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Laquelle de ces hypothèses nulles correspond à un test t indépendant ?
a) H0 : µ = 100;
b) H0 : µ1 = µ2;
c) H0 : X”1 - X”2 = 0.

A

b)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Un test t pour échantillons indépendants se définit comme étant la différence des moyennes des
échantillons moins la différence des moyennes dans la population, le tout divisé par l’estimé de l’erreur standard des différences de moyennes dans l’échantillon.

A

Vrai.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Est-ce que le test t pour deux échantillons dépendants est plus puissant statistiquement que le test
indépendant. Expliquez brièvement votre réponse.

A

Oui, car il n’a pas à tenir compte de la variabilité entre les individus comme doit le faire le test t pour deux échantillons indépendants, étant donné que la mesure est prise chez la même personne ou chez des individus appariés. La mesure t est affectée par les différences individuelles pour le test t pour échantillons indépendants alors que celles-ci sont absentes dans le test t pour deux échantillons dépendants.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

On travaille avec la moyenne des différences lorsqu’il est question de test t pour échantillon indépendant. (Vrai ou faux)

A

Faux, c’est avec le test t pour échantillon dépendant.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Vous voulez savoir si les gens dépressifs ont un niveau de vigilance plus élevé le matin ou le soir.
Feriez-vous un test t pour échantillon dépendant ou indépendant ? Pourquoi ?

A

Un test t pour échantillon dépendant serait effectué, car il augmente la puissance statistique. Dans cette situation, les deux types de tests auraient pu être effectués, mais c’est celui pour échantillon dépendant qui serait privilégié.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Vous avez 6 groupes de jeunes étudiants à comparer par rapport à leur taux d’absentéisme en classe.
Si vous utilisez une série de tests t pour comparer les groupes au lieu d’une ANOVA, est-ce que la probabilité de faire une erreur de type I sera plus grande ou plus petite ?

A

Elle sera plus grande, et de beaucoup.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Combien de tests t différents devrez-vous faire pour comparer toutes les paires possibles de moyennes
du numéro 1 ? (6 groupes)

A

Vous devrez faire k(k-1)/2 = 6(6-1)/2 = 15 tests t différents pour comparer toutes les paires de moyennes possibles. Vous voyez alors l’utilité de l’analyse de variance!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

L’analyse de variance est un procédé statistique qui permet de comparer 3 moyennes de groupe simultanément, mais jamais plus. (vrai ou faux)

A

Faux. L’analyse de variance permet de comparer simultanément 3 moyennes ou plus.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Une analyse de variance déclarée significative indique où se trouvent les différences entre les moyennes de groupe. vrai ou faux

A

Faux, elle nous indique seulement qu’au moins deux moyennes diffèrent entre elles, mais pas plus.
C’est pourquoi on considère l’ANOVA comme étant un test global

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Concrètement, 2 sources de variation sont comparées lors d’une analyse de variance. La 1ère, la variation inter, correspond à la variation des scores des sujets à l’intérieur d’un même groupe. La 2e, quant à elle, est la variation intra, celle-ci correspondant à la variation entre les différents groupes ou
conditions.

A

Faux. C’est l’inverse; la variation inter correspond à la variation entre les différents groupes alors que
la variation intra correspond à la variation des scores des sujets à l’intérieur d’un même groupe.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Un carré moyen (CM) est une somme de carrés (SC) qui est divisée par son degré de liberté (dl) correspondant. vrai ou faux

A

Vrai.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Associez le terme à la bonne définition: CM intra et CM inter
a) Estimation de variance entre les groupes: ______________
b) Estimation de variance à l’intérieur des groupes: ___________

A

a) CM inter
b) CM intra

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

À quoi se résume la logique de l’additivité dans l’ANOVA à plan simple ?

A

Le degré de liberté total est égal à l’addition du degré de liberté intra avec le degré de liberté inter.
Aussi, la somme des carrés totale est égale à l’addition de la somme des carrés intra et de la somme
des carrés inter.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Vous voulez comparer l’effet de quatre techniques de relaxation chez les enfants. Chaque enfant effectue les quatre techniques et on veut voir s’il y a des différences entre chacune. L’ANOVA à plan simple est-elle appropriée dans cette situation ?

A

Non, car il s’agit de groupes dépendants alors que l’ANOVA à plan simple s’applique à des groupes
indépendants.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

vrai ou faux, pour un test t pour échantillons indépendants, Ho= (ų1-ų2) = 0

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

vrai ou faux, pour un test t pour échantillons indépendants, on peut avoir des n inégaux qui nécessitent une adaptation.

A

Vrai, on doit tenir compte du nb d’obs ayant servi à estimer chaque écart-type avec Sp^2 (une somme des variances pondérées par les degrés de liberté).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Vrai ou faux, on s’intéresse à la moyenne des différences avec le test t pour échantillon indépendants

A

Faux, on s’intéresse à la moyenne des différences D avec le test t pour échantillons dépendants.
Pour échantillons indépendants, on s’intéresse à la différence entre les moyennes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Vrai ou faux, peut importe la variabilité des scores à l’intérieur des échantillons, la variabilité des diff. D restera la même.

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Quel est l’avantage d’avoir des échantillons dépendants?

A

Quand on élimine la variabilité due aux différences individuelles, la variabilité au déno tend à réduire, donc t augmente.
Un t plus grand= + de chances de rejeter Ho= augmente la puissance statistique!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Comment se calcule la somme des carrés de l’erreur dans une ANOVA à mesures répétées ?

A

SCerreur = SCtotale - SCinter - SCsujet
ou
SCerreur= SCintra- SCsujet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Le terme d’erreur de l’ANOVA à mesures répétées (CMerreur) est-il plus petit ou plus élevé que celui
utilisé dans une ANOVA à plan simple (CMintra) ? Pourquoi ?

A

Il est plus petit, parce que l’on soustrait la somme des carrées sujet représentant la variabilité entre les
participants.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

L’ANOVA à mesures répétées est plus puissante que l’ANOVA à plan simple.
a) Vrai
b) Faux

A

Vrai. Comme le terme d’erreur est plus petit, le F sera plus grand, donc nous aurons plus de
chance de rejeter H0.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Une ANOVA à mesures répétées est effectuée chez 30 enfants (3 groupes) pour voir si leur production de langage
diffère lorsqu’ils sont à la maison, à l’école ou en laboratoire. Quel est:
a) Le degré de liberté inter ? ________
b) Le degré de liberté intra ? ________
c) Le degré de liberté total ? ________
d) Le degré de liberté erreur (résiduelle) ? ________

A

a) (K-1)= 2dl
b) K(n-1)=87dl
c) (N-1)=89dl (nb de mesures)
d)(n-1)(k-1)=58dl

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

L’analyse de variance doit révéler la présence d’au moins une différence significative entre les
moyennes pour pouvoir effectuer des tests de comparaisons a priori.
a) Vrai;
b) Faux.

A

Faux. Les tests a priori sont planifiés par le chercheur avant de commencer la collecte de données et
peuvent être effectués même si l’ANOVA ne révèle aucune différence significative entre les moyennes
(contrairement aux tests a posteriori!).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Un test a priori peut être appelé un test “post hoc”.
a) Vrai;
b) Faux

A

Faux. Ce sont les tests a posteriori qui peuvent être appelés ainsi.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Pourquoi doit-on faire un test de comparaison de moyennes malgré le fait qu’une analyse de variance ait
été effectuée auparavant ?

A

Un rapport F significatif nous indique simplement qu’il existe au moins une différence significative entre les moyennes. L’ANOVA ne nous dit pas quelles moyennes diffèrent les unes des autres. Les tests de comparaisons multiples a posteriori permettent de localiser les différences entre les
moyennes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

Vrai ou faux: il n’y a pas de justifications théoriques avant la collecte de données (analyse exploratoire) pour les tests a priori

A

Faux: Pas de justifications théoriques
avant la collecte des données (Analyse exploratoire) pour les tests à posteriori

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

Quelles sont les caractéristiques des tests a priori (3)?

A

1.Les comparaisons sont planifiées
avant la cueillette de données,
donc avant l’examen des résultats.

  1. Pas nécessaire que l’ANOVA soit
    significative pour faire les
    comparaisons prévues.
  2. Le choix des comparaisons est
    basé sur des raisons théoriques.
    Analyse confirmatoire
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

Vrai ou faux: pour le test a posteriori le chercheur veut effectuer toutes les comparaisons pairées possibles (k * (k - 1)/2 possibilités) et
Effectuer un test statistique qui
tient compte du nombre de
comparaisons effectuées
(p. ex., Tukey).

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

Vrai ou faux: Pour le test a posteriori, le chercheur ne s’intéresse qu’à
un nombre plutôt restreint de
comparaisons et
effectuer plusieurs tests t avec
une correction du niveau alpha en
fonction du nombre de
comparaisons effectuées
(p. ex., Bonferroni).

A

Faux, c’est avec le test a priori

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

À quoi correspond le q et le n dans la formule du qT pour le test de Tukey?
qT= q × racine( CMintra/ n)

A

n = nombre de participants par groupe.

q = valeur obtenue dans la table d’écart studentisé
(où r = nb de groupes et dl intra = dl intra de l’ANOVA).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q
  1. Deux sources principales permettent de décomposer la variabilité des données: La variation due au traitement (et à l’erreur) et la variation due à l’erreur.
    • L’ANOVA à plan simple et l’ANOVA à mesures répétées sont similaires en ce qui a trait à la variation due au traitement (et à l’erreur), mais non
    quant à celle due à l’erreur.

• Pouvez-vous expliquer la distinction ?

A

Dans l’ ANOVA à plan simple, il y a 2 types d’erreurs indifférenciées et dans ANOVA à mesures répétées, tout ce qui reste est l’erreur résiduelle, car on enlève les erreurs individuelles (ce sont les mêmes personnes à toutes les mesures). Donc le déno est plus petit dans les mesures répétées, ce qui augmente la puissance statistique
(déno + petit = F + grand
donc + en mesure de dépasser valeur critique et de rejeter Ho)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
37
Q

Les conditions d’utilisation de l’ANOVA à mesures répétées diffèrent légèrement de celles associées à l’ANOVA à plan simple. Dans un premier temps, les
échantillons doivent être dépendants. Une autre condition est différente entre les deux analyses.
A. Quelle est cette condition d’utilisation propre au plan à mesures répétées ?

B. Comment peut-on vérifier si cette condition est respectée ?

A

A. L’homogénéité des variances et des covariances.

B. Test de Mauchly

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
38
Q

La corrélation entre deux variables concerne le degré de relation entre celles-ci, ainsi qu’un lien de cause
à effet.
a) Vrai
b) Faux.

A

Faux. Il est vrai que la corrélation s’intéresse au degré de relation entre 2 variables, mais il est faux que l’on puisse établir un lien de cause à effet à l’aide d’une corrélation.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
39
Q

Lorsque la relation est nulle entre deux variables, r = 0.
a) Vrai;
b) Faux.

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
40
Q

Si j’obtiens une corrélation de .67, cela signifie que j’ai 67% de variance commune partagée par les deux
variables.
a) Vrai;
b) Faux.

A

Faux. Le coefficient de corrélation donne simplement une indication de la direction et de la force de la relation.

C’est plutôt le r^2 qui permet de connaitre le pourcentage de variance commune partagée entre les deux variables.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
41
Q

Le coefficient de corrélation varie uniquement entre 0 et 1.
a) Vrai;
b) Faux.

A

Faux. Il peut varier entre -1 et 1.

42
Q

+ l’étendue est petite, - les données tendent à varier. La restriction de l’étendue tend à diminuer la corrélation.

a) Vrai;
b) Faux.

A

Vrai. Le coefficient de corrélation est réduit lorsque l’étendue des scores X et/ou Y diminue.

43
Q

Nous savons qu’il existe une corrélation de 0 entre X et Y. Est-ce que cela signifie que tous les points de jonction entre X et Y se situent au même endroit dans le nuage de points ?
a) Oui;
b) Non.

A

Non. Cela veut dire que les variations d’une variable ne sont pas associées aux variations de l’autre variable dans le nuage de points.

44
Q

Peut-on obtenir une relation non linéaire entre deux variables ? Si oui, donnez un exemple.

A

Oui. Par exemple, l’habileté manuelle d’une personne augmente jusqu’à 20-25 ans et ensuite décline avec l’âge (courbe en U inversé). Il s’agit d’une relation quadratique.

45
Q

Parmi les facteurs suivants, lequel ou lesquels peut(vent) avoir un impact sur la corrélation ?
a) L’étendue des scores de X et/ou de Y;
b) L’utilisation d’échantillons dont les variances sont hétérogènes;
c) Le niveau alpha;

d) a et b;
e) b et c;
f) a et c;
g) a, b et c.

A

d. La valeur de l’alpha influence seulement la décision statistique.

46
Q

Le coefficient de corrélation est fortement influencé par les scores extrêmes.
a) Vrai;
b) Faux.

A

Vrai

47
Q

Il peut exister une relation entre X et Y même si le r de Pearson est de 0.
a) Vrai;
b) Faux.

A

Vrai. Il peut y avoir une relation non linéaire entre les deux variables.

48
Q

Pourquoi est-il toujours recommandé d’illustrer les points de jonction entre X et Y à l’aide d’un nuage de
points ?

A

Le nuage de points permet d’observer les données extrêmes et de vérifier si les postulats de la corrélation sont respectés.

49
Q

Pour vous aider à différencier les relations linéaires, donnez un exemple de la vie quotidienne d’une relation linéaire négative et un exemple d’une relation linéaire positive.

A

Voici des exemples:

Relation linéaire négative: Plus le nombre d’heures d’étude est élevé pour un examen, plus le nombre
d’erreurs est faible.

Relation linéaire positive: Plus le nombre d’heures d’étude est élevé, plus la note à l’examen est
élevée.

50
Q

Vrai ou faux: La corrélation permet d’établir une relation causale.

A

Faux

51
Q

Qu’est-ce que la définition de la corrélation?

A

Statistique qui permet d’estimer le degré de relation entre 2 variables (généralement mesurée sur les mêmes individus)

52
Q

Quelles sont les 3 conditions pour déterminer qu’un phénomène en cause un autre (lien causal)?

A
  1. La variable X et Y doivent être interreliées, il doit y avoir une relation entre les 2 variables (condition de relation).
  2. La cause doit précéder l’effet (condition d’antécédence temporelle)
  3. La relation entre X et Y ne doit pas être expliquée par une 3ième variable confondante (condition d’absence d’explications alternative)

*La seule condition remplie par la corrélation est la condition 1:)

53
Q

Quelle est la seule condition de lien causal remplie par la corrélation?

A

La condition 1 : La condition de relation (la variable x et y sont interreliées)

54
Q

Vrai ou faux: La corrélation est d’abord une statistique inférentielle, mais elle peut être une mesure descriptive.

A

Faux, c’est l’inverse : la corrélation est d’abord une mesure descriptive, mais elle peut aussi être utilisée comme statistique inférentielle.

55
Q

Vrai ou faux: la corrélation permet de détecter seulement les relations linéaires.

A

Vrai

56
Q

La relation cubique a combien de “changement de direction” (diapo15)?

A

2

57
Q

La relation quadratique a combien de “changement de direction” (diapo15)?

A

1

58
Q

Qu’est-ce qu’un coefficient de corrélation (def)?

A

Mesure standardisée de la covariance entre 2 variables.

59
Q

Quels sont les séparations dans le barème de Cohen?

A

1 ou -1 = Parfait
0.50 et + = Forte
0.30 à 0.49 = Modérée
0.10 à 0.29 = Faible
0 = Nulle

60
Q

Qu’est-ce que représente le r^2 pour la correlation et pour la régression?

A

Corrélation: % de variance commune entre les 2 variables.

Régression: Portion de la variabilité de Y qui peut être expliquée par X.

61
Q

Vrai ou faux: on utilise la table du t pour la régression.

A

Faux, on utilise le t pour la corrélation et le F de Fisher pour la régression.

62
Q

Énumérez les conditions d’utilisation de la régression linéaire simple (et de la corrélation de Pearson).

A

• Le n est suffisamment grand (≥ 20);
• Les 2 variables sont sur une échelle intervalle ou ratio;
• Relation linéaire entre les deux variables;
• Homogénéité des variances;
• Variables sont distribuées normalement.

63
Q

Pour quelles raisons faire un nuage de points (ou diagramme de dispersion) est important (suggéré)? (3 raisons)

A

1-Pour vérifier si les postulats sont respectés.
2-Pour détecter la présence de données extrêmes.
3-Pour évaluer l’étendue des données.

64
Q

Quelle est l’utilité statistique descriptive de la corrélation?

A

Le coefficient de corrélation nous informe à propos de le relation dans l’échantillon seulement (direction et force).

65
Q

Quelle démarche doit-on faire pour répondre à cette question:

“Est-ce que cette corrélation reflète une relation réelle dans la population ou si elle provient du hasard?”

A

Il faut calculer une valeur de t avec la distribution d’échantillonnage du t de Student

66
Q

Selon l’équation théorique de la régression (Ŷ = bX + a),
Ŷ = la valeur prédite de la variable Y,
b = la pente de la droite de régression,
a = l’ordonnée à l’origine.
a) Vrai;
b) Faux.

A

Vrai

67
Q

La pente d’une droite de régression représente le taux de changement moyen de Ŷ pour une unité de
changement de X.
a) Vrai;
b) Faux.

A

Vrai

68
Q

L’ordonnée à l’origine (a) représente la valeur de Ŷ quand X = 0.
a) Vrai;
b) Faux.

A

Vrai

69
Q

L’équation de régression cherche à réduire l’erreur de prédiction, laquelle représente la somme des carrés
des écarts entre la vraie valeur de Y et la valeur prédite de Y.
a) Vrai;
b) Faux.

A

Vrai

70
Q

Lorsque la prédiction est parfaite, l’ordonnée à l’origine est toujours égale à 0.
a) Vrai;
b) Faux.

A

Faux. La valeur de l’ordonnée à l’origine n’est pas un prérequis pour obtenir une prédiction parfaite.
Pour obtenir une prédiction parfaite, le coefficient de corrélation doit être de -1 ou de 1.

71
Q

Contrairement à la corrélation, la prédiction effectuée avec l’équation de régression permet de conclure
par rapport à un lien de cause à effet entre les deux variables.
a) Vrai;
b) Faux.

A

Faux. La corrélation et la régression ne permettent pas d’établir un lien de cause à effet. Elles permettent seulement d’identifier s’il existe une relation entre deux variables.

72
Q

Lorsqu’on a des n inégaux avec des échantillons indépendants, on doit adapter la formule pour trouver le t en remplaçant le Sp par le S^2p.
Que signifie le S^2p?

A

Le S^2p est une somme des variances pondérées par les degrés de liberté; donc qui tient compte de la taille de chacun des échantillons.
(Diapo 12)

73
Q

Quelles sont les 4 conditions d’utilisation du Test t pour échantillons indépendants?

A
  1. On a deux échantillons indépendants;
  2. Normalité de la distribution d’échantillonnage (n ≥ 30);
  3. VD sur une échelle intervalle ou ratio;
  4. L’homogénéité des variances.
74
Q

Comment calcule-t-on les dl pour le Test t pour échantillons indépendants?
(étape 3c) )

A

Distribution d’échantillonnage du t de Student avec ___ dl (n1 + n2 – 2)

75
Q

Dans le test T pour échantillons indépendants, quand doit-on prendre une valeur critique négative pour la conclusion du test unilatéral ?

A

H1: ų1 < ų2
Prendre la valeur négative, car
on s’attend à obtenir une
moyenne de différence
négative (μ1 – μ2 < 0)

76
Q

A quel test inférentiel cette affirmation correspond-elle:
Xij = μ + αj + εij
où Xij = Score de l’individu i dans le niveau j;
μ = Moyenne de la population (constante);
αj = Variabilité due à l’effet spécifique du niveau j;
εij = Variabilité reliée à l’individu i dans le niveau j (erreur).

*Ces sources de variabilités déterminent le score.

A

À l’ANOVA à plan simple (diapo 13)

77
Q

Dans l’analyse de variance, si les erreurs sont due au traitement, ò^2 inter devrait être plus grand que ò^2 intra, ce qui veut dire que le rapport F est > ou environ = à 1?

A

Le rapport F devrait être F > 1
(diapo 19)

78
Q

Vrai ou faux: On estime la probabilité d’obtenir la valeur F observée si la
seule source de variabilité est l’erreur (c.-à-d., H0 est vraie) à partir de la distribution d’échantillonnage du F de Fisher.

A

Vrai (Diapo 19)

79
Q

Vrai ou faux: Le CMinter est une bonne estimation de la variabilité des scores
dans la population seulement si H0 est rejetée.

A

Faux, seulement si Ho est vraie (diapo 22, cours ANOVA simple)

80
Q

Vrai ou faux: si H0 est vraie, le CM inter et le CM intra devrait être similaire.

A

Vrai

81
Q

Vrai ou faux: Le CM intra donne une estimation des scores de la population peu importe si H0 est vraie ou fausse, car la variance est calculée à partir de la variabilité à l’intérieur des groupes (peu importe si les groupes appartiennent ou non à la même population).

A

Vrai!!

82
Q

Quelles sont les 4 conditions d’utilisation pour l’ANOVA à plan simple?

A

On a des échantillons indépendants;
Distribution normale des scores;
Homogénéité des variances;
VD sur une échelle intervalle ou ratio.

83
Q

Comment fait-on pour calculer les dl inter et intra de la distribution du F de Fisher pour l’ANOVA à plan simple?

A

dlinter = k - 1 (k = nb de groupes)

dlintra = k(n - 1) (n = nb de sujets par groupe)

84
Q

Quels sont les avantages (3) et les inconvénients (2) de l’ANOVA à mesures répétées?

A

Avantages:
Plus puissants au plan statistique;
Permet de réduire la variabilité qui n’est pas due à la VI (l’erreur)
Nécessitent moins de sujets.

Invonvénients:
Effets de persistance et d’apprentissage.
S’assurer que le premier traitement n’aura pas d’influence sur le deuxième traitement, etc. (puisque les mêmes sujets sont testés dans chaque condition).

85
Q

Comment calcule-t-on le dl erreur?

A

SC erreur
dl erreur = (n-1)(k-1)
(diapo 18 anova répétée)

86
Q

Pour l’ANOVA à mesure répétées, quelle est la formule qui permet de calculer les scores?

A

Xij = μ + αj + πi + εij
où Xij = Score de l’individu i dans le niveau j;
μ = Moyenne de la population (constante);
αj = Variabilité due à l’effet spécifique du niveau j;
πi = Variabilité due l’effet spécifique du sujet i;
εij = L’erreur résiduelle (variabilité du sujet qui
demeure après avoir soustrait tous les autres termes
de l’équation).

87
Q

Quelles sont les conditions d’utilisation de l’ANOVA à mesures répétées? (4)

A

On a des échantillons dépendants;
Distribution normale des scores;
Homogénéité des variances et covariances;
VD sur une échelle intervalle ou ratio

88
Q

Comment calcule-t-on les dl pour une anova à mesures répétées?

A

Distribution d’ échantillonnage du F de Fisher avec 4 dl au numérateur (dl inter: k -1) et 32 dl au dénominateur (dl erreur: (n - 1)(k - 1)).

89
Q

Si on calcule la covariance de X et Y, est-ce qu’on obtient le coefficient de corrélation ?

A

Non, faut diviser la covariance de X et Y et les diviser ensemble par leur écart-type respectif

90
Q

Pour voir si la relation est linéaire…

A

… faire un nuage de points!

91
Q

Avec la corrélation, nous voulons établir la relation entre deux variables: variables corrélées ou corrélats.

Avec la régression, que voulons-nous faire?

A

Avec la régression, nous voulons prédire la valeur d’une variable (Y) avec une autre (X):
• VI: Variable prédictrice (X);
• VD: Variable prédite (Y).

*Attention, nous effectuons cette prédiction sur la base
de la relation entre les variables. Ceci ne signifie pas
que nous croyons qu’il existe un lien de causalité! Il est toujours impossible de satisfaire les 3 conditions essentielles pour un lien causal.

92
Q

Qu’est-ce que la droite de régression permet de faire?

A

La droite permet d’effectuer la meilleure prédiction de Y à partir de X.

La droite minimise l’erreur de prédiction et passe par un maximum de points

La droite passe par la moyenne des points du diagramme de dispersion

93
Q

À moins d’avoir une relation linéaire parfaite, il y aura des erreurs dans la prédiction de Y faites à partir de la
droite de régression.

Sachant cela, comment calcule-t-on l’Erreur de prédiction?

A

L’erreur de prédiction (ou résidu) c’est la différence entre le Y réel (observé) et le Y prédit (Ŷ).
Erreur de prédiction = (Y – Ŷ)

Pour chaque valeur de Y réel qui ne passe pas par la droite de régression, il y a un « résidu ».

94
Q

Pourquoi la somme des différences est au carré ?

A

Pour ne pas avoir une somme de 0 (ce qui arrivera si on additionne des écarts positifs et négatifs)

Σ(Y – Ŷ) = 0

95
Q

vrai ou faux: On souhaite que la somme de carrés soit la plus élevée possible.

A

Faux, on veut qu’elle soit la plus petite possible;
Plus elle est petite, plus les points sont près de la droite, meilleure est la prédiction (on fait moins d’erreurs).

96
Q

Vrai ou faux, dans l’équation de la régression, on cherche les valeurs de “b” et de “a” qui minimisent Σ(Y – Ŷ)^2.

A

Vrai!

97
Q

Vrai ou faux, l’ordonnée à l’origine peut ne pas avoir de signification selon les situations ou, à l’inverse, en avoir une.

A

Oui! (vrai)

98
Q

Quelles sont les raisons d’utiliser un coefficient de régression standardisé (ß)
au lieu d’utiliser uniquement le coefficient non-standardisé (b ou la pente)? (3)

A
  1. Indépendant de l’échelle de mesure
  2. Représente le changement de Ŷ en fonction du changement d’un écart-type (plutôt qu’une unité) de X
  3. Utile pour comparer l’importance relative de différents ß
    (p. ex., lorsqu’on a plusieurs variables prédictrices (x) en régression multiple).
99
Q

Que signifie r^2 en corrélation et en régression?

A

Corrélation:
r^2 = Meilleur indice de la qualité de la prédiction.
Plus r^2 est grand (plus la corrélation est forte), plus la prédiction est bonne (moins de chance d’erreurs de prédiction).

Régression:
r^2 = % de variance de Y qui est prédite par X.
• Ex : Avec un r^2 = 0.35, je peux prédire 35% de la variation des notes à l’examen (Y) à partir du nb. d’heures d’études (X).

100
Q

Vrai ou faux: Si la corrélation est significative, la régression l’est
nécessairement.

A

Vrai!

101
Q

Comment calcule-t-on les dl résiduel pour le F de la régression linéaire simple?

A

(n - 2)
n= nb total de participants