Cours 9 : La régression simple Flashcards
Vrai ou faux : il n’y a pas de différence entre un coefficient de corrélation de Pearson et le r d’une régression linéaire simple
Vrai, c’est la même chose.
Le ( ) ( ) dans la régression simple est l’équivalent du coefficient de corrélation dans une corrélation.
Le bêta standardisé dans la régression simple est l’équivalent du coefficient de corrélation dans une corrélation.
Qu’est-ce qu’une régression ?
Une manière de prédire la valeur d’une variable à partir d’une autre variable
Puisque la régression est un modèle hypothétique de la relation entre deux variables, est-ce qu’on s’attend à ce que les point soient obligatoirement sur la droite ?
Non, les points ne seront pas obligatoirement sur la droite, puisqu’il aura toujours de l’erreur
La régression est un modèle ____, qui se traduit par une ____
La régression est un modèle linéraire, qui se traduit par une droite
Donne une exemple de relation curvilinéraire, donc qui ne peut pas être représenter par une régression linéaire
La relation entre le stress et la performance est curvilinéraire.
Quelle est la différence entre un régression simple et une régression multiple?
Régression simple : 1 seul prédicteur pour une variable.
Régression multiple : Au moins 2 prédicteurs pour prédire une autre variable
Le comportement humain (phénomènes complexes) est souvent mieux représenté par une …
A) Régression simple
B) Régression multiple
C) Aucune des réponses
B) Régression multiple
Vrai ou faux : En ajoutant des variables, notre prédiction sera meilleure
Justifie
Oui, seulement si ces nouvelles variables explique de la nouvelle variance qui n’était pas déjà expliquée par les premiers prédicteurs.
Régression
Qu’est-ce que le bêta non standardisé (bi) représente dans une régression ?
3 éléments
- Coefficient de régression pour le prédicteur
- Pente de la droite de régression
- Direction de la relation (positive ou négative)
Qu’est-ce que représente le b0 (a) dans une équation de régression ?
- L’ordonnée à l’origine : Point où la droite de régression croise l’axe des Y.
Quand x = 0, y est de combien?
La distance entre les points et la droite de régression se nomme …
l’erreur
À partir de ces données, rempli l’équation pour la régression linéaire :
Heure d’étude (x) Note à l’examen (y)
Étudiant 1 : 0 heure d’étude, on obtenu 50 %
Étudiant 2 : 0 heure d’étude, on obtenu 50 %
Étudiant 3 : 1 heure d’étude, on obtenu 60 %
Étudiant 4 : 2 heure d’étude, on obtenu 70 %
Étudiant 5 : 3 heure d’étude ,on obtenu 80 %
Y = 50 + 10 (x) + e
Donc si j’ai étudié 3h…
Y = 50 + 10 (3)
= 80%
Régression linéaire
Si ma droite de régression prédit qu’avec 2h d’étude j’obtiendrai 70 %, mais que j’ai obtenu 72 %, que représente cette différence ?
Équation : Y = 50 + 10(x) + e
La distance entre les points et la droite représente l’erreur de prédiction
J’observe mes résultats de régression linéaire, et elle contient moins d’erreur que la grande moyenne, je peux donc dire que…
A) Mon coefficient de corrélation sera plus fort
B) Mon coefficient de corrélation sera moins fort
C) Mon test a plus de chance d’être statistiquement significatif
D) Mon test a moins de chance d’être statisitquement significatif
E) A et C
F) A et D
G) C et D
E) A et C
A) Mon coefficient de corrélation sera plus fort
C) Mon test a plus de chance d’être statisitquement significatif
Régression linéaire
Si j’obtiens un coefficient de corrélation d’une valeur de 1, on peut dire que…
A) X prédit parfaitement Y
B) Il n’y aura pas d’erreur de prédiction
C) La force de ma corrélation est modérée
D) Toutes ces réponses
A et B
Régression multiple
Vrai ou faux : Deux prédicteurs peuvent avoir la même ordonnée à l’origine, mais différent bêta non standardisé
Vrai
Exemple : Plus une thérapie est offerte plus l’état s’améliore (beta non standardisé positif) VS Plus une thérapie est offerte plus l’état de détériore (beta non standardisé négatif)
Régression
Vrai ou faux : Trois prédicteurs peuvent avoir le même coefficient de régression, mais différentes ordonnées à l’origine ?
Vrai
Par exemple :
Y = 70 000 + 10(x) + e
Y = 80 000 + 10(x) + e
Y = 90 000 + 10(x) + e
Régression
Si tous les points se retrouvent sur la droite de régression, qu’arrive-t-il à mon coefficient de corrélation ?
Il devient parfait !
r = 1
R2 = 100 %
Vrai ou faux : Le bêta standardisé figure dans l’équation de la droite de régression
FAUX. Le bêta standardisé (r) ne figure pas dans l’équation de régression.
Toutefois SPSS le calcule et le met dans la sortie pour que l’on voit la force de la relation.
Plus il y a de la distance entre les points et la droite de régression ….
A) plus la variance d’effet est augmenté, plus la variance d’erreur dimimue
B) plus la variance d’effet est diminuée, plus la variance d’erreur dimimue
C) plus la variance d’effet est diminuée, plus la variance d’erreur augmente
C) plus la variance d’effet est diminuée, plus la variance d’erreur augmente
Vrai ou faux : Il est théoriquement possible qu’aucuns des points d’une droite de régression ne soient sur la droite
Vrai car la régression est un modèle hypothétique.
Vrai ou faux : La droite de régression reflète la réalité puisqu’elle s’appui sur la théorie
Faux : Le modèle de régression linéaire ne reflète peut-être pas la réalité, c’est seulement un modèle basé sur les données on cherche à évaluer jusqu’à quel point le modèle correspond aux données observées
Régression multiple
Si le modèle de régression multiple permet une meilleure prédiction que l’utilisation de la grande moyenne, alors…
A) La somme des carrées du modèle (SSM) sera plus petit que la somme des carrés résiduels (SSR)
B) La somme des carrées du modèle (SSM) sera plus grande que la somme des carrés résiduels (SSR)
C) La variabilité entre le modèle et les données réelles sera plus petite
D) La différence entre le modèle et la grande moyenne sera plus grande
E) A et B
F) C et D
G) B, C et D
G)
B) Si le modèle est meilleur que juste prendre la moyenne, alors :
Il explique plus de variabilité de Y ⇒ SSM est grand
Il fait moins d’erreurs ⇒ SSR est petit
C) La variabilité entre le modèle et les données réelles sera plus petite : Mon modèle a donc peu d’erreur, cela représente un SSR petit
D) Le modèle s’éloigne de la moyenne s’il capte des tendances que la moyenne ne voit pas.
Donc SSM (la différence entre les prédictions du modèle et la moyenne) augmente.
Output SPSS
Dans le tableau SPSS, les données sont les suivantes; Si je fais une corrélation entre les 2 variables quel serait le coefficient de corrélation?
Constante : 134 140
Bêta non standardisé : 0,096
Bêta standardisé : 0,578
0,578 car le r est la même chose que le bêta standardisé!
Output SPSS
Dans le tableau SPSS d’ANOVA, les données sont les suivantes; Nomme le SSm, SSr, MSm, MSr et le SSt
Sum of squares:
Régression : 433
Residual : 862
Total : 1295
Mean Square:
Regression : 433
Residual : 435
Sum of squares:
Régression : 433 SSm
Residual : 862 SSr
Total : 1295 SSt
Mean Square:
Regression : 433 MSm
Residual : 435 MSr
Output SPSS
Dans le tableau SPSS, les données sont les suivantes ;
Coefficients non standardisé:
Constante : 2,2
Dummy variable 1 : 2,8
Dummy variable 2 : 1,00
Coefficients standardisés:
Dummy variable 1 : 0,773
Dummy variable 2 : 0,276
Q1: Quelle est la moyenne de chaque groupe?
Q2: Quelle est la corrélation entre libido et forte dose?
Q3 : Quelle est la corrélation entre libido et faible dose?
Q1:
Q2:
Q3: