Chapitre 7 : La régression linéaire simple Flashcards
Qu’est-ce que la régression linéaire simple?
La régression prédit la position probable d’une personne sur la variable y à partir de sa position connue sur la variable x. Le degré de précision de cette estimation dépend de la taille de la Rxy connue.
Pourquoi est-ce la régression est une meilleure estimation que la moyenne lorsque possible?
La psychologie s’intéresse aux différences individuelles, une estimation basée sur la moyenne est moins précise/utile.
Le but de la régression est d’utiliser la relation générale (Rxy) pour faire une prédiction individualisée et plus précise que celle faite par la moyenne.
Qu’est-ce qui permet une meilleure précision de la prédiction de la régression?
La précision de la régression s’améliore au fur et à mesure que Rxy augmente
Qu’est-ce que la régression simple standardisée?
- La régression standardisée se sert de la position en score-z de x afin d’estimer sa position en score-z sur y
- La régression simple standardisée sert à faire des prédictions plus théoriques (conclusions générales par rapport à une population), ce qu’on pourrait voir dans une revue scientifique
Qu’est-ce que la droite de régression?
- Elle représente la tendance des coordonnées xy
- Pour une régression standardisée, la droite passe toujours par 0 (ordonnée à l’origine)
- Pour une régression non standardisée, la droite ne passe pas par 0 (c’est possible, mais très rare)
- La force de prédiction est illustrée par la droite
Comment doit-on positionner la droite de régression?
- La droite est correctement positionnée lorsqu’elle représente le mieux la distribution des coordonnées
- La moyenne étant le meilleur estimé des coordonnées, la droite est bien positionnée lorsqu’elle se trouve à la moyenne du nuage de points
- Ainsi, il va avoir autant de points au-dessus que en-dessous de la moyenne
- La droite est au bon endroit lorsque la somme des écarts à la moyenne = 0
Qu’est-ce que nous indique l’angle entre la droite de régression et l’abscisse?
Il nous indique le degré de relation xy
Pourquoi est-ce que l’approche statistique de la régression est-elle plus utilisée que l’approche par positionnement?
- La régression est réduite au positionnement de la droite
- Le positionnement par graphique est facilement imprécis, lent et fastidieux, et n’est pas généralisable aux formes de régression plus complexes
Comment peut-on prédire y à partir de x?
La valeur prédite (ŷ) se trouve en multipliant la corrélation par le score-z de la valeur x de l’observation.
ŷ = rxy * zx
Quel est l’équivalent de Rxy dans une corrélation standardisée?
Rxy devient “béta”, le coefficient de régression standardisée.
Béta équivaut toujours à Rxy
Quel est l’équation de la régression simple standardisée?
ŷ = bx * zx
où b = béta (c’est notre indice qu’il s’agit du régression standardisée)
Quel est le principal inconvénient de la régression standardisée?
Avec l’approche graphique ou statistique, la régression standardisée a un inconvénient majeur : elle produit un estimé de y en score-z plutôt qu’en valeur de l’échelle originale
Ce n’est utile que si l’on cherche si une variable x a une influence sur une variable y, sur le plan théorique.
Qu’est que la régression simple non-standardisée?
- La régression NS analyse les données originales et produit un estimé en valeurs originales
- Mais les valeurs originales proviennent de distributions x et y qui n’ont pas nécessairement une moyenne et un s identique
- La droite sera établie en intégrant les moyennes et s de x et y
- Est utile lorsqu’on est sur le terrain et qu’on veut faire des prédictions pratiques dans la vie de tout les jours
Quels sont les deux éléments qui définissent la droite de régression?
L’ordonnée à l’origine et la pente
y - bx + a
À quoi correspond le coefficient de régression NS (soit “b”)?
Il s’agit de la corrélation Rxy calculée en valeurs réelles (et non pas en scores-z)
Requiert les moyennes de x et y et les s de x et y
“b” indexe numériquement la taille du changement sur y relativement à la taille du changement sur x