Cours 11 - la régression linéaire simple Flashcards
Que pouvons-nous prédire avec la régression?
La valeur d’une variable Y avec une autre X
VI: Variable prédicatrice (X)
VD: Variable prédite (Y)
Qualité de la prédiction repose sur quoi
Sur la force de la relation linéaire entre deux variables
Plus la corrélation entre les variables est élevée, plus il sera facile de prédire une variable à partir de l’autre
Effet de la droite de régression sur l’erreur de prédiction
Elle minimise l’erreur de prédiction et passe par un maximum de points
Avec une corrélation parfaite, quel est l’effet sur la droite de régression?
Chaque Y prédit sera identique au Y réel, il n’y aura aucune erreur de prédiction
Erreur de prédiction
- À moins d’avoir une relation linéaire parfaite, il y aura des erreurs dans la prédiction de Y faites à partir de la droite de régression
- L’erreur de prédiction c’est la différence entre le Y réel et le Y prédit
Erreur de prédiction = Y réel - Y prédit - Pour chaque valeur de Y réel qui ne passe pas par la droite de régression, il y a un résidu
- On vise à minimiser les écarts entre les valeurs observés et les valeurs prédites
Pourquoi la somme des différences est au carré?
Pour ne pas avoir une somme de 0
On souhaite que la somme de carrés soit la plus petite possible: plus elle est petite, plus les points sont près de la droite, meilleure est la prédiction
Équation de régression
Y prédit = bX + a
où
X = la valeur du prédicteur
b = la pente de la droite de régression (coefficient de régression)
a = ordonnée à l’originie
Afin de trouver une droite qui offre la meilleure prédiction de Y pour une valeur de X:
- On cherche les valeurs de a et b qui donneront la fonction linéaire la mieux ajustée
- On cherche les valeurs de b et de a qui minimisent
Interprétation de la droite de régression
- O-O peut avoir signification: lorsqu’on veut connaître le niveau de base
- Pente : nombre d’unités de changement de Y prédit en fonction d’un changement d’une unité de x.
Pourquoi utiliser un coefficient de régression standardisé?
- Indépendant de l’échelle de mesure
- Représente le changement de Y prédit en fonction du changement d’un écart-type de X
- Utile pour comparer l’importance relative de différents coefficient de régression standardisé
Quel est le meilleur indice de la qualité de la prédiction?
r au carré: plus r carré est grand, plus la prédiction est bonne (moins de chance d’erreurs de prédiction)
Quel est l’objectif du test d’hypothèse sur la régression?
Détermine si la prédiction de Y prédit par X est généralisable à la population
Qu’est-ce qui est comparé lors de la démarche inférentielle
Variabilité de Y qui est attribuable à X vs Variabilité de Y qui n’est pas attribuable à X
Sommes des carrées
SCtotale = variation totale de Y
SCrégression = variation de Y expliquée par X
SCrésiduelle = variation de Y non expliquée par X
Test de la pente
SPSS: vérifie si b n’est pas égal à 0 à l’aide d’un test t