Cours 8 : La régression multiple I Flashcards
La régression linéaire simple - Permet quoi, c’est quoi?
Permet d’examiner la relation entre deux variables CONTINUES à l’aide de la droite de régression
C’est quoi une droite de régression (vrm si en fin de bac on a pas cette réponse y’a un problème)
Le meilleur ajustement linéaire entre les variables continues X et Y sous la forme de Y = bx+a
Erreur de prédiction et résidu - Définition
la différence entre la valeur observée d’une variable dépendante et la valeur prédite par un modèle statistique pour cette même variable dépendante. Le résidu est important en statistique car il peut nous donner des informations sur la qualité du modèle que nous avons choisi.
Erreur de prédiction - Exemple
Si nous avons un modèle linéaire qui prédit la taille d’une personne en fonction de son poids, l’erreur de prédiction pour une observation spécifique serait la différence entre la taille observée de la personne et la taille prédite par le modèle en fonction de son poids.
Est-ce qu’un lien de prédiction est automatiquement une relation causale?
NON FAIT 6 ANS QU’ON SE LE FAIT DIRE
*donc il faut être prudent hihihi
Coefficient de régression standardisé - Définition
Dans le cas de la régression simple (avec une VI), le coefficient béta
correspond à la corrélation entre la VI et la VD
Indice d’ajustement de la régression
- L’indice d’ajustement de la droite de régression le plus utilisé est le r2 (ou R2 pour la régression multiple) qui représente le pourcentage de variance de Y expliqué par X
Sommes des carrés pour la régression - Définition
On utilise les SC plutôt que la variance pour caractériser la variabilité
Trois types de SC avec la régression
Le Scx, SCy et le SCychapeau (variabilité de Y expliqué par X)
Somme de carrés résiduelle - Utilité et définition
C’est la variabilité non expliquée par la régression , donc la différence entre la SC de la variable Y et la SC des valeurs prédites (ou somme des carrés de la régression)
DONC : ScRésid = SCy - SCyChapeau
Tests d’hypothèse avec régression - Utilité?
Une fois que nous avons établi une équation de régression, nous
effectuons des tests d’hypothèse afin de vérifier si l’équation explique une part de variance plus grande que le hasard
Deux tests d’hypothèses
1 - Test global pour voir si la corrélation est significativement différente de 0 (H0 : R = 0, H1 : R =/= 0). Ce test repose sur un ratio F
2- Test sur le coefficient de régression béta ; b = 0 ou b =/= 0. Le test repose sur un test-t avaec N-2 dl