La régression linéaire simple Flashcards
Que voulons nous établir avec la corrélation?
Nous voulons établir la relation entre 2 variables.
Que voulons nous établir avec la régression?
Nous voulons prédire la valeur d’une variable sur une autre.
Qu’est-ce qu’est VI?
C’est X : Variable prédictrice
Ex: Nb de cigarette
Qu’est-ce que VD
C’est Y : La variable prédite
Ex: Espérance de vie
Y a-t-il un lien de causalité dans la régression?
Non
Que faut-il vérifier avant de voir si une variable peut prédire l’autre?
On doit vérifier si les 2 variables sont corrélées
Dans la régression, sur quoi repose la qualité de prédiction?
Sur la force de la relation linéaire entre 2 variables. Plus la corrélation entre les variables est élevée, plus il sera facile de prédire une variable à partir de l’autre
Que permet la droite de régression?
- Elle permet d’effectuer une meilleure prédiction de Y (variable prédite : VD) à partir de X (variable prédictrice : VI)
- La droite minimise l’erreur de prédiction et passe par un maximum de point
- Elle passe par la moyenne des points du diagramme de dispersion
- Avec une corrélation parfait, chaque Y prédit sera identique au Y réel.
Qu’est-ce qui ferait en sorte qu’il n’y ait aucun erreur de prédiction?
Si chaque Y prédit est identique au Y réel.
Qu’est-ce que l’erreur de prédiction?
C’est la différence entre le Y réel et le Y prédit
En régression, on cherche la droite qui … les erreurs de …
Autrement dit, on vise à … les écarts entre les … et les …
En régression, on cherche la droite qui minimise les erreurs de prédiction.
Autrement dit, on vise à minimiser les écarts entre les valeurs observées et les valeurs prédites.
Dans la régression, on cherche à minimiser la somme des différences au carré. Mais pourquoi la somme des différences au carré?
Pour ne pas avoir une somme de 0 (ce qui arrivera si on additione des écarts positifs et négatifs)
Vrai ou faux
Plus la somme des carré est grande, plus les points sont près de la droites, donc meilleure est la prédiction et moins on fait d’erreur.
Faux
Plus la somme des carré est petite, plus les points sont près de la droite, meilleure est la prédiction et on fait moins d’erreur.
Quelle est l’équation de la régression?
Y(prédit) = bX + a
Quel est le b dans l’équation de régression?
C’Est la pente de la droite de régression, MAIS c’est aussi le COEFFICIENT DE RÉGRESSION