Cours 9 Flashcards
Que permet le diagramme de dispersion?
La diagramme de dispersion permet d’examiner la relation entre deux variables continues X et Y
-> La droite de régression représente le meilleur ajustement linéaire entre les variables
Dans un diagramme de dispersion, chaque unité d’observation est représenté par un […] - les coordonnées sont les valeurs […] et […]
Dans un diagramme de dispersion, chaque unité d’observation est représenté par un point - les coordonnées sont les valeurs X et Y
VRAI ou FAUX
Les diagrammes de dispersion permettent d’examiner les relation de cause à effet
FAUX
Il est impossible de découvrir des relations de cause à effet avec un diagramme de dispersion
VRAI ou FAUX
Avec un diagramme de dispersion, on peut prédire la relation entre les variables même quand les points sont très dispersés
VRAI
Par contre, l’erreur de prédiction va être plus élevée
Qu’est-ce que la droite de régression?
La droite qui représente le meilleur ajustement linéaire dans le nuage de points, entre X et Y
Quelle est la forme de la droite de régression?
Y = bX + a
Y = La valeur prédite de Y b = La pente de la droite (de combien change Y pour un changement d'une unité de X) a = l'ordonnée à l'origine (la valeur de Y lorsque X = 0) X = La valeur du prédicteur
La droite de régression passe au milieu du nouage de points et minimise la somme des différences entre les valeurs […] et les valeurs […] au […] (l’erreur de […] / le […]).
Elle donne aussi une forme […]
La droite de régression passe au milieu du nouage de points et minimise la somme des différences entre les valeurs observées et les valeurs prédites au carré (l’erreur de prédiction / le résidu).
Elle donne aussi une forme quadratique (donc la fonction a toujours un minimum)
L’analyse statistique vise à trouver les valeurs […] et […] de l’équation de régression pour lesquels l’erreur de prédiction est aussi […] que possible
L’analyse statistique vise à trouver les valeurs b et a de l’équation de régression pour lesquels l’erreur de prédiction est aussi petite que possible
Pour la régression simple (2 variables), nous avons:
Ŷ = […]
où
a = Y - bX
b = COVxy/S2X
Pour la régression simple (2 variables), nous avons:
Ŷ = bX + a
où
a = Y - bX
b = COVxy/S2X (Covariance de X et Y divisé par la variance de X)
Qu’est-ce que le résidu
Variabilité qui n’est pas expliqué par la droite
Comment peut-on interpréter l’ordonnée à l’origine d’une droite de régression?
Peut représenter une constante ou le minimum de la variable prédite
ex: Un temps de réponse minimum
Comment peut-on interpréter la pente d’une droite de régression?
Coefficient de régression
Représente le taux de changement de Y en fonction de X
Si nous établissons un lien entre deux variables avec une équation de régression, il faut être prudent quant à l’interprétation - un lien de prédiction n’est pas une relation […]
Si nous établissons un lien entre deux variables avec une équation de régression, il faut être prudent quant à l’interprétation - un lien de prédiction n’est pas une relation causale
Le plus souvent nous utilisons un coefficient de régression …, […]dépendant des échelles de mesure
Le plus souvent nous utilisons un coefficient de régression standardisé bêta (b), indépendant des échelles de mesure
Le coefficient de régression standardisé bêta représente la […] entre X et Y si les deux variables avaient la même […]
Le coefficient de régression standardisé bêta représente la pente entre X et Y si les deux variables avaient la même échelle