Corrélation, regression et test sur le lien entre deux variables numériques Flashcards
Comment calculer la covariance?
cov = (somme des scores) / n
La covarience nous donne le sens de la corrélation
Les étapes pour calculer le coefficient de corrélation linéaire (r)
- EC = x-m (pour x et y)
- ECr = (x-m) / σ (pour x et y)
- Produit des ECr = ECr(x) · ECr(y)
- Moyenne des produits des ECr = (ECr(x) · ECr(y)) / n → r
Régression linéaire
f(x) = ax + b
- a = r · (SDx / SDy)
- b = m(y) - (a-m(x))
SD (standard deviation) = s
Coefficient de détermination (r^2)
R^2 = SC(expliquée) / SC(y)
- SC(y) = SC(expliqué) + SC(residuel)
R^2 est compris entre 0 et 1 et exprime le pourcentage de la variance de y expliquée par x via la régression linéaire.
R^2 = (r)^2
Similaire de SC(facteur) / SC(total)
Test sur le coefficient de détermination
f obs = CM(regression) / CM(résiduel)
- CM= SC / ddl^
cf ANOVA
ddl (test sur le coefficient de détermination)
ddl(y) = n-1
ddl(regression)^ = (nombre de modalités) = 1
ddl(résiduel)^^ = ddl(y) - ddl (regression) = n-2
^ddl1 and ^^ddl2
Hypothèses (test sur le coefficient de détermination)
H0 = Dans la population, le coefficient de détermination est null (r^2=0).
H1 = Dans la population, le coefficient de détermination est non nul.
Conditions – prérequis (test sur le lien entre deux vairables numériques)
- les observations de la variable Y sont indépendantes les unes des autres.
- Les distributions de la VD aux valeurs xi sont normales
- Les distributions de la VD conditionnellement aux valeurs xi ont même variance
Test sur le coefficient de régression “pente”
Prend forme d’un test de Student
T = B1 − 0 /
ety (B1)
ddl (test sur le coefficient de régression)
ddl(résidue) = n-2
Hypothèses (test sur le coefficient de régression)
H0 = Dans la population parente, la pente β1 est nulle
H1 = Dans la population parente, la pente β1 est non nulle