Chapitre 6 et 12 - Corrélation linéaire et régression linéaire (pt. 1) Flashcards
Quelles sont les étapes de l’exploration d’un lien entre deux variables?
1- examen du diagramme de dispersion
2- calcul du coefficient de corrélation linéaire (de Pearson) r, mesurant la force du lien entre les variables et permet de réaliser un test d’hypothèses sur ce lien et ainsi de nous indiquer si cette relation a pu apparaître par hasard sur notre échantillon
3- le cas échéant, détermination d’un intervalle de confiance pour r
4- interprétation des résultats
Quel est le but de l’analyse de corrélation?
Découvrir s’il existe un lien entre les variables sur notre échantillon, et si ce lien est assez fort pour qu’on soit presque certain qu’il n’y a pas pu être observé par hasard (dans le cas où il n’existe pas sur la population (H0)).
Qu’est-ce que détermine l’analyse de corrélation?
- rejet/pas H0
- sens de la relation (+/-)
- force de la relation (coefficient de corrélation linéaire, variant entre 0 et 1)
V/F : une absence de corrélation linéraire signifie une absence de lien.
Faux, c’est seulement la relation linéaire entre les variables qui est mesurée par la méthode de corrélation linéaire; utiliser une autre méthode pourrait prouver un lien.
Qu’est-ce que le coefficient de corrélation linéaire?
Force du lien linéaire entre deux variables (ainsi que le sens); se note r et varie entre -1 et 1 (0 étant l’absence de corrélation linéaire).
Quelle est la condition d’application la plus importante dans le cas du coefficient de corrélation linéaire?
La normalité des variables parentes, soit le fait que si nous avons réalisé suffisamment d’observation, les variables devraient également être normalement distribuées sur vos échantillons.
Que signifie -1? +1?
-1 signifie un lien négatif parfait et +1 un lien positif parfait.
Que permet le niveau de signification associé?
Permet de savoir si nos observations ont pu se produire par hasard en supposant qu’l n’y a en réalité pas de lien entre les variables (H0).
Qu’est-ce que le coefficient de détermination?
Variance partagée; élévation au carré du coefficient de corrélation.
Dans quel cas r2 est élevé?
Quand la variance partagée (explicable) représente une grande partie de la variance totale, donc si elle est suffisamment supérieure à la variance non-partagée.
Dans quel cas r2 est faible?
Quand la variance non-partagée est plus grande que la variance partagée.
V/F : une corrélation de 0.4 est le double d’une corrélation de 0.2.
Faux, c’est en fait le quadruple car on élève la corrélation au carré (0.4 = 16% des variations sont expliquées / 0.2 = 4% des variations sont expliquées)
Pourquoi est-il crucial que la valeur p soit accompagnée de la valeur r?
Parce que le coefficient de corrélation r nous dit à quel point les variables sont liées sur notre échantillon et p nous indique seulement si ce lien a pu arriver à cause des erreurs d’échantillonnage.
Qu’est-ce qu’une corrélation partielle?
Corrélation entre deux variables lorsque l’effet d’une troisième variable est annulé.
Comment se calcule le degré de liberté pour une corrélation simple?
n-2