Cours 5 - Rappel sur la corrélation Flashcards
Caractéristiques unilatéral VS bilatéral (puissance, général ou non, etc.)
Unilatéral : Sera plus spécifique et plus puissant
Bilatéral : Sera plus général et moins puissant
Coefficient de corrélation r de Pearson - Caractéristiques
Il s’agit d’un indice de l’ajustement entre deux variables qui peut être positif ou négatif de -1 à 1.
0 = absence de relation
1 ou -1 = relation parfaite (faire attention, cela veut dire qu’on mesure deux fois la même chose)
Vrai ou faux? Plus la corrélation est forte, plus les points sur
le diagramme de dispersion sont resserrés
autour de la droite de régression
Vrai
Valeurs du r de pearson (cohen)
0 = absence
.10 = faible
.30 = modérée
.50 = Forte
Qu’est-ce que la covariance?
à quel point les deux variables varient de façon similaire
Que permet la formule du r de Pearson pour la corrélation?
Permet de standardiser la relation entre les variables qui ne sont pas nécessairement sur les mêmes échelles
Différence entre la corrélation et la covariance?
La corrélation est la covariance standardisé par les écarts-types
Vrai ou faux : Le test d’hypothèse peut s’intéresser de manière descriptive à la corrélation de seulement l’échantillon ET comme test inférentiel
Vrai
H0 et H1 d’un test bilatéral
H0 : p = 0
H1: p =/= 0
H0 et H1 d’un test unilatéral
H0 : p plus grand ou égal à 0
H1 : p plus petit que 0
Quelle distribution d’échantillonnage utilise-t-on avec un test d’hypothèse de la corrélation?
Le t de student avec n - 2 DL
Caractéristiques du coefficient de corrélation de Pearson (R)
- Indice indépendant des échelles
- Indice standardisé
- Le R carré représente le pourcentage de variance expliqué d’une variable par l’autre
- Le R est un estimateur biaisé de la population quand la population est petite (au moins 20 pour assurer la validité de l’estimateur)
Régression linéaire simple VS Corrélation ? C’est quoi les ressemblances / Différences
La régression linéaire simple est comme la corrélation dans l’idée qu’il y a 2 variables continues. PAR CONTRE!!!!! dans le cas d’une corrélation, il n’y a pas nécessairement de VI et VD (un lien, pas une prédit l’autre). Dans une régression, la VI prédit la VD.
Est-ce que la puissance du r de Pearson dépend de la taille de l’effet et de l’échantilon?
Bah oué poto. Avec le coefficient de corrélation, on estime que la taille d’effet attendue égale la corrélation attendue. C’est un peu comme le test-t en fonctionnement au niveau de la puissance
Quoi retenir de la matrice de corrélation?
La diagonale est de 1 puisque c’est toujours une corrélation avec la même variable. Dans le reste de la matrice, on remarque un effet miroir.
Pour la matrice de variance/covariance, la diagonale n’est pas de 1 mais bien de la valeur de la variance de chaque variable donnée. Quand on est pas dans la diagonale, c’est la valeur de la covariance qu’on observe.
Quand est-ce que le coefficient de Pearson fonctionne bien (conditions)?
1- Relation entre variables est linéaire
2- Variables ont des échelles plutôt continues
3- Respecte les postulats d’homogénéité et de normalité
4- Pas de données extrêmes
Cas de linéarité (3)
1 - Linéaire = /
2 - Curvilinéaire = U
3 - Partiellement linéaire = j inversé
Définition d’une mesure de corrélation
Indice du lien entre deux variables représentant au moins des niveaux ordonnées de la mesure (augmentation de plus à moins d’une quantité)
Définition d’une mesure d’association
Association entre différentes valeurs de variable même si on ne voit pas d’augmentation ou de diminution (association entre sexe/race et intention de vote aux USA)
Explication derrière les mesures de corrélation
Une mesure de corrélation prend des mesures continues pour avoir des augmentations et diminution avec un sens. Si on augmente le stress, on aura une augmentation des sx psychologiques. Dans un contexte catégoriel, si on passe d’homme à femme, on n’a pas réellement de niveau ordonné
Corrélation bisérielle de point rpb - utilise quel type de variables?
Dichotomique; variable qui peut prendre DEUX valeurs (0,1 par exemple)
Interprétation du rpb - différent du r de Pearson?
Même calcul que le R de Pearson, même interprétation. Toutefois, peut présenter des difficultés d’inférence avec les tests d’hypothèses. Une variable dichotomique et une variable continue. On vérifie donc le fait d’appartenir à une catégorie sur une variable continue.
Diagramme avec une corrélation bisérielle de point Rpb - arrangement des points
Vu qu’on a une variable catégorielle, les points sont regroupés en deux colonnes et non en diagonale.
Comment faire une droite de régression avec une corrélation bisérielle de point Rpb?
La droite de régression passe par les moyennes de chaque groupe
La constante b représente quoi dans l’équation de régression?
L’ordonnée à l’origine
Le ‘a’ de l’équation de régression représente quoi?
La pente de la droite de régression
Relation entre t et Rpb
Relation importante ; De quoi on avait besoin dans un test t indépendant? Une variable dichotomique et une variable continue. C’est la même chose avec Rpb.
Comment tester la signification de Rpb?
Très facile d’utiliser le test-t pour tester la signification de Rpb étant donné leur lien. C’est le même test que pour le r de Pearson avec H0 et H1
Comment calculer les tailles d’effet pour une corrélation biserielle?
Utiliser les différences de moyenne dans les deux groupes ou avec la valeur du coefficient de corrélation puisqu’il y a une relation entre t et Rpb.