Cour 12 - Test de corrélation Flashcards
Quels sont les deux utilités du test de corrélation R de Pearson?
- Mesurer l’association entre deux variables quantitatives
- C’est une étape nécessaire avant de faire une analyse multivariée (comme le calcul de la régression multiple, qui est le cours annulé)
- Aussi utilisée pour mesurer l’association entre les variables indépendantes à l’étude = colinéarité
Donner un exemple d’hypothèse de recherche pour le test de corrélation R de Pearson
H1 : : Il existe une association entre l’âge à la 1ère culpabilité officielle et le revenu légitime mensuel. Plus précisément, plus l’âge à la 1ère culpabilité est tardif (VI), plus le revenu légitime mensuel (VD) déclaré sera élevé.
- On vient quantifier notre relation entre la variable indépendante sur la dépendante
H0 : Il n’existe aucune association entre l’âge à la 1ère culpabilité et le revenu légitime mensuel déclaré.
Quels sont les variables utilisés aux fins du test de corrélation?
2 variables quantitatives
Le test de corrélation R de Pearson est-il paramétrique ou non-paramétrique?
R de pearson est un test paramétrique de la corrélation: demande deux éléments soit :
- une des deux variables qui est quantitative
+ - que celle-ci soit normalement distribué (à savoir pour l’examen)
Quels sont les 4 postulats d’utilisation pour le test de corrélation R de Pearson? (4)
- Distribution normale des 2 variables quantitatives (Normalité)
- Inspection des mesures univariées (asymétrie, aplatissement, …) et des histogrammes
- Absence de valeur(s) extrême(s) problématique(s) (Valeurs extrêmes)
- Les valeurs extrêmes peuvent exagérer ou minimiser l’association entre les deux variables
- Utilisez le test de corrélation non paramétrique, si problématique, OU éliminer les quelques valeurs extrêmes (en dernier recours)
- Linéarité de la relation (Linéarité)
- Pour savoir si la linéarité est respecté;
Observée à l’aide du diagramme de dispersion - Présente graphiquement l’ensemble des pairs des valeurs des deux variables.
- Min. de 30 effectifs/cas par variable
- Se vérifie dans la matrice de corrélation, via le n de l’échantillon.
- Points de comparaison suffisants
En ce qui concerne le postulat de Linéarité de la relation, nous devons recourir à la corrélation non-paramétrique si… (2)
- Problème évident quant à la non-linéarité
- On suspecte une relation non-linéaire au niveau théoriques
- Si une relation est non linéaire entre nos variables, sachez qu’on doit utiliser le test non-paramétrique de corrélation… savoir pour l’examen
Quels sont les 3 types de diagramme de dispersion qui respecte le postulat de Linéarité ?
a. Négative
- Ex : Plus l’âge de mon détenu au premier crime est élevé, plus son nb de crime sera faible.
b. Positive
- Plus l’âge de mon détenu au premeir crime est élevé, plus sont nb de crime sera élevé.
c. Absence de relation
- Peut importe le temps passé en incarcération, plus cela n’a pas d’incidence sur le revenu criminel.
*Plus les points sont rapprochés, cela sous entend le signe d’une relation significative/ association forte entre ma VI +VD
Que signifie un non-respect du postulat de linéarité? (3)
a. Qu’il n’y a pas de constance ente les individus et leur pattern de réponse
b. La relation n’est pas linéaire : Elle ne suit pas une augmentation ou une diminution de manière constante.
C. Si mon diagramme de dispersion ressemble à un U (curvilinéaire) ou un J ou R (exponentielle) = Non respect du postulat de linéarité
Que ce passe-t-il lorsqu’un postulat d’utilisation du Test de corrélation R de Pearson n’est pas respecté?
Les 4 postulats doivent être respectés.. Autrement doit faire le test non paramétrique de corrélation Rho de Spearman.
Quels sont les 2 types diagramme de dispersion qui ne respecte le postulat de Linéarité ?
- Curvilinéaire (U)
- Exponentielle (J-R)
Qu’est que le calcul de corrélation Rho de Spearman? (5)
- Test de corrélation non paramétrique
- Si non respect d’un des postulats
- Le test s’appuie sur le Rang plutôt que sur les valeurs
- Ce test permet de détecter l’existence et le sens d’une relation, peu importe sa « forme »
- Classer en termes de rang : celui qui avait commis le moins de crime (Rang 1) jusqu’à celui ayant commis le plus de crime (Rang 5).
Quels sont les étapes d’un test de corrélation ?
- Mentionner votre hypothèse de recherche.
- Mentionnez votre HI (non-directionnelle, puis directionnelle par la suite)
- Association positive (++)/association négative (-+)
- parle ≠ différences de groupes - Vérification du respect des postulats: distribution, valeurs extrêmes. linéarité, min 30 effectifs
- Vérifier l’histogramme des deux variables quantitatives. (inspecter la distribution)
- Tableau de fréquence pour l’examen des valeurs extrêmes
- Réaliser un diagramme de dispersion
- Réaliser le test de corrélation approprié.
- R de Pearson (test paramétrique) (respect des postulats)
- Rho Spearman (test non-paramétrique) (non respect des postulats)
- Rejet ou non rejet de H0
- Ya-t-il une relation significative?
- Si rejet (p<0.05)
a. Vérifier le sens et la force de la relation
b. Coefficient de corrélation ( r de Pearson et rho de Spearman)
- Indique la force et le sens de la relation
- Varie de -1 à 1
- Présenter et interpréter les résultats
Quels sont les seuils de significations acceptables afin de rejeter l’H0?
p < 0.05
p < 0.01
p < 0.001
Qu’est-ce que indique le coefficient de corrélation R de Pearson et Rho de Spearman?
- Indique la force et le sens de la relation
- Varie de -1 à 1
Force :
0 à 0.2 = Relation faible
0.2 et 0.5 = Relation modérée
0.5 et 0.8 = Relation forte
Plus de 0.8 = Relation très forte
Sens :
Si corrélation de Pearson est positive ( ex : 0.334) peut dire qu’il y a une relation statistique significative positive entre la VI et la VD & au contraire si corrélation de Pearson est négative ( ex : -0.334) peut dire qu’il y a une relation statistique significative négative entre la VI et VD.