Cours 12- Test de corrélation Flashcards
Quel sont les deux utilités du test de corrélation (r de Pearson) *****
- Mesurer l’association entre deux variables quantitatives
- C’est une étape nécessaire avant de faire une analyse multivariée (comme le calcul de la régression multiple, qui est le cours annulé)
- Aussi utilisée pour mesurer l’association entre les variables indépendantes à l’étude = colinéarité
Donner un exemple d’hypothèse de recherche pour le test de corrélation (r de Pearson)
H1 : : Il existe une association entre l’âge à la 1ère culpabilité officielle et le revenu légitime mensuel. Plus précisément, plus l’âge à la 1ère culpabilité est tardif (VI), plus le revenu légitime mensuel (VD) déclaré sera élevé.
- On vient quantifier notre relation entre la variable indépendante sur la dépendante
H0 : : Il n’existe aucune association entre l’âge à la 1ère culpabilité et le revenu légitime mensuel déclaré.
Quel est la variable utilisé pour faire un test de corrélation ?
Utilisation : 2 variables quantitatives
Qu’est que le R de Pearson ? **
R de pearson est un test paramétrique de la corrélation: demande deux éléments soit;
- une des deux variables qui est quantitative +
- que celle-ci soit normalement distribué (à savoir pour l’examen)
Calcul basé sur la somme des écarts à la moyenne pour les valeurs des variables X et Y
Quels sont les 4 postulats d’utilisation pour le test de corrélation R de Pearson (test paramétrique de la corrélation)
- Distribution normale des 2 variables quantitatives (Normalité)
- Inspection des mesures univariées (asymétrie, aplatissement, …) et des histogrammes - Absence de valeur(s) extrême(s) problématique(s) (Valeurs extrêmes)
- Les valeurs extrêmes peuvent exagérer ou minimiser l’association entre les deux variables
Utilisez le test de corrélation non paramétrique, si problématique, OU éliminer les quelques valeurs extrêmes (en dernier recours) - Linéarité de la relation (Linéarité)
- Pour savoir si la linéarité est respecté;
Observée à l’aide du diagramme de dispersion
- Présente graphiquement l’ensemble des pairs des valeurs des deux variables. - Min. de 30 effectifs/cas par variable
- Se vérifie dans la matrice de corrélation, via le n de l’échantillon.
- Points de comparaison suffisants
En ce qui concerne le postulat de Linéarité de la relation, nous devons recourir à la corrélation non-paramétrique si : **
- Problème évident quant à la non-linéarité
- On suspecte une relation non-linéaire au niveau théoriques
- Si une relation est non linéaire entre nos variables, sachez qu’on doit utiliser le test non-paramétrique de corrélation… savoir pour l’examen
Qu ce passe t’il si un des postulat d’utilisation du test de corrélation (r de Pearson) n’est pas respecté ? ***
Les 4 postulats doivent être respectés, si 1 ne respecte pas on doit faire le test non paramétrique de la corrélation.. (Rho de Spearman)
Quels sont les 3 types de (Nuage de point) qui respecte le postulat de Linéarité ?
Négative
Positive
Absence de relation
*Plus les points sont rapprochés, cela sous entend le signe d’une relation significative/ association forte entre ma VI +VD
Quels sont les 2 types diagramme de dispersion qui ne respecte le postulat de Linéarité ?
Curvilinéaire (U)
Exponentielle (J-R)
*Voir images dans notes de cours
*Si mon diagramme de dispersion ressemble à un U ou J ou R: Non respect du postulat de linéarité
*Relation n’est pas linéaire: ne suit pas une augmentation ou ne suit pas une diminution (de manière constante)
Qu’est que le calcul de corrélation - Rho de Spearman***
- Test de corrélation non paramétrique
- Si non respect d’un des postulats
- Le test s’appuie sur le Rang plutôt que sur les valeurs
- Ce test permet de détecter l’existence et le sens d’une relation, peu importe sa « forme »
Classer en termes de rang : celui qui avait commis le moins de crime (Rang 1) jusqu’à celui ayant commis le plus de crime (Rang 5).
Quels sont les étapes d’un test de corrélation ?
- Mentionner votre hypothèse de recherche.
- Mentionnez votre HI (non-directionnelle, puis directionnelle par la suite)
- Association positive (++)/association négative (-+)
- parle ≠ différences de groupes - Vérification du respect des postulats: distribution, valeurs extrêmes. linéarité, min 30 effectifs
- Vérifier l’histogramme des deux variables quantitatives. (inspecter la distribution)
- Tableau de fréquence pour l’examen des valeurs extrêmes
- Réaliser un diagramme de dispersion - Réaliser le test de corrélation approprié.
- R de Pearson (test paramétrique) (respect des postulats)
- Rho Spearman (test non-paramétrique) (non respect des postulats) - Rejet ou non rejet de H0
- Ya-t-il une relation significative? - Si rejet (p<0.05)
a. Vérifier le sens et la force de la relation
b. Coefficient de corrélation ( r de Pearson et rho de Spearman)
- Indique la force et le sens de la relation
- Varie de -1 à 1 - Présenter et interpréter les résultats
*Si corrélation de Pearson est positive ( ex : .334) peut dire dans l’interprétation qu’il y a une relation statistique significative positive entre la VI et VD & au contraire si corrélation de Pearson est négative ( ex : -.334) peut dire qu’il y a une relation statistiquement significative négative entre le VI et la VD.
Vrai
comment pouvons nous interpréter le sens et la force de la relation dans un test de corrélation ?
Une analyse de corrélation fut effectuée pour déterminer si une association existait entre l’âge à la première consommation d’alcool et l’âge au premier vol déclaré par les répondants.
Les résultats permettent de constater qu’il existe une association significative entre ces deux variables (r(433)= 0.33, p<0.001).
Il est donc possible de rejeter l’hypothèse nulle selon laquelle il n’existe aucune association entre les deux variables à l’étude. Plus précisément, il existe une relation positive et modérée entre l’âge à la première consommation d’alcool et l’âge au premier vol.
En effet, plus un individu a sa première consommation à un âge tardif, plus l’âge au premier vol sera tardif également.
Quel est la nature des variable qui peut être utilisé pour un test de corrélation ? ***
- Deux variables quantitatives