CM 6 - Flashcards
Qu’est ce que la covariance ?
La covariance est une mesure statistique qui permet d’évaluer comment deux variables changent ensemble. Indique si les variations d’une variable sont associées aux variations d’une autre variable.
Comment peut - on l’interpréter ?
- Covariance positive : Si la covariance est positive, cela signifie que lorsque XXX augmente, YYY tend également à augmenter. Cela indique une relation directe entre les deux variables.
- Covariance négative : Si la covariance est négative, cela signifie que lorsque XXX augmente, YYY a tendance à diminuer. Cela indique une relation inverse.
- Covariance proche de zéro : Si la covariance est proche de zéro, cela suggère qu’il n’y a pas de relation linéaire significative entre les deux variables.
Quelles sont les limites de la covariance ?
- La covariance ne donne pas d’indication de la force de la relation. Une covariance de 10 et une covariance de 1000 ne peuvent pas être comparées directement en termes de force.
- La valeur de la covariance dépend des unités de mesure des variables. Cela rend difficile la comparaison de covariances entre différentes paires de variables.
Comment peut - on interpréter des valeurs du coefficient de corrélation
- 0.0 à 0.2 : Corrélation très faible
- 0.2 à 0.4 : Corrélation faible
- 0.4 à 0.6 : Corrélation modérée
- 0.6 à 0.8 : Corrélation forte
- 0.8 à 1.0 : Corrélation très forte
Quelles sont les limites du coefficient de corrélation ?
- Mesure que les relations linéaires. Deux variables peuvent avoir une forte relation non linéaire, mais un coefficient de corrélation proche de zéro.
- Sensibilité aux valeurs extrêmes : peuvent influencer significativement le coefficient de corrélation.
- Corrélation n’implique pas causalité : Variables sont corrélées, cela ne signifie pas que l’une cause l’autre. Il peut y avoir des facteurs cachés influençant les deux variables.
Propriété de la valeur du coefficient de corrélation ?
- Valeur comprise entre -1 et 1
* Le coefficient de corrélation varie toujours entre -1 et 1.
o r=1 indique une relation linéaire parfaite positive.
o r=−1 indique une relation linéaire parfaite négative.
o r=0 indique aucune relation linéaire.
Qu’est ce que le coefficient de Pearson ?
Le coefficient de corrélation de Pearson est une mesure statistique qui évalue la force et la direction de la relation linéaire entre deux variables quantitatives. Il est souvent noté r et varie entre -1 et 1. Voici ce que signifient les valeurs du coefficient de Pearson :
Quelles sont ses hypothèses et limites ?
Le coefficient de Pearson suppose que la relation entre les variables est linéaire et que les données suivent une distribution normale. Il est sensible aux valeurs extrêmes (ou outliers), qui peuvent fausser la corrélation en la rendant plus forte ou plus faible qu’elle ne l’est en réalité.
Quelles sont les limites du coefficient de corrélation ?
- Ne mesure que les relations linéaires. Deux variables peuvent avoir une forte relation non linéaire, mais un coefficient de corrélation proche de zéro.
- Valeurs aberrantes peuvent influencer significativement le coefficient de corrélation.
- Corrélation n’implique pas causalité : Même si deux variables sont corrélées, cela ne signifie pas que l’une cause l’autre. Il peut y avoir des facteurs cachés influençant les deux variables.
Quelles est la valeur comprise du coefficient ?
- Le coefficient de corrélation varie toujours entre -1 et 1.
o r=1 indique une relation linéaire parfaite positive.
o r=−1 indique une relation linéaire parfaite négative.
o r=0 indique aucune relation linéaire.
Quels sont sa sensibilité et sa causalité ?
Sensibilité : * Le coefficient de corrélation est sensible aux valeurs aberrantes (outliers), qui peuvent fausser la mesure de la relation entre les variables.
* Une seule valeur extrême peut tirer le coefficient vers le haut ou vers le bas, entraînant une interprétation erronée de la relation.
Causalité : * Le coefficient de corrélation ne prouve pas la causalité. Une corrélation entre deux variables ne signifie pas que l’une cause l’autre. Il peut y avoir des variables cachées ou d’autres facteurs en jeu.
Densité de nuage de point :
- Le coefficient de corrélation ne prouve pas la causalité. Une corrélation entre deux variables ne signifie pas que l’une cause l’autre. Il peut y avoir des variables cachées ou d’autres facteurs en jeu.
Qu’est ce que le coefficient de corrélation linéaire ?
Le coefficient de corrélation linéaire (souvent noté r) est une mesure quantitative qui évalue la force et la direction de la relation linéaire entre deux variables.
Pour analyser la relation entre deux variables, il est crucial de considérer à la fois la densité du nuage de points et le coefficient de corrélation. Ensemble, ils fournissent une compréhension plus complète de la force, de la direction et de la nature de la relation linéaire entre les variables.
Qu’est ce que le coefficient de corrélation et comment on le calcule ?
Le coefficient de corrélation, souvent noté r, mesure la force et la direction de la relation linéaire entre les variables X et Y.
* Calcul : Pour deux variables continues, le coefficient de corrélation de Pearson est calculé comme suit : [ r = \frac{\text{Cov}(X, Y)}{\sigma_X \sigma_Y} ] où :
o Cov(X,Y) est la covariance entre X et Y,
o σX et σY sont les écarts types de X et Y.
Que peux - t - on dire par rapport aux force d’associations ?
La force de l’association entre X et Y peut être interprétée à partir de la valeur du coefficient de corrélation :
* Faible association : 0<∣r∣<0.3. La relation est considérée comme faible. Les variations de X ont peu d’impact sur les variations de Y.
* Association modérée : 0.3≤∣r∣<0.7. La relation est modérée. Il existe une certaine prévisibilité dans les variations de Y lorsque X change.
* Forte association : 0.7≤∣r∣<1. La relation est forte. Les variations de X sont généralement associées à des variations significatives de Y.