CM 6 - Flashcards

1
Q

Qu’est ce que la covariance ?

A

La covariance est une mesure statistique qui permet d’évaluer comment deux variables changent ensemble. Indique si les variations d’une variable sont associées aux variations d’une autre variable.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Comment peut - on l’interpréter ?

A
  • Covariance positive : Si la covariance est positive, cela signifie que lorsque XXX augmente, YYY tend également à augmenter. Cela indique une relation directe entre les deux variables.
  • Covariance négative : Si la covariance est négative, cela signifie que lorsque XXX augmente, YYY a tendance à diminuer. Cela indique une relation inverse.
  • Covariance proche de zéro : Si la covariance est proche de zéro, cela suggère qu’il n’y a pas de relation linéaire significative entre les deux variables.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quelles sont les limites de la covariance ?

A
  • La covariance ne donne pas d’indication de la force de la relation. Une covariance de 10 et une covariance de 1000 ne peuvent pas être comparées directement en termes de force.
  • La valeur de la covariance dépend des unités de mesure des variables. Cela rend difficile la comparaison de covariances entre différentes paires de variables.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Comment peut - on interpréter des valeurs du coefficient de corrélation

A
  • 0.0 à 0.2 : Corrélation très faible
  • 0.2 à 0.4 : Corrélation faible
  • 0.4 à 0.6 : Corrélation modérée
  • 0.6 à 0.8 : Corrélation forte
  • 0.8 à 1.0 : Corrélation très forte
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quelles sont les limites du coefficient de corrélation ?

A
  • Mesure que les relations linéaires. Deux variables peuvent avoir une forte relation non linéaire, mais un coefficient de corrélation proche de zéro.
  • Sensibilité aux valeurs extrêmes : peuvent influencer significativement le coefficient de corrélation.
  • Corrélation n’implique pas causalité : Variables sont corrélées, cela ne signifie pas que l’une cause l’autre. Il peut y avoir des facteurs cachés influençant les deux variables.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Propriété de la valeur du coefficient de corrélation ?

A
  1. Valeur comprise entre -1 et 1
    * Le coefficient de corrélation varie toujours entre -1 et 1.
    o r=1 indique une relation linéaire parfaite positive.
    o r=−1 indique une relation linéaire parfaite négative.
    o r=0 indique aucune relation linéaire.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qu’est ce que le coefficient de Pearson ?

A

Le coefficient de corrélation de Pearson est une mesure statistique qui évalue la force et la direction de la relation linéaire entre deux variables quantitatives. Il est souvent noté r et varie entre -1 et 1. Voici ce que signifient les valeurs du coefficient de Pearson :

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quelles sont ses hypothèses et limites ?

A

Le coefficient de Pearson suppose que la relation entre les variables est linéaire et que les données suivent une distribution normale. Il est sensible aux valeurs extrêmes (ou outliers), qui peuvent fausser la corrélation en la rendant plus forte ou plus faible qu’elle ne l’est en réalité.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quelles sont les limites du coefficient de corrélation ?

A
  • Ne mesure que les relations linéaires. Deux variables peuvent avoir une forte relation non linéaire, mais un coefficient de corrélation proche de zéro.
  • Valeurs aberrantes peuvent influencer significativement le coefficient de corrélation.
  • Corrélation n’implique pas causalité : Même si deux variables sont corrélées, cela ne signifie pas que l’une cause l’autre. Il peut y avoir des facteurs cachés influençant les deux variables.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quelles est la valeur comprise du coefficient ?

A
  • Le coefficient de corrélation varie toujours entre -1 et 1.
    o r=1 indique une relation linéaire parfaite positive.
    o r=−1 indique une relation linéaire parfaite négative.
    o r=0 indique aucune relation linéaire.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quels sont sa sensibilité et sa causalité ?

A

Sensibilité : * Le coefficient de corrélation est sensible aux valeurs aberrantes (outliers), qui peuvent fausser la mesure de la relation entre les variables.
* Une seule valeur extrême peut tirer le coefficient vers le haut ou vers le bas, entraînant une interprétation erronée de la relation.
Causalité : * Le coefficient de corrélation ne prouve pas la causalité. Une corrélation entre deux variables ne signifie pas que l’une cause l’autre. Il peut y avoir des variables cachées ou d’autres facteurs en jeu.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Densité de nuage de point :

A
  • Le coefficient de corrélation ne prouve pas la causalité. Une corrélation entre deux variables ne signifie pas que l’une cause l’autre. Il peut y avoir des variables cachées ou d’autres facteurs en jeu.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Qu’est ce que le coefficient de corrélation linéaire ?

A

Le coefficient de corrélation linéaire (souvent noté r) est une mesure quantitative qui évalue la force et la direction de la relation linéaire entre deux variables.

Pour analyser la relation entre deux variables, il est crucial de considérer à la fois la densité du nuage de points et le coefficient de corrélation. Ensemble, ils fournissent une compréhension plus complète de la force, de la direction et de la nature de la relation linéaire entre les variables.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qu’est ce que le coefficient de corrélation et comment on le calcule ?

A

Le coefficient de corrélation, souvent noté r, mesure la force et la direction de la relation linéaire entre les variables X et Y.
* Calcul : Pour deux variables continues, le coefficient de corrélation de Pearson est calculé comme suit : [ r = \frac{\text{Cov}(X, Y)}{\sigma_X \sigma_Y} ] où :
o Cov(X,Y) est la covariance entre X et Y,
o σX et σY sont les écarts types de X et Y.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Que peux - t - on dire par rapport aux force d’associations ?

A

La force de l’association entre X et Y peut être interprétée à partir de la valeur du coefficient de corrélation :
* Faible association : 0<∣r∣<0.3. La relation est considérée comme faible. Les variations de X ont peu d’impact sur les variations de Y.
* Association modérée : 0.3≤∣r∣<0.7. La relation est modérée. Il existe une certaine prévisibilité dans les variations de Y lorsque X change.
* Forte association : 0.7≤∣r∣<1. La relation est forte. Les variations de X sont généralement associées à des variations significatives de Y.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Quelles sont ses limites ?

A
  • Ne mesure que les relations linéaires. Deux variables peuvent avoir une relation non linéaire forte mais un coefficient de corrélation faible.
  • Valeurs aberrantes peuvent influencer le coefficient de corrélation et donner une image trompeuse de la relation.
  • Corrélation ne signifie pas causalité.
16
Q

Qu’est ce que le coefficient de corrélation ?

A

Le coefficient de corrélation est un indicateur clé pour évaluer la force et la direction de l’association entre deux variables, généralement désignées par X et Y. Voici un aperçu détaillé de ce concept :
* Coefficient de corrélation, souvent noté r, quantifie la relation entre X et Y.

17
Q

Quelles sont ses forces d’association ?

A

La force de l’association entre X et Y peut être classée comme suit :
* Faible association :
o 0<∣r∣<0.3 : Les variations de X n’affectent que faiblement Y.
* Association modérée :
o 0.3≤∣r∣<0.7 : Les variations de X sont modérément liées aux variations de Y.
* Forte association :
o 0.7≤∣r∣<1 : Les variations de X sont fortement associées aux variations de Y.

18
Q

Quelles sont ses limites ?

A
  • Relation linéaire uniquement : Le coefficient de corrélation de Pearson ne capture que les relations linéaires. Une relation non linéaire forte peut ne pas être reflétée par une valeur élevée de r.
  • Influence des valeurs aberrantes : Les valeurs extrêmes peuvent avoir un impact significatif sur le coefficient de corrélation, faussant ainsi l’interprétation de la force de l’association.
  • Causalité vs. Corrélation : Un coefficient de corrélation élevé ne signifie pas nécessairement que X cause Y; d’autres facteurs peuvent influencer les deux variables.