Cours 8 : Relations entre variables numériques = corrélation Flashcards
Quelles sont les deux types d’hypothèses étudiées en statistique inférentielle?
- D’une part, on s’intéresse à savoir s’il y a une différence entre des groupes de données;
- D’autre part, on désire étudier s’il y a une relation entre deux ou plusieurs variables.
Qui-suis-je? « tests statistiques utilisé pour évaluer les différences entre des groupes de données et qu’on applique aux proportions d’échantillons factoriels »
Le test d’ajustement du χ2
Qui-suis-je? « tests statistiques utilisé pour évaluer les différences entre des groupes de données et pour comparer les moyennes d’échantillons numériques »
Le t-test
Qui-suis-je? « tests statistiques utilisé pour évaluer les différences entre des groupes de données et pour comparer la distribution d’un échantillon numérique à une loi de distribution Normale »
Le test de shapiro-wilk
Qui-suis-je? « tests statistiques utilisé pour évaluer les différences entre des groupes de données et pour comparer les moyennes de deux échantillons numériques qui ne respectent pas les conditions d’application d’un t-test »
Le test des rangs signés de Wilcoxon
Qui-suis-je? « tests statistiques utilisé pour évaluer les différences entre des groupes de données et à un facteur pour comparer les moyennes de > 2 échantillons numériques »
Le test d’ANOVA
Qu’est-ce qu’une série statistique double?
Il s’agit de l’analyse simultanée de deux variables numériques mesurées sur les mêmes éléments.
Quelle condition doit-on respecter pour avoir une série statistique?
il faut qu’au moins une des deux variables soit aléatoire (2 variables aléatoires est aussi possible)
Qui-suis-je? « représente la moyenne des carrés des écarts de chaque élément de l’échantillon par rapport à la moyenne du groupe. »
Variance
Qui-suis-je? « Elle permet de quantifier la force et la direction (positive ou négative) de l’association entre deux variables numériques. »
Co-variance
Quelle est la différence principale entre la variance et la co-variance?
Dans la co-variance, qu’on fait la somme du produit des écarts de chacune des variables de la série double (X et Y) à sa propre moyenne (X¯et Y¯), au lieu de prendre le carré des écarts d’une seule variable.
Quels sont les autres particularités de la covariance?
- La covariance est commutative
- X¯ et Y¯ représentent les moyennes des deux échantillons de même taille qui recensent les mesures de la série double;
- La covariance sera élevée et positive si les déviations des valeurs à la moyenne en X et en Y varient ensemble;
- À l’inverse, la covariance sera élevée et négative si les déviations des valeurs à la moyenne en X et en Y varient de façon opposée;
- La covariance sera nulle si X et Y varient de façon indépendante l’une de l’autre.
Qui-suis-je? « standardisation de la covariance par les écarts-types des échantillons, SX et SY »
coefficient de corrélation de Pearson rxy
Dans quel intervalle le coefficient de Pearson varie-t-il?
-1 < 0 < 1
Qu’implique un coefficient de Pearson de -1?
de 0 ?
de 1 ?
a) lorsque X et Y varient dans des proportions exactement opposées, c’est-à-dire que la corrélation est parfaite et négative entre les deux variables;
b) lorsque X et Y sont parfaitement indépendants, c’est-à-dire qu’il n’y a aucune corrélation entre les deux variables;
c) lorsque X et Y varient exactement dans les mêmes proportions (varient ensemble), c’est-à-dire que la corrélation est parfaite et positive entre les deux variables.
Vrai ou faux? Le coefficient de corrélation est une mesure de dépendance linéaire
Vrai