Cours 5 Flashcards
Def. association
Coïncidence qui se répète de manière stable et qui a du sens dans la vie de tous les jours et en sciences
Lorsqu’il y a une association entre deux variables est-ce qu’on parle d’une hypothèse alternative (H1) ou nulle (H0)?
H1
Vrai ou faux: la corrélation simple / linéaire / bivariée peut se faire avec n’importe quel nombre de variables
Faux. Elle se fait entre 2 variables seulement. Si on a plus de deux variables, une matrice de corrélation devra être développée -> on évaluera la corrélation entre chaque combinaison de 2 variables
Comment se nomme la corrélation la + fréquente et quel est son symbole?
Corrélation de Pearson
r et se note rxy
Vrai ou faux: pour que la corrélation puisse être calculer, l’observation ne doit pas nécessairement produire une valeur sur x et une valeur sur y. Une des deux valeurs peut être manquante.
Faux. Chaque observation doit produire une valeur sur x et une valeur sur y pour voir calculer une corrélation
Quelle est l’importance de la corrélation?
- Elle réduit l’incertitude (la connaissance de x nous fournit des informations sur y)
- En connaissant x il est possible d’estimer y et vice-versa
Pourquoi peut-on dire que la corrélation est bivariée?
Parce qu’une variable peut influencer l’autre variable et VICE-VERSA
Qu’est-ce que la taille d’une corrélation nous permet de savoir?
Si la corrélation entre 2 variables est forte ou faible
Est-ce que le fait qu’une corrélation soit de grande taille augmente ou réduit l’incertitude de y par rapport à la connaissance de x
Réduit l’incertitude. Plus une corrélation est élevée, plus la connaissance de x nous renseigne sur y.
Qu’est-ce que la direction d’une corrélation nous permet de savoir?
Si la corrélation est positive ou négative
Comment les données varient lors d’une corrélation positive
-> Les variables varient dans le même sens
- Plus une variable augmente, plus l’autre augmente aussi
- Plus une variable diminue, plus l’autre diminue aussi
Comment les données varient lors d’une corrélation négative
-> Les variables varient dans le sens opposé
- Plus une variable augmente, plus l’autre diminue
- Plus une variable diminue, plus l’autre augmente
Vrai ou faux: une corrélation négative ne veut pas dire que la corrélation est faible
Vrai, elle est juste inversée
Est-ce que la taille et la direction sont dépendantes l’une de l’autre?
Non
Est-ce que la taille et la direction indique nécessairement si X cause Y?
Non, même si la taille est élevée ça ne veut pas dire que X cause Y, ça veut seulement dire que les variables sont grandement liées entre elles
Comment peut-on savoir, en regardant les observations si la corrélation est élevée, dans le cas d’une corrélation positive?
La position des observations est identique sur x et sur y. C’est-à-dire que si une valeur est en 1e position dans les x, elle sera aussi en 1e position dans les y.
- Les scores les + forts sur une variable sont associés aux scores les + forts sur l’autre variable
- Une observation sur x qui est au-dessus de la moyenne de x devrait être associée à une observation sur y qui est au-dessus de la moyenne de y.
Comment peut-on savoir, en regardant les observations si la corrélation est élevée, dans le cas d’une corrélation négative?
La position des observations est inversée sur x et sur y. C’est-à-dire que si une valeur est en 1e position dans les x, elle sera aussi en dernière position dans les y.
- Les scores les + forts sur une variable sont associés aux scores les + faibles sur l’autre variable
- Une observation sur x qui est au-dessus de la moyenne de x devrait être associée à une observation sur y qui est en-dessous de la moyenne de y (ou vice-versa)
Définition conceptuelle du r de Pearson
Le degré moyen avec lequel les observations occupent une position similaire (ou inversée) sur x et y
Comment on fait pour savoir la position d’une observation, pour savoir si une observation sur x est similaire à une observation sur y?
-C’est la position des observations par rapport aux moyennes des variables
- On regarde si l’observation est au-dessus ou en-dessous de la moyenne de la variable
Quelle est la direction de la corrélation si les scores-z sur x et y sont:
- Similaires
- Inversés
- Aléatoires
- Positive
- Négative
- Aucune corrélation
Étapes pour calculer la corrélation r
- Transformer chaque observation en score-z
- Calculer le produit zx * zy pour chaque observation
- Additionner tous les produits des différentes observations
- Calculer la moyenne en divisant par n-1
Vrai ou faux: la corrélation est un indice standardisé de la relation entre x et y
Vrai, car il faut être capable de comparer x et y, même si leur moyenne est différente