Statistiques II Flashcards
quelles sont les trois suppositions qui sous-tendent les coefficients de correlation?
1- relation lineaire
2- homoscedasticite
3- variabilite suffisante dans les deux variables
qu’est ce qu’est une correlation
le degré d’association entre deux variables, sans relation causale impliquée
qu’est ce qu’est la regréssion
elle permet de prédire la valeur de la variable dépendante pour une valeur donnée de la variable indépendante
implique une relation causale, peut prédire
c’est ce qu’est r au carré
coefficient de determination qui mesure la proportion de la variabilité d’une variable qui peut etre expliquée par l’autre
quand est-ce qu’on peut interpréter une forte association?
quand r + - 0.50
quelle est une facon d’essayer de trouver une correlation quand un scatter plot ne respecte pas les supposition de corrélation
transformer les données par exemple en log
l’intensité de l’effet (relation causale entre variable) est donnée par quelle partie d’une équation?
de la pente d’une régression linéaire
corrélation et regressions sont robustes par rapport a quelles conditions d’applications qui peuvent poser problemes
la normalité (mais seulement si la taille de l’echantillon est plus que 10) et pas d’erreur sur X
pourquoi un petit echantillon peut poser probleme pour une regression?
une regression significative peut etre obtenue par chance, meme si aucune relation causale existe
pourquoi un grand echantillon peut poser probleme pour une regression?
il y aura des resultats significatifs, mais r sera petit. quand r est petit, il faut eviter de surinterpreter la relation observée