COURS 10: Correlation Flashcards
V/F avec un très grand n, un effet banal peut être significatif.
Vrai, car augmentation du n augmente la puissance statistique
Quand est-ce qu’un faut utiliser le d de Cohen vs l’Éta-carré?
d de Cohen: 1 à 2 moyennes, taille effet fournie par Spss lors d’un test t
Éta-carré: + de 2 moyennes, taille effet fournie par Spss lorsque anova
Quelle mesure de taille effet permet de déterminer la proposition de la variance de la VD pouvant être expliquer par les niveaux de la VI?
Éta-carré
V/F la formule du d de Cohen varie selon le type de test t.
Vrai
Quelle est la formule du d de Cohen pour 2 échantillons indépendants?
d= (Moyenne de x1- Moyenne de x2) /Sp
Quelle est la formule général de l’Éta-carré?
n^2= scinter/sctotal
Explique la différence entre les tests statistiques faits avec approche fréquentiste et ceux faits avec approche bayésienne.
Frequentiste: signification de hypothèse nulle
Bayésienne: probabilité que H0 et H1 soient vraies.
Qu’est-ce que le facteur de Bayes
Dans approche Bayésienne, on compare ce facteur avec les barèmes et on peut déterminer quelle hypothèse (H0 et H1) est la plus probable.
Donne le barème du d de Cohen
Effet petit: 0.2
Effet moyen: 0.5
Effet grand: 0.8
Donne le barème du d de l’état carré
Effet petit: 0,01
Effet moyen: 0,06
Effet grand: 0,14
V/F Lorsque nous nous intéressons aux différences entre les moyennes, on peut identifier une relation causale possible si on manipule la VI
Vrai
V/F Lorsque nous nous intéressons aux relations entre les variables, on peut identifier une relation causale.
Faux , on ne manipule pas la VI
Définis la corrélation
1- Statistique qui permet d’estimer le degré de relation entre 2 variables
2- Estime la direction et la force de la relation entre 2 variables
Lorsqu’on parle de corrélation, par quels termes peut-on remplacer les expression « variables indépendantes » et « variables dépendantes »?
Variables corrélés ou corrélats
Quelles sont les 3 conditions pour déterminer un lien causal?
- Variable X et variable Y doivent être interreliées (condition de relation)
- La variation de X doit précéder la variation de Y (condition d’antécédence temporelle)
- La relation entre X et Y ne doit pas être expliquée par une 3ème variable confondante (condition absence explication alternative)
V/F La corrélation est un synonyme de causalité
FAUX
V/F La corrélation ne remplit seulement que la condition 1 (condition de relation) du lien causal.
VRAI
V/F La corrélation est seulement une mesure descriptive, elle ne peux donc pas être utilisée comme statistique inférentielle.
Faux, elle peut aussi être utilisée comme statistique inférentielle
Comment se compose un diagramme de dispersion (nuage de points)?
Les 2 axes sont les variables X et Y, chaque individu est représenté par un point dont la position cartésienne est (Xi, Yi)
V/F La corrélation permet de détecter les relations de tous types.
FAUX, seulement linéaire (droite)
Lors d’une corrélation positive, quand X ……, Y…..
- Augmente
- Augmente
Lors d’une corrélation négative, quand X ……, Y…..
- Augmente
- Diminue
Une corrélation nulle signifive que….. Une corrélation parfaite signifie que…..
- Deux valeurs similaires sur X peuvent être associées à 2 valeurs opposées sur Y
- Un changement sur X est associé à un changement propotionnel sur Y
Le coefficient de corrélation varie entre …. et ….
-1 et 1
Le signe du coefficient de corrélation indique….. tandis que la valeur numérique indique…..
- La direction de la relation (+ = positive et - = négative)
- Force de la relation (1 = relation parfaite et 0 = absence de relation)
Sur quelle échelle se situe le r de Pearson?
Intervalle ou ratio
Quel calcul de coefficiten de corrélation est le plus puissant et le plus simple à interpréter?
Le r de Pearson
Sur quoi est basé le calcul du r de Pearson?
Sur la notion de covariance (le degré auquel 2 variables varient ensemble)
V/F Le r de Pearson permet de déterminer la relation linéaire entre 2 variables discrètes.
FAUX, continues
V/F Le r de Pearson est une mesure de covariance non standardisée.
FAUX, elle est standardisé (divisé par le produit des écart-type de chaque variables)
Donne la formule du r d Pearson et explique la.
r= (COVxy)/(Sx)(Sy)
Explication: defré auquel les 2 variables varient ensemble/degré auquel les 2 variables varient séparément
Quelles sont les 2 manières d’interpréter un coefficient de relation?
- Barèmes
- Pourcentage de variance commune exprimé par le coefficient de détermination (r^2)
V/F Les barèmes sont très fiables pour interpréter le coefficient de relation.
FAUX, les barèmes ne sont pas tous pareils (il faut surtout comparer des effets d’importance similaire dans le même domaine)
Qu’est-ce que le r^2?
Coefficient de détermination: pourcentage de variance commune (partagé) entre 2 variables
Quelles sont les postulats de la corrélation?
- Relation Linéaire entre X et Y
- Variables sur une échelle d’intervalle ou de ratio
- Les 2 variables se distribuent normalement
- Homogénéité des variances
- n>ou= à 20
Comment peut-on vérifier le postulats d’homogénéité des variances?
À l’aide du diagramme de dispersion (si plus dispersés aux extrémités, pas respecté)
Comment peut-on vérifier le postulats de relation linéaire entre les variabless?
À l’aide du diagramme de dispersion (si ne suis pas la droite, pas respecté)
Comment peut-on vérifier le postulats de distribution normale des variables?
À l’aide du diagramme de dispersion (si variabilité non symétrique des 2 côtés de la droite, pas respecté)
Nomme les facteurs qui influences la corrélation (2)
- Données extrêmes (font diminuer la corrélation)
- Étendue des données (+ elle est petite, plus la corrélation diminue)
Nomme les 3 utilités de faire l’inspection visuelle des données receuillies à l’aide du diagramme de dispersion
- Vérifier si les postulats sont respectés
- Détecter la présence de données extrêmes
- Évaluer l’étendue des données
V/F Le coefficient de corrélation à lui seul peut nous informer de la corrélation dans une population.
Faux, il faut calculer une valeur de t pour déterminer si cette relation est réelle dans la population
Quelle est la variable du coefficient de corrélation dans une population?
p (rhô)
V/F Le test inférentiel sur la corrélation ne peut qu’être bilatéral.
Faux, il peut être unilatéral OU bilatéral
Quelle distribution d’échantillonnage est utilisée dans le test inférentul sur la corrélation?
t de Student, avec n-2 dl
Quel est la formule du t lors d’un test inférentiel sur la corrélation?
t= (r (√(n-2)))/√(1-r^2))
Formule mathématiquement les hypothèses statistiques bilatéral et unilatéral de la démarche inférentielle pour coefficient de corrélation.
Unilatéral
H0: p ≤ 0
H1: p>0
(aurait pu être l’inverse)
Bilatéral
H0: p = 0
H1: p ≠0
Lors d’un test inférentiel sur une corrélation, quel est le choix du test?
Corrélation de Pearson
Comment prenons-nous une décision statistique lors d’un test inférentiel sur une corrélation (SANS SPSS)
Comparer le t calculé avec le t associé au niveau alpha (tcritique) (vérifier zone de rejet)
Quels élements peuvent se trouver dans une conclusion selon le contexte lors d’un test inférentiel pour corrélation? (3)
- Direction relation: relation linéaire positive/négative signifcative
- Force relation: une corrélation de … est typiquement décrite comme faible/modéré/forte
- Variance commune (r^2): il y a approximativement …% de variance commune entre X et Y
Comment rapporte-on les résultats d’une démarche inférentielle pour corrélation calculé à la main VS SPSS?
Calculs à la main: t obs (dl) =….> tcrit (dl)=…..
SPSS: r(dl)= ……, p=…..
Quelle ligne permet d’identifer ces variables dans SPSS
a. Le r de
b. Le p observé
c. Le n
a) Corrélation de pearson
b) Sig
c) N
Lors de l’interprétation d’une Corrélation de Pearson, que signifie r^2/p^2 Pourcentage de variance commune (partagée) entre les deux variables
Pourcentage de variance commune (partagée) entre les deux variables
Quelle est la différence de signification entre r^2 et p^2?
r^2: correspond au coefficient de détermination ÉCHANTILLON
p^2: correspond au coefficient de détermination POPULATION