COURS 9- L'analyse bivariée : variables d'intervalles/ration Flashcards
Qu’est-ce que le diagramme de dispersion?
Outil pour représenter graphiquement la relation entre deux variables intervalles/ration
Que permet de caractériser le diagramme de dispersion?
Permet de caractériser la direction, la force, et la forme de la relation
-Les trois dimensions de l’association statistique sont analysées
Que nous montre le diagramme de dispersion par rapport à la direction de la relation?
Direction de la relation – Avec l’inclinaison du nuage de points
Positive : les variables évoluent dans le même sens
Négative : les variables évoluent en sens inverse
Que nous montre le diagramme de dispersion par rapport à la force de la relation?
Plus la relation est les points du nuage de point sont concentrés, plus la force est forte, moins les points sont concentrés, plus la relation est faible
Plus les points se rapprochent les uns des autres, le nuage de point devient soit une relation parfaite positive, soit une relation négative parfaite
La relation peut être Forte Modérée Faible Nulle
Que nous montre le diagramme de dispersion par rapport à la forme de la relation?
Forme de la relation
Linéaire – la direction évoluent toujours dans le même sens, la relation et la pente sont constantes
Non-linéaire (relations curvilinéaires) – la direction de la relation change, la pente change
Qu’est-ce que le coefficient de corrélation?
Outil pour synthétiser en une seule valeur la relation entre deux variables d’intervalles / ratio
Que permet de caractériser le coefficient de corrélation?
Permet de caractériser la direction et la force de la relation, mais pas la forme de la relation
Commet interpréter le coefficient de corrélation?
S’interprète comme le Gamma
L’échelle s’étend de –1 à +1.
0 signifie une association nulle.
Signe négatif signifie une association négative.
-1 signifie une association négative parfaite. (Ou plus on se rapproche du -1, plus la relation est faible)
Signe positif signifie une association positive.
+1 signifie une association positive parfaite. (Ou plus on se rapproche du +1, plus la relation est forte)
Quel caractéristiques peuvent être attribués à différents intervalles suite au calcul du coefficient de corrélation?
± ] 0 - 0,25 [ :
Faible
± [ 0,25 - 0,50 [ : Moyenne
± [ 0,50 - 0,75 [ : Forte
± [ 0,75 - 1 [ : Très forte
Quels sont 2 problèmes du coefficient de corrélation?
Le coefficient de corrélation saisit seulement la linéarité d’une relation entre deux variables.
- Il ne fonctionne pas bien avec les relations non-linéaire
- Il exclue beaucoup de cas face à des corrélations curvilinéaires
Il aura tendance à sous-estimer la force de la relation
Le coefficient de corrélation est sensible aux cas extrêmes
- Si un cas ne suit pas la tendance, il pourra biaiser le coefficient de corrélation
- Le coefficient aura alors tendance à sur ou sous-estimer la force de la relation
Qu’est-ce que le test F?
Mesure de la signification statistique du coefficient de corrélation
Que révèle le test F?
Révèle si une association statistique existe probablement entre ces deux variables dans l’ensemble de la population
Comment interpréter F?
Raccourci #1
Si le F est supérieur à 3,84 :
– On peut rejeter l’hypothèse nulle (pas d’association dans la population)
– On peut conclure qu’une relation existe probablement dans la population (95%)
– On peut généraliser la direction, mais non la force
Si le F est inférieur à 3,84 :
– On ne peut pas rejeter l’hypothèse nulle (pas d’association dans la population)
– On ne peut pas conclure qu’une relation existe probablement dans la population
Raccourci #2
Nombre de la case sig. (bilaterale)
Si la signification est inférieure à 0,05 :
– on peut rejeter l’hypothèse nulle (pas d’association dans la population)
– on peut conclure qu’une relation existe probablement dans la population (95%)
– Comme un score F supérieur à 3,84, on peut généraliser
–
Si la signification est supérieure à 0,05 :
– on ne peut pas rejeter l’hypothèse nulle (pas d’association dans la population)
– on ne peut pas conclure qu’une relation existe probablement dans la population
Qu’est-ce que l’équation de régression?
Outil pour résumer, avec le plus de détails, la relations entre deux variables d’intervalles/ ratio
Que permet l’équation de régression?
Permet de prédire (estimer) des valeurs inconnues de la variable dépendante