COURS 9- L'analyse bivariée : variables d'intervalles/ration Flashcards

1
Q

Qu’est-ce que le diagramme de dispersion?

A

Outil pour représenter graphiquement la relation entre deux variables intervalles/ration

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Que permet de caractériser le diagramme de dispersion?

A

Permet de caractériser la direction, la force, et la forme de la relation

-Les trois dimensions de l’association statistique sont analysées

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Que nous montre le diagramme de dispersion par rapport à la direction de la relation?

A

Direction de la relation – Avec l’inclinaison du nuage de points
 Positive : les variables évoluent dans le même sens
 Négative : les variables évoluent en sens inverse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Que nous montre le diagramme de dispersion par rapport à la force de la relation?

A

 Plus la relation est les points du nuage de point sont concentrés, plus la force est forte, moins les points sont concentrés, plus la relation est faible

 Plus les points se rapprochent les uns des autres, le nuage de point devient soit une relation parfaite positive, soit une relation négative parfaite
 La relation peut être
	Forte
	Modérée
	Faible
	Nulle
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Que nous montre le diagramme de dispersion par rapport à la forme de la relation?

A

Forme de la relation
 Linéaire – la direction évoluent toujours dans le même sens, la relation et la pente sont constantes

 Non-linéaire (relations curvilinéaires) – la direction de la relation change, la pente change
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qu’est-ce que le coefficient de corrélation?

A

Outil pour synthétiser en une seule valeur la relation entre deux variables d’intervalles / ratio

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Que permet de caractériser le coefficient de corrélation?

A

Permet de caractériser la direction et la force de la relation, mais pas la forme de la relation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Commet interpréter le coefficient de corrélation?

A

S’interprète comme le Gamma

 L’échelle s’étend de –1 à +1.

 0 signifie une association nulle.

 Signe négatif signifie une association négative.

 -1 signifie une association négative parfaite. (Ou plus on se rapproche du -1, plus la relation est faible)

 Signe positif signifie une association positive.

 +1 signifie une association positive parfaite. (Ou plus on se rapproche du +1, plus la relation est forte)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quel caractéristiques peuvent être attribués à différents intervalles suite au calcul du coefficient de corrélation?

A

± ] 0 - 0,25 [ :
Faible

± [ 0,25 - 0,50 [ : Moyenne

± [ 0,50 - 0,75 [ : Forte

± [ 0,75 - 1 [ : Très forte

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quels sont 2 problèmes du coefficient de corrélation?

A

Le coefficient de corrélation saisit seulement la linéarité d’une relation entre deux variables.
- Il ne fonctionne pas bien avec les relations non-linéaire
- Il exclue beaucoup de cas face à des corrélations curvilinéaires
 Il aura tendance à sous-estimer la force de la relation

Le coefficient de corrélation est sensible aux cas extrêmes

  • Si un cas ne suit pas la tendance, il pourra biaiser le coefficient de corrélation
  • Le coefficient aura alors tendance à sur ou sous-estimer la force de la relation
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qu’est-ce que le test F?

A

Mesure de la signification statistique du coefficient de corrélation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Que révèle le test F?

A

Révèle si une association statistique existe probablement entre ces deux variables dans l’ensemble de la population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Comment interpréter F?

A

Raccourci #1
 Si le F est supérieur à 3,84 :
– On peut rejeter l’hypothèse nulle (pas d’association dans la population)
– On peut conclure qu’une relation existe probablement dans la population (95%)
– On peut généraliser la direction, mais non la force

 Si le F est inférieur à 3,84 :
– On ne peut pas rejeter l’hypothèse nulle (pas d’association dans la population)
– On ne peut pas conclure qu’une relation existe probablement dans la population

Raccourci #2
Nombre de la case sig. (bilaterale)

 Si la signification est inférieure à 0,05 :
– on peut rejeter l’hypothèse nulle (pas d’association dans la population)
– on peut conclure qu’une relation existe probablement dans la population (95%)
– Comme un score F supérieur à 3,84, on peut généraliser

 Si la signification est supérieure à 0,05 :
– on ne peut pas rejeter l’hypothèse nulle (pas d’association dans la population)
– on ne peut pas conclure qu’une relation existe probablement dans la population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qu’est-ce que l’équation de régression?

A

Outil pour résumer, avec le plus de détails, la relations entre deux variables d’intervalles/ ratio

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Que permet l’équation de régression?

A

Permet de prédire (estimer) des valeurs inconnues de la variable dépendante

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quelle est la constante (a) de l’équation de régression?

A

Constante (a) :

  • Point sur l’axe de Y où passe la droite de régression
  • Valeur de la variable dépendante lorsque la variable indépendante a la valeur de 0
  • Ex : taux de fertilité auquel on devrait s’attendre quand le taux d’urbanisation est à 0
  • Ex : quel serait le pourcentage de vote obtenu auquel il faut s’attendre si le niveau satisfaction était à 0
17
Q

Quelle est le coefficient de régression (b) de l’équation de régression?

A
  • Le signe du coefficient reflète la direction de la relation
  • La valeur du coefficient indique l’effet sur la variable dépendante d’une hausse d’une unité sur la variable indépendante (donc à chaque fois qu’il y a une hausse d’un point sur la variable indépendante, quel est l’effet sur la variable dépendante)

La différence entre a et b.  coefficient de régression n’a pas de limite de valeur possible, contrairement à la limite de -1 à 1 du Test F (le signe indique toujours la direction de la relation)

  • Indique le gain en vote fait pour chaque augmentation d’un point du niveau de satisfaction
18
Q

Qu’est-ce que la statistique t pour le coefficient de régression?

A

Mesure de la signification statistique du coefficient de régression (pente)

19
Q

Quelle sont les critères s d’interprétation de t?

A
  • Critère : pour que le coefficient de régression soit statistiquement significatif à 95%, la valeur absolue de t doit dépasser 1,96

 Si la valeur abs. du t est supérieure à 1,96:
- on peut rejeter l’hypothèse nulle (pas d’association dans la population)
- on peut conclure qu’une relation existe probablement dans la population (95%)
 Si la valeur abs. du t est inférieure à 1,96:
- on ne peut pas rejeter l’hypothèse nulle (pas d’association dans la population)
- on ne peut pas conclure qu’une relation existe probablement dans la population

20
Q

Qu’est-ce que le coefficient de détermination?

A

Mesure de la proportion de variation chez la variable dépendante qui est expliquée par l’équation de régression

  • Pourcentage de la variable dépendante qui est expliquée (beaucoup ou peu expliquée)
  • Ce n’est pas une mesure d’association statistique
  • Mesure standardisée (entre 0 et 100%)– La valeur est entre 0 et 1 (soit entre 0 et 100%)
21
Q

Qu’Est-ce que l’intervalle de confiance d’une estimation?

A

Éventail de valeurs autour de l’estimation ponctuelle

(À 95%) :
Estimation  1,96 * Erreur standard de l’estimation

L’erreur standard de l’estimation est l’équivalent de l’écart-type de l’équation de régression.

L’erreur standard de l’estimation est calculée par SPSS.