Cours 11 - la régression linéaire simple Flashcards

1
Q

Que pouvons-nous prédire avec la régression?

A

La valeur d’une variable Y avec une autre X
VI: Variable prédicatrice (X)
VD: Variable prédite (Y)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qualité de la prédiction repose sur quoi

A

Sur la force de la relation linéaire entre deux variables
Plus la corrélation entre les variables est élevée, plus il sera facile de prédire une variable à partir de l’autre

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Effet de la droite de régression sur l’erreur de prédiction

A

Elle minimise l’erreur de prédiction et passe par un maximum de points

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Avec une corrélation parfaite, quel est l’effet sur la droite de régression?

A

Chaque Y prédit sera identique au Y réel, il n’y aura aucune erreur de prédiction

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Erreur de prédiction

A
  • À moins d’avoir une relation linéaire parfaite, il y aura des erreurs dans la prédiction de Y faites à partir de la droite de régression
  • L’erreur de prédiction c’est la différence entre le Y réel et le Y prédit
    Erreur de prédiction = Y réel - Y prédit
  • Pour chaque valeur de Y réel qui ne passe pas par la droite de régression, il y a un résidu
  • On vise à minimiser les écarts entre les valeurs observés et les valeurs prédites
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Pourquoi la somme des différences est au carré?

A

Pour ne pas avoir une somme de 0
On souhaite que la somme de carrés soit la plus petite possible: plus elle est petite, plus les points sont près de la droite, meilleure est la prédiction

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Équation de régression

A

Y prédit = bX + a

X = la valeur du prédicteur
b = la pente de la droite de régression (coefficient de régression)
a = ordonnée à l’originie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Afin de trouver une droite qui offre la meilleure prédiction de Y pour une valeur de X:

A
  • On cherche les valeurs de a et b qui donneront la fonction linéaire la mieux ajustée
  • On cherche les valeurs de b et de a qui minimisent
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Interprétation de la droite de régression

A
  • O-O peut avoir signification: lorsqu’on veut connaître le niveau de base
  • Pente : nombre d’unités de changement de Y prédit en fonction d’un changement d’une unité de x.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Pourquoi utiliser un coefficient de régression standardisé?

A
  • Indépendant de l’échelle de mesure
  • Représente le changement de Y prédit en fonction du changement d’un écart-type de X
  • Utile pour comparer l’importance relative de différents coefficient de régression standardisé
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quel est le meilleur indice de la qualité de la prédiction?

A

r au carré: plus r carré est grand, plus la prédiction est bonne (moins de chance d’erreurs de prédiction)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quel est l’objectif du test d’hypothèse sur la régression?

A

Détermine si la prédiction de Y prédit par X est généralisable à la population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qu’est-ce qui est comparé lors de la démarche inférentielle

A

Variabilité de Y qui est attribuable à X vs Variabilité de Y qui n’est pas attribuable à X

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Sommes des carrées

A

SCtotale = variation totale de Y
SCrégression = variation de Y expliquée par X
SCrésiduelle = variation de Y non expliquée par X

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Test de la pente

A

SPSS: vérifie si b n’est pas égal à 0 à l’aide d’un test t

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Démarche inférentielle

A
  1. Identifier le hypothèses statistiques (pas question de bi/uni)
    H0 : p au carré = 0
  2. Spécifier le seuil de signification alpha
  3. a) Test utilisé: régression linéaire simple
    b) Conditions d’utilisation
    n est suffisamment grand n>20
    les 2 variables sont sur une échelle intervalle ou ratio
    relation linéaire entre les deux variable
    homogénéité des variances
    Variables sont distribués normalement
    c) Distribution d’échantillonnage du F de Fisher avec 1 dl au numérateur (tjrs 1) et (n-2) dl au dénominateur
    d) Calculs
  4. Décision statistique
    Rejet automatique si Fobs > F critique
  5. Conclusion selon le contexte