Cours 3 Flashcards

1
Q

La régression multiple teste les relations entre une VD et 1+ VI. Expliquer l’équation des régression multiples.

Y’= B0 + B1X1 + B2X2 + B3X3 +…+ BkXk

A

Y’= B0 + B1X1 + B2X2 + B3X3 +…+ BkXk

Y’ = Valeur prédite

Y = Valeur observée

B0 = Ordonnée à l’origine

B1 = quantité de changement dans la VD
associée à une unité de la 1e VI (same pour B2, B3, Bk)

B est un coefficient non-standardisé (la valeur dépend de la variance de la VI)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Comment on interprète le .05 âge dans l’équation de régression ci-dessous?

Dépression = 10 + 0.5 âge + 2 anxiété

A

La valeur est positive, donc plus on vieilli plus on a un score de dépression élevé. On obtient un score VD équivalent à la moitié de l’âge . À chaque fois qu’on augmente de 1 an l’âge, on augmente la dépression de .5, MAIS l’anxiété va augmenter la dépression de 2 pour sa part. Donc le Y va augmenter de 2.5.

ATTENTION On ne peut pas dire directement que l’anxiété va avoir un plus gros impact que l’âge. Pourquoi? Parce que l’anxiété est mesurée différement que l’âge donc on le standardise sur une autre échelle que l’âge.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

L’objectif de l’analyse de régression est de minimiser la différence
entre les valeurs […] et […] de la
variable dépendante, avec N observations.

A

L’objectif de l’analyse de régression est de minimiser la différence
entre les valeurs observées et prédites de la
variable dépendante, avec N observations.

Pourquoi on met la relation ici au carré? Pour éviter d’avoir des valeurs positifs. Donc on veut éviter que les valeurs négatfs et positifs s’annulent. On veut minimiser cette écart au carré (valeur prédite vs observée).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quelles sont les différentes questions de recherche de la régression multiple?

A
  1. Présence et force d’une association entre 1 VD et 1+ VI
  2. Importance relative de chaque VI
  3. Contribution de VI additionnelles
  4. Étude de relation non-linéaire ou d’interaction entre plusieurs VI
  5. Comparaison de la contribution de plusieurs ensembles de VI
  6. Prédire la VD pour un nouvel échantillon de sujets (mêmes VI)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

VRAI ou FAUX

La régression multiple est sensible à la combinaison et à la fidélité des VI

A

VRAI

La régression multiple est sensible à la combinaison et à la fidélité des VI

La régression est idéale si chaque VI présente peu d’erreur de mesure, elle est corrélée avec la VD mais peu avec les autres VI

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quelles sont les conditions d’utilisation de la régression multiple? (6)

A
  1. Ratio N/VI
  2. Linéarité de la relation : E(résidus) = 0
  3. Homoscédasticité : Var(résidus) = σ2
  4. Indépendance des erreurs : Cov(résidus) = 0
  5. Normalité des erreurs : résidus ~ N(0, σ2)
  6. Absence de multicollinéarité (et singularité)

** Une stratégie efficace est d’examiner les résidus de la prédiction pour vérifier les postulats 2 à 6

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Décriver la condition d’utilisation N/VI de la régression multiple ainsi que les calculs pour la vérifier.

A

Ratio N/VI trop faible amène une association forte mais fortuite. Si trop de VI, on a de l’overfitting
Association générale :
N += 50 + 8m (m = nombre de VI)
Contribution d’un prédicteur spécifique :
N += 104 + m (m = nombre de VI)

N doit être plus important si la VD est non-normale, si une association faible est attendue, ou si les VI présentent une faible fidélité
Si régression par étapes, un ratio de 40 : 1 est suggéré.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

La somme des résidus de la régression s’appelle […]

A

La somme des résidus de la régression s’appelle la somme des carrés résiduels (SSres)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quel est l’implication de l’utilisation de la méthode des moindres carrés sur la droite de régression afin de réduire la somme des carrés résiduels?

A

La somme du carré des erreurs est une fonction quadratique (x2), qui prends la forme d’une parabole et qui a donc toujours un seul minimum.

  • > On peut démontrer de façon plus générale (avec le calcul différentiel) que cette méthode assure que thêta sera celui qui réduit au maximum les erreurs
  • > Par conséquence, la méthode des moindres carrés assure que la régression est une solution optimale pour ajuster les VI et la VD.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

La multiplication de deux matrices de variance/covariance permet d’obtenir directement la valeur des poids de régression associés à une SCRES minimale. Expliquer l’idée derrière la formule ci-dessous.

A

Les bêta (coefficient de régression) sont obtenus grâce à la multiplication de deux matrices (de variance entre les VI puis de variance entre les VI et la VD).

Ici je regarde la relation entre mes VI et ma VD et je divise par la matrice de VC entre les VI. Si mon prédicteur n’est pas bon, la covariance sera mauvaise. Quand on divise une covariance par une variance, on la standardise et on crée une corrélation. DONC ICI LA FORMULE EST UNE CORRÉLATION. Les poids de régression sont donc très proche de l’idée qu’on a de la corrélation, simplement corriger pour le fait que les variables indépendantes sont variantes.

Les bêta sont fonc des corrélations qui prennent compte de la relation redondante entre les prédicteurs.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Dans une régression, il y a trois sources de variance. Quelles sont-elles?

A
  1. La variance de la variable dépendante (SSY)
  2. La part qui est expliquée par la combinaison linéaire
  3. des prédicteurs (SSreg)
  4. La part qui n’est pas expliquée (erreurs de prédiction = résidus = SSres)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Dans une régression multiple, à quoi correspond R2?

A

R2 représente la portion de variance expliquée de la VD par la meilleure combinaison linéaire des VI. Nous dit à quel point on arrive à bien prédire la probabilité de la VD.

R2 = SSreg / SSY

**La meilleur régression va donner 1 (SSy / SSy) alors que la pire va donner proche de 0 **

R corresponds à la corrélation entre les valeurs prédites et les valeurs observées de la VD (Y) :

R = rYY’

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quelles sont les trois types de régression linéaire, en fonction de l’ordre d’entrée des VI?

A
  1. Méthode standard – toutes les VI en une seule étape
  2. Méthode hiérarchique (sequential) – l’entrée des VI selon un ordre prédéterminé
  3. Méthode statistique (stepwise) – l’entrée des VI selon un critère statistique

** L’ordre d’entrée des prédicteurs dans la régression va déterminer la répartition de la variance commune aux prédicteurs.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Ce diagramme montre l’effet de l’ordre d’entrée des prédicteurs sur la répartition de la variance dans une régression. Expliquer quel diagramme représente quel méthode d’entrée des prédicteurs.

A

Diagramme b = Méthode standard. Le premier prédicteur va ramasser ce qui est unique à lui, le deuxième va ramasser ce qui est unique à lui, etc. Donc ce qui n’est pas unique à eux va être “perdu”, non assigné. Si on voit quela VI1 n’est pas complètement tenu en compte, on peut se dire que la VI2 overlap trop et donc a nuit. Cette méthode prend seulement en compte les variances unique à une VI.

Diagramme C = Méthode hiérarchique (de séquence). La première variable ramasse tout ce qui est à elle (pas juste unique) (a + b, correspond à la corrélation entre la VI/VD). Le deuxième ramasse tout ce qui est à elle (qui n’a pas été prise par la précédente) (c+d, correspond à la corrélation entre la VI/VD qui n’est pas du à VI1), etc. C’est le chercheur qui a décidé de l’orde d’entrée des données

Diagramme D = Méthode statistique. L’entrée va dépendre de l’importance de chaque VI pour déterminer son ordre d’entrée. Puisque la valeur a+b est plus grande, VI1 va rentrer en 1er, puis d+e est plus importante pour expliquer VD donc VI3 va entrer en deuxième puis il ne restera que la région c.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Comment choisit-on le type de régression linéaire? (4)

A
  1. Étude de la contribution des VI
    1. Méthode standard: J’ai plusieurs prédicteurs, je veux savoir c’est lequel le plus important (la contribution unique).
  2. Construction vs vérification d’un modèle
    1. Méthode hiérarchique: Si on veut vérifier un modèle, je veux comparer deux modèles qui poussent différents prédicteurs comme important. Dans ce cas, on prend un modèle et on ajoute l’autre modèle et on voit si ça ajoute de quoi (sinon, le modèle de base est le plus fort).
  3. Réduire le nombre de VI et/ou problème de multicollinéarité
    1. Méthode statistique: On veut savoir les variables les plus importantes dans notre modèle car on en a trop, on va donc prendre la méthode stats (standard, on sait pas si on va avoir toutes les données sign, hiérarchique, on va avoir un biais). Problème multicollinéarité (redondance entre les prédicteurs): Modèle standard est très peu robuste à la redondance des prédicteurs (perd une trop grande partie de nos données). Naturellement, la méthode statistique va être robuste à la multicollinéarité (si la première variable amène trop d’influence et la deuxième peu, sa puissance sera automatiquement géré en fonction de sa puissance).
  4. Méthode statistique (stepwise) est très influencée par la taille d’échantillon (trop petite ou trop grande)
    1. La méthode statistique fait un test statistique à chaque étape donc même si on fait un modèle, chaque test d’entrée va être significatif et toutes nos prédicteurs vont être entrés. Le test d’entrée et de sortie est fait en fonction de la puissance du test qui est dépendante de l’échantillon.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quels sont les tests inférentiels qui sont fait sur la régression une fois qu’elle est complétée? (2+2)

A
  1. Test d’inférence sur R
    1. Ajustement du R2
  2. Contribution de chaque VI

Possible de faire par la suite

  1. Contribution d’un bloc de VI
  2. Comparer la contribution de blocs de VI
17
Q

Décriver le test d’inférence sur R utilisé pour la régression

A

Test d’inférence sur R
Ho: R2 = 0
Ha: R2 =/= 0
Le rejet de H0 implique un lien significatif entre les VI et la VD.

Le test repose sur un ratio F (variance expliquée/variance non expliquée) :

F = MSreg/MSres = (SCreg/dfreg) / (SCres/dfres​)

SC: Somme carré de la régression/des erreurs

df: Degré de liberté de la régression/des erreurs

18
Q

Décriver l’ajustement du R2 pour la régression et son utilité

A

Cet estimateur surestime la valeur du paramètre (la vraie corrélation R) dans un petit échantillon (il est « biaisé »). On utilise donc un R2 « ajusté» pour ce biais. Il est toujours plus bas que le R2 brut.

19
Q

La contribution de chaque VI se classe soit par une corrélation […] (pri) ou par une corrélation […] (sri)

A

La contribution de chaque VI se classe soit par une corrélation partielle (pri) ou par une corrélation semi-partielle (sri​)

Corrélation partielle (pri)

Corrélation entre la VI et la VD en ajustant pour la variance des autres VI. La VI explique une partie de la variation de la VD.

Corrélation semi-partielle (sri)
Contribution unique de la VI à la variance de la VD. La VI explique à 100% la variation de la VD.

20
Q

La contribution de chaque VI dans la régression de calcule selon deux aspects. Quels sont-ils?

A
  1. La portion commune entre VI et VD (selon méthode d’entrée)
    1. Se poser la question “comment la prédiction va s’établir pour une VI”. “Comment on rentre nos VI?” Standard, stats, hiérarchique. Décide le numérateur.
  2. Le diviseur (100% de la VD ou moins)
    1. La différence se fait au niveau du diviseur, pas du numérateur. Ici on regarde en retirant la valeur commune des autres au numérateur. On contôle pour la variance redondante entre les VIs sur la VD.
      1. Corrélation semi-partielle (sr2): Les diviseurs ici sont 100% de la variance de la VD. Le résultat ne peut jamais être au dessus du R2
      2. Corrélation partielle (pr2): Les diviseurs changent selon la situation. Le résultat peut être au dessus du R2.
    2. **Il est possible de comparer les corrélations semi-partielles, mais pas les corrélations partielles car on ne sait pas si elles partagent le même diviseur.
21
Q

Pour établir la signification de la contribution de chaque VI, un test t est réalisé
en divisant le […] par son
erreur standard (SE)

A

Pour établir la signification de la contribution de chaque VI, un test t est réalisé
en divisant le coefficient de régression par son
erreur standard (SE) :

t = B/SE

* Plus on est loin de zéro, plus on a de chance que ce soit significatif

22
Q

À quoi correspond le coefficient brut de régression et l’erreur standard dans le calcul de la contribution de chaque VI?

A

b/B: Poids de la VI sur la VD selon l’échelle originale de la VI

SE: L’erreur standard indique la variabilité (i.e., l’incertitude) associée à chacun des coefficients de régression. SE est fonction de la quantité de variance non-expliquée dans le modèle (MSres) et de l’interrelation entre les prédicteurs (ΣVI,VI).

23
Q

À quoi correspond le coefficient standardisé dans le calcul de la contribution de chaque VI?

A

Poids de la VI sur la VD ajusté pour la variabilité de la VD et de la VI (On va donc prendre nos coefficient de variance brute VI qu’on divise par la variance VD.). Permet la comparaison du poids de chaque VI!

B peut varier entre -1 et 1 car notre B est notre pente et elle peut être négatif.

24
Q

À quoi correspond le sr2 dans le calcul de la contribution de chaque VI?

A

sr2: La VI explique XX% de la variance de la VD.

25
Q

Il est possible de faire des tests inférentiels afin de vérifier la contribution d’un bloc de VI. Comment fait-on?

A

Réalisé surtout en régression hiérarchique Tester si l’ajout d’un ensemble (bloc) de VI contribue significativement à une meilleure explication de la variance de la VD. L’Idée est de comparer les comparaisons de blocs. Il faut donc comparer un ensemble de variables à un autre ensemble. Pour se faire facilement, on compare les R2 avant à après le bloc pour voir si le bloc de comparaison est significatif ou non.
Test F incrémental :

26
Q

Il est possible de faire des tests inférentiels afin de comparer la contribution de blocs de VI. Comment fait-on?

A

Rya = relation entre Y et bloc A de VI
Ryb = relation entre Y et bloc B de VI
Ho : Rya = Ryb
Ha : Rya =/= Ryb
Réalisé manuellement avec une statistique Z
selon un niveau alpha de 5% (Z = ±1.96)

27
Q

VRAI ou FAUX

Jusqu’à maintenant, toutes nos régressions assument que les relations sont linéaires. Par contre, beaucoup de modèles en apparence non-linéaires peuvent être estimés avec la régression linéaire.

A

VRAI

Jusqu’à maintenant, toutes nos régressions assument que les relations sont linéaires. Par contre, beaucoup de modèles en apparence non-linéaires peuvent être estimés avec la régression linéaire.

IMPORTANT : les coefficients de régression (b) doivent être linéairement indépendants (ne pas dépendre l’un de l’autre), mais cette condition ne s’applique pas aux prédicteurs.

28
Q

Quel est le problème principal des régression non-linéaire?

A

La difficulté provient du fait de trouver le « vrai » minimum d’une fonction d’erreur nonlinéaire (i.e., les coefficients de régression qui vont garantir le minimum de la SC erreur)

Solution : tenter de trouver les bonnes valeurs de départs des B pour éviter un minimum local.

29
Q

Que signifie l’interaction entre les VIs dans la régression?

A

La contribution de la VI1 à la VD varie selon la valeur de la VI2

30
Q

Quelle est la marche à suivre lorsqu’il y a une interaction entre nos VIs dans une régression? (3)

A
  1. Centrer les VI à une valeur de zéro (soustraire la moyenne à chaque valeur)
  2. Calculer le produit des deux VI
  3. Introduire le produit des deux VI comme une troisième VI

Conceptuellement similaire à un test de modération