CHAPITRE 9 - Régression multiple Flashcards
Qu’est-ce que la régression multiple?
la régression multiple est une extension du modèle de régression linéaire ( modèle pour prédire la variable d’une variable à partir d’une autre)
Que permet la régression multiple (2)?
(1) prédire la valeur d’un résultat à partir de plusieurs prédicateurs, (2) modèle hypothétique de la relation entre x et y mais avec plusieurs variables
À quoi ressemble l’équation de la régression multiple?
Elle est similaire à celle de la régression simple: y = b0 + b1x1+ b2x2+ bnxn + …
Qu’est-ce que b0 (3)?
(1) ordonnée à l’origine, (2) valeur de Y variable quand tous les x = 0, (3) c’est le point où l’axe de régression croise l’axe Y (vertical)
Qu’est-ce que la valeur de b (3)?
(1) b1 est le coefficient de régression pour la variable 1, (2) b2 est le coefficient de régression pour la variable 2, (3) bn est le coefficient de régression pour la énième variable
Quelles sont les méthodes pour la régression (3)?
(1) hiérarchique: le chercheur décide l’ordre dans lequel les variables sont entrées dans le modèle, (2) entrée: tous les prédicateurs simultanément, (3) stepwise: décisions mathématiques
Que peut-on dire sur la régression hiérarchique (3)?
(1) les prédicateurs connus (en se basant sur quoi?) sont entrés dans le modèle, (2) les nouvelles variables sont alors entrées dans un nouveau bloc ou une nouvelle étape, (3) le chercheur prend les décisions
Quel est l’inconvénient de la régression hiérarchique?
Se base sur l’hypothèse que le chercheur sait ce qu’il fait
Pourquoi le modèle hiérarchique est-il considéré comme une meilleure méthode (2)?
(1) basée sur la théorie, (2) permet d’évaluer la contribution unique d’une nouvelle variable parce que les prédicateurs connus sont maintenus constants dans le modèle
Que peut-on dire sur l’entrée des variables dans le modèle hiérarchique (2)?
(1) toutes les variables sont entrées simultanément dans le modèle, (2) les résultats obtenus dépendent de quelles variables sont entrées dans le modèle: il est important, par conséquent, d’avoir des raisons théoriques d’inclure une variable spécifique
Que peut-on dire sur le modèle stepwise (2)?
(1) les variables sont entrées dans le modèle à l’aide d’un critère mathématique, (2) l’ordinateur sélectionne les variables étape par étape
Quelles sont les étapes du modèle stepwise?
- SPSS évalue quel prédicateur explique le plus de variance dans le résultat
- Une fois le premier prédicteur sélectionné, un second est choisi parmi les prédicateurs restants
Qu’est-ce que R?
La corrélation entre les variables et le modèle
Qu’est-ce que R2?
La proportion de variance expliquée par le modèle
Qu’est-ce que le ratio F de ANOVA (2)?
(1) regarde si la variance expliquée par le modèle est plus grande que l’erreur (SSM) vs (SSR), (2) Nous dit si le modèle est un meilleur prédicteur que la moyenne
F = (N-k-1)R2/k(1-R2)
Qu’est-ce que le Beta?
Le changement dans le résultat associé à une unité de changement dans le prédicteur
Qu’est-ce le beta standardisé?
La même chose que le bêta (Le changement dans le résultat associé à une unité de changement dans le prédicteur) mais exprimé en écart-type
Quelles sont les généralisations que nous pouvons faire par rapport aux bêtas standardisés (3)?
(1) on espère généraliser les résultats de l’échantillon à la population entière, (2) pour ce faire, des postulats doivent être respectés, (3) le viol des postulats empêche de généraliser nos conclusions à la population
Quels sont les postulats de base (4)?
(1) variable: a - result doit être connu, b - les prédicateurs peuvent être connus ou dichotomiques, (2) variance n’égale pas zéro: les prédicateurs doivent avoir une variance, (3) linéarité: la relation est linéaire, (4) indépendance: toutes les valeurs devraient provenir d’une personne différente
Quels sont les postulats supplémentaires (3)?
(1) pas de multicolinéarité: prédicateurs ne doivent pas être trop fortement corrélés, (2) homoscédasticité: pour chaque valeur des prédicateurs, l’erreur devrait être constante. On travaille avec graphiques ZRESID vs ZPRED, (3) Normalité des erreurs: graphique de distribution des erreurs
Que peut-on dire sur la multicolinéarité (2)?
(1) la multicolinéarité existe si les prédicateurs sont fortement corrélés, (2) peut-être évalué à l’aide des diagnostics de multicolinéarité