Cours 5 Flashcards
À quoi correspond b ?
Constantes qu’on estime à partir de la population (estimateurs)
À quoi correspond X ?
Chaque élève (prédicteur)
À quoi correspond k ?
Le nombre de prédicteurs
À quoi correspond b0 ?
La valeur prédite de Y lorsque la valeur de tous les prédicateurs (X1 et X2) valent 0
À quoi correspond b1 ?
Nombre d’unités d’augmentation de la valeur prédite Y lorsque X1 augmente d’une unité et les autres prédicteurs ne changent pas
À quoi correspond b2 ?
Nombre d’unités d’augmentation de la valeur prédite Y lorsque X2 augmente d’une unité et les autres prédicteurs ne changent pas
V ou F. Les coefficients non standardisés, les coefficients standardisés, le t et la sig. ont les mêmes signification que pour la régression simple
VRAI
Qu’est-ce qu’une corrélation semi-partielle ?
Proportion de la variance totale en Y expliquée uniquement par X1
Qu’est-ce qu’une corrélation partielle ?
Proportion de la variance en Y qui n’est pas expliquée par les autres prédicateur, mais qui est expliquée par X1
L’autre variable existe mais tous ce qu’elle pouvait expliquer est retiré
Qu’est-ce qu’une corrélation partielle ?
Proportion de la variance en Y qui n’est pas expliquée par les autres prédicateur, mais qui est expliquée par X1
L’autre variable existe mais tous ce qu’elle pouvait expliquer est retiré
Quoi faire si un prédicateur peut être très bien prédit par les autres prédicteurs?
- Il est inutile
- Il ne permet pas d’augmenter SCM dans la prédiction de Y, Il augmente le dlM, donc CMM diminue, donc F diminue
- Il devient difficile d’interpréter le modèle final.
Si les valeurs de VIF surpassent 5 ou que la tolérance est plus petite que 0.2, qu’arrive-t-il ?
On doit considérer éliminer le prédicteur correspondant
À quoi sert l’IC des coefficients ?
Vérifier si la valeur de H0 est incluse dans l’intervalle (Voir Bootstrap)
Qu’est-ce que les résidus “standardisés” ?
Les scores Z des résidus (Variance non expliquée par le modèle)
Qu’est-ce que les valeurs influentes ?
Score élevé signifie que la donnée a le potentiel d’avoir une influence importante sur l’estimation des paramètres
Qu’est-ce que les valeurs influentes ?
Score élevé signifie que la donnée a le potentiel d’avoir une influence importante sur l’estimation des paramètres du modèle
Qu’est-ce que la distance de Cook ?
Reflète l’influence réelle d’une observation sur l’estimation des paramètres
Quelle est la différence entre les scores extrêmes et les scores “valeurs influentes” ?
Extrême : Extrême dans la distribution des résidus
Influentes : POTENTIEL d’avoir une influence importante sur l’estimation des paramètres du modèle
V ou F. Plus la valeur est extrême à l’intérieur des prédateurs, plus elle a le potentiel d’influencer l’estimation du modèle
VRAI
Quel est l’objectif principal de la méthode de Cook ?
Généraliser les conclusions de l’analyse à la population
Qu’arrive-t-il si le modèle estimé est trop sensible à certaines données de notre échantillon?
Le modèle risque de varier beaucoup d’un échantillon à l’autre. Le modèle est instable et peu reproductible (ne se généralise pas bien à la population)
Qu’arrive-t-il si on a un score est extrême (extrême dans les résidus) ou a un potentiel d’influence (extrême dans les prédicteurs) ?
La donnée semble peu représentative de la population
Qu’arrive-t-il si on a un score est extrême (extrême dans les résidus) ou a un potentiel d’influence (extrême dans les prédicteurs) ?
La donnée semble peu représentative de la population
Si DCook est néanmoins faible alors que le score est extrême (extrême dans les résidus) et/ou potentiellement influent (extrême dans les prédicteurs), alors garder le score risque d’augmenter artificiellement la puissance de l’analyse en augmentant le N à l’aide d’une valeur non représentative de la population.
Qu’arrive-t-il si on a un score qui est ni extrême (non extrême dans les résidus), ni n’a un potentiel d’influence (non extrême dans les prédicteurs) ?
La donnée semble représentative de la population
Si DCook est néanmoins élevé alors que le score n’est ni extrême (non extrême dans les résidus) ni potentiellement influent (non extrême dans les prédicteurs), alors garder le score risque de rendre le modèle estimé instable et peu reproductible (et donc peu généralisable à la population de toute manière).