Cours 4 Flashcards
V ou F. Comme on n’a pas accès à la population, on doit estimer les paramètres b0 et b1 à partir de l’échantillon.
VRAI
V ou F. La relation entre X et Y dépend de B1 (EXAMEN)
VRAI
À quoi correspond B0 ?
La valeur prédite de Y lorsque la valeur du prédicateur X vaut 0.
Le meilleur estimateur de B1 à partir des données
À quoi correspond B1 ?
Au nombre d’unités d’augmentation de la valeur prédite Y lorsque la valeur du prédicateur X augmente de 1 unité
Que cherche-t-on à définir à partir de B1 et B0? (EXAMEN)
Si la prédiction de Y connaissant X est meilleure que celle ne connaissant pas X
Quel est le meilleur modèle selon l’hypothèse nulle ?
B0 = moyenne
Quels sont les 4 tableaux en sortie sur SPSS dans une régression linéaire ?
- Variables introduites/éliminées
- Récapitulatif des modèles
- ANOVA
- Coefficients
À quoi correspond la variable X dans le tableau des variables introduites/éliminées ?
Le prédicateur introduit dans le modèle, variable indépendante
À quoi correspond la variable Y dans le tableau des variables introduites/éliminées ?
La variable prédite, variable indépendante
À quoi correspond t dans le tableau des coefficients?
t = b0 - H0 (signal) / ES b0 (bruit)
où H0 = 0
Tente de déterminer si b0 est différent de 0 et si b1 est différent de b0
V ou F. Lorsque l’alpha est plus petit que 0.05, on rejette H0. Lorsque alpha est plus grand que 0.05, on conserve H0 (EXAMEN)
VRAI
Pourquoi réalise-t-on une ANOVA ?
Pour tester si le modèle explique mieux les données que le modèle de base : la moyenne des valeurs de la variable Y. Ce modèle de base recèle
Qu’est-ce qui reflète l’hypothèse nulle de l’ANOVA ?
La moyenne des valeurs de la variable Y (modèle de base), meilleur prédicteur.
À quoi correspond l’hypothèse alternative de l’ANOVA ?
Le modèle utilisant les meilleures valeurs des estimateurs (b^0 et b^1)
Qu’est-ce que la SCT ?
SC de l’erreur pour H0
Qu’est-ce que la SCR ?
SC de l’erreur pour H alternative
Qu’est-ce que la SCM ?
la différence entre la SCT-SCR, expliquée par le modèle alternatif, somme des carrés expliquée par le Modèle
Que représente la statistique F ?
Le rapport “signal sur bruit”
Quel est le but des résultats de F?
Permet de rejeter le modèle de base au profit de du modèle alternatif avec une probabilité d’erreur inférieure à 0.1% si H0 est vraie
Donc la variable Y permet de mieux expliquer la variable X que si on ne la connaissait pas
Car SCR = SCT donc n’explique pas mieux
Quel est le problème de l’ANOVA ?
Le test est basé sur les carrés moyens (CM) du modèle et des résiduels
Or les CMR dépend de la taille de l’échantillon
Plus N est grand, plus le CMR est faible
Plus CMR est faible, plus F est faible
Plus F est faible, plus il est facile de rejeter H0
Qu’est-ce que R^2 ?
La taille d’effet du modèle sur la prédiction de Y
Quel est le problème de R^2 ?
Plus k est grand par rapport à N1, plus on risque d’expliquer de la variabilité correspondant à de l’erreur d’échantillonnage, plutôt que d’expliquer un effet réel dans la population
Donc plus k est grand par rapport à N, moins l’explication des données se généralisera à l’ensemble de la population (pas d’erreur dans mes données mais pas généralisable à la population)
*Plus N est grand, plus dl res est petit > test puissant
Quelle est la solution à R^2?
R^2 ajusté
Plus k est grand par rapport à N, plus la valeur de R2 ajusté est petite
Si N est beaucoup plus grand que k, alors R2 ajusté = R2
À quoi correspond R ?
La corrélation entre le prédicteur X et la variable prédite Y