mq 2 Flashcards
qu’est ce qu’une corrélation ?
l’association linéaire entre 2 variables
qu’est ce qune statistique ?
une donnée qui represente une ensemble de donnée
modèle statistique ;
equation qui cherche a represente le lien entre 2 variables
est ce que la cprrélation de prearson est un modele statistique ?
non cra il ne s’agit que d’une mesure d’association mais il srait possible d’en faire une regression
un bon model statistque
doit etre facielment interpetatble et généralisable
a quoi servent les postulats de base ?
il cherche a verifier la fiabilité du modèele et a quel point il est représentatif
quels sont les postyulats de base des modèles linéaires
- Linéarité de la relattion
- Répartion de l’erreur aléatoire (hétéroscédasticité, homogénéité des variances, normalité des résidus et absence de donée influente
- Indépendance des observations (sans multicolinéarité)
qu’est ce que l’effet de plaffonement
lorsque le questionnaire n’est pas assez sensible donc tout le monode mettrait 8 si ils ont un tag
quel est la diffférence entre une anova et une regression
l’anova contient une variable dependantenomibnal (groupes ) tandisque la rregression represente une variable indpendante continue
quoi faire en cas de dobnnée influente
- verifier si le quetsionnaire est bien remplie
- faire le modele avec et sans et voir l’impact que ca a sur le modele
exemple de multicolinéarité
age et nombre d’année de travail à al spvm
quels sont les postulats de base pour l’anova et la regression et quel tests devont nous faire pour voirb
linéarité : test seuellemnt la regression
homoscédasticité : diagramme de dispersion des resuiduels (regressions) levene (anova
Normalité des résiduels : histogramme des residus
données influente : cook
comment peut ont detrerminer entre quel groupe il existe des différences ?
en effectuent les contrastes ou les post hoc
qu’est ce que le ratio f
a quel point le modele mesure mieux quew el hasard
grande moyenne vs notre modele
pour l’anova , doit on prioriser les contrastes ou les post hoc
les contrastes si possible car offtre plus de puissance statistique ais attention àa faux positif et seulement possible si plan octogonal
quel contraste doit on prendre ?
le helmert qui compare tous les groupes sauf le dernier au moyennes des autres groupes
quel est l’utilité de faire des tests post hoc
on minimise les chances de faire des erreures de type 1 ou 2 et on garde la puissance statistique
quels osnt les tests post hoc a faire
LSD : devrait toujours le sortir : beauocup de chance de sortir significatif, attention a l’erreur de paux positif
bonferoni : plus conservateur
games howell : toujours le sortir , controle l’erreur de type 1 , peut sortir pas significatif
quel est le seuil pour la distance de cook?
en dessous de 1
qu’est ce qu’un degré de liberté
ne nombrre d’unité qui peuvent varier librement dans un modele statistique
la diffétrenc eebtre une anova et une anova factorielle
une aniva factorielle est simplement 2 anova
quel est le critère de correction à appliquer pour l’hétéroschédasticité?
HC3
quelle est la problématique relié àa l’utilisation de la regresion multiple ?
la multicolinéarité
quels sont les postulats associés à la régression multiple
- linéarité de la relation
- HOmoscédasticité
- absence de multicolinéarité
- absence de donnée influyente
- normaliré de la distribution des erreures autour
quels sont les 3 types de regression
régression linéaire standard : tout en mem temps
regression linéaire hiérarchique : choisi l’ordre
regresssion linéaire hiérarchique statistique: spss choisit
quele st e danger avec la regression linéaire hiérarchique statidtique
elle a tenfdance afaire des overfit (faux positif) et a maximiser le modèele meme si ca n’a pas trop de sens
dans la régression multiple , comment vérifier le probleme de multicolinéarité
si les corrélations sont en bas de 0,7 on est correct
si le vif est entre 5 et 10 on n’a pas de multicolinéarité
a quoi sert de durbin watson dans la regresion multiple
si il est au dessus de 1 et en dessous de 3 ca veut dire que l’erreur est pas aléatoire
quoi regarder dans la statistique des résidus de la regression multiple
distance de cook maximum en bas de 1 et distance de mohalonois en bas de 25
a quoi sert une ancova
a pouvoir controlé la premiere variable retirer cette variance
quelle est la différence entre une anova a mesures répétée et une ancova
l’ancova est plus puissante va permettre de detcetr un effet plus facilemen tl’autre est plus conservateur
l’ancova se base sur quelles autres analuyses
anova factorielle et regression multiple
quels sont le postulats de base de l’ancova
- linéarité
- indépendance des vi (très important pour détecter un effet )
- homogénéité avce levene et breush pagan et hc3
- absence d’effet d’interraction entre la covariable et les autres vi (terme d’interccation covariable *vi non significatif)
- absence de donnée influente (distance de cook)
qu’arive t’il su post hoc dans une ancova ?
des qu’il y a une covariabke on ne fait pas de post hoc
quele st l’objectif d’une anova a mesure répété
mesurer la différence intra sujet dans différentes conditions
les facteurs d’ajustement sont pour quoi?
pour les degré de liberté
qu’est ce qu’une mediation
une regression entre la vi la vm et la vd , le lien entre la vi et la vd passe par la vm
qu’est ce que ca fait hc3
c’est une mesure de correction pour l’hétéroscédaticité