Cours 3 - Biais Flashcards
L’ordonnée à l’origine
La valeur de y lorsque x est à 0
Biais de la pente
L’erreur (e) est différente pour un groupe
Vrai ou faux : Un biais n’est pas un synonyme de différence
Vrai, on par le biais si la pente est différente pour deux groupes en raison d’une inéquité dans le fonctionnement du test et non en raison d’une véritable différence entre les populations à l’étude.
La présence d’un biais ____ les intervalles de confiance.
Élargie les intervalles de confiance
Les données extrêmes impacts (biais) :
A) les intervalles de confiance
B) l’erreur
C) Seuil de signification
D) Toutes ces réponses
D) Toutes ces réponses
Théorème de la limite centrale
Si n > 30, la distribution d’échantillonnage des moyenne est normale et même si la distribution de la population n’est pas normale.
- Dans tous les échantillons possibles, j’ai plus de chance de tomber sur un échantillon typique plutôt qu’atypique
La distribution d’échantillonage
Est symétrique et normale, souvant égale à la moyenne de la population dans la vaste majorité des cas
Vrai ou faux : La distribution d’échantillonnage est équivalente à l’échantillon ?
FAUX, ce n’est pas notre échantillon
Précision : La distribution d’échantillonnage représente toutes les possibilités d’échantillons possibles à partir des données de notre population. L’échantillon est une des possibilités que l’on retire de la distribution des échantillons.
Vrai ou faux : L’écart-type de la distribution d’échantillonnage est le même que l’écart-type de la population/ n.
Vrai
Vrai ou faux : Il est possible d’obtenir une distribution d’échantillonnage respectant la normalité même si la population est clairement non normale avec un n suffisant
Vrai
Test de KS ou Shapiro
- Qu’est-ce qu’un résultat significatif veut dire ?
Sert à tester la normalité.
- Un résultat de p < 0.05, indique que la distribution n’est pas normale, donc que la normalité n’est pas respectée.
Si j’ai un grand échantillon, est-il nécessaire de faire un test de Shapiro ?
Non, habituellement l’échantillon suivra le théorème de la limite centrale
Vrai ou faux : La taille de l’échantillon affectera le résultat significatif du test de normalité
Vrai, plus l’échantillon est grand, moins le résultat est significatif
L’homogénéité de la variance
L’erreur doit demeurer constante à travers les différents prédicteurs
Si nos participants proviennent de la même population, et qu’ils ne varient pas de façon égale, on parle de… (3 termes)
- Hétéroscédasticité
- Inégalité des variances
- Hétérogénéité des variances
Test de Levene
- Qu’est-ce qu’un résultat significatif veut dire ?
Sert à tester l’homogénéité des variances, donc savoir si les variances des différents groupes sont les mêmes.
- Un p < 0.05 signifit que les variances ne sont pas homogèmes donc que les variances des deux groupe sont significativement différentes.
- Non significatif = variances homogènes
Vrai ou faux : La taille de l’échantillon affectera le résultat significatif du test d’homogénéité des variances
Vrai, plus l’échantillon est grand, moins le résultat est significatif, donc plus je retrouve de l’homogénéité de la variance
Test de normalité
Si j’ai un résultat de z = 4.68, dans mon asymétrie je peux dire que :
A) Mon test est statistiquement significatif à p < 0.05
B) Mon test n’est pas statistiquement significatif à p > 0.05
C) Mon test est statistiquement significatif à p < 0.01
D) Mon test est statistiquement significatif à p > 0.05
E) Mon test est statistiquement significatif à p > 0.01
C) mon test est statistiquement significatif à p < 0.01 ( plus de 2.58, donc significatif à 0.05 mais en plus à 0.01), donc que mon échantillon ne respect pas la normalité.
Quel type de transformation permet de réduire l’asymétrie positive ?
A) Transformation Inverse
B) Transformation Log
C) Transformation racine carré
D) Toutes ces réponses
E) Aucune de ces réponses
B) et C)
Quel type de transformation permet de réduire l’impact de grands scores ?
A) Transformation Inverse
B) Transformation Log
C) Transformation racine carré
D) Toutes ces réponses
E) Aucune de ces réponses
A)
Vrai ou faux : Transformer les données modifie également l’hypothèse testée ?
Vrai : on passe à une comparaison de moyennes arithmétiques à des moyennes géométriques
Vrai ou faux : les conséquences pour le modèle statistique d’appliquer la “mauvaise” transformation, pourrait être pire que les conséquences de l’analyse des scores non transformés
Vrai !