La distribution normale Flashcards
Qu’est-ce que la distribution normale?
Principe voulant que la totalité des observations de la population sur une variable X se distribue à peu près normalement et permet de faire des inférences car se rapproche le plus de l’échantillon
MAIS
Pas toujours vrai en psycho (ex: violence conjugale)
Ne signifie pas qu’un phénomène est normal/anormal
Quelles sont les deux manières de vérifier la normalité d’une distribution?
- Tests statistiques
- Intervalles de confiances
Quels sont les deux tests statistiques pour évaluer la normalité?
- Test de normalité Shapiro-Wilks: échantillon de 50 et moins
- Test de normalité Kolmogorov-Smirnov (KS): plus de 50
En quoi consiste le test statistique de normalité?
Teste l’hypothèse (H0: distribution est normale, H1: distribution est non normale)
- Choisir le bon test selon N
- Identifier p colonne SIG
- Comparer p à 0,05 (5%)
- Rédiger notation avec 3 décimales (p = 0,093)
En quoi consiste le calcul des intervalles de confiance?
Si distribution normale, les indices d’asymétrie et d’aplatissement devraient s’approcher de 0 DONC vérifie si 0 est compris entre les deux intervalles
Formule:
[Asymétrie +/- (2x erreur standard)]
[Aplatissement +/- (2x erreur standard)]
Quelles sont les 4 approches pour limiter le biais de non-normalité?
- Tronquer les données (trimming)
- Windsoriser
- Estimation robuste (rééchantillonage/bootstraping)
- Transformation non-linéaires des données
*2-3 sont les meilleures
Qu’est-ce que le tronquage de données?
Couper 5% des données de chaque côté
MAIS
- Peut nuire pour trouver des résultats
- Pas représentatif du phénomène
- Pas très éthique
Qu’est-ce que la windsorisation?
Remplacer données extrêmes par données élevées (3 ÉT)
= biaise moins la distribution tout en conservant les données
Qu’est-ce que le bootstrapping?
Ne change pas les données, mais demande à SPSS de faire un échantillon robuste lorsque vient le temps de faire une analyse inférentielle (ajuste uniquement le temps de l’analyse)
Qu’est-ce que la transformation non-linéaires des données
Corrige l’asymétrie positive (commencer par 1 puis passer à l’autre si marche pas)
- Racine carré (sqrt variable)
- Logarithmique (lg10 variable)
- Inverse (1/ variable)
Si asymétrie négative:
-Reflet puis 1,2,3
**Crée une nouvelle variable = besoin de tester si normal
Quel est l’avantage des intervalles de confiances par rapport au test de normalité?
Un peu moins sévère = va davantage dire que c’est normal
Que devons-nous faire pour utiliser la distribution normale centrée réduite?
Nous devons transformer les données de la variable en score Z
**Si pas normal au départ, ne sera pas plus normal avec Z
Quelle est l’aire totale sous la courbe?
1