La distribution normale Flashcards

1
Q

Qu’est-ce que la distribution normale?

A

Principe voulant que la totalité des observations de la population sur une variable X se distribue à peu près normalement et permet de faire des inférences car se rapproche le plus de l’échantillon

MAIS
Pas toujours vrai en psycho (ex: violence conjugale)
Ne signifie pas qu’un phénomène est normal/anormal

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quelles sont les deux manières de vérifier la normalité d’une distribution?

A
  • Tests statistiques

- Intervalles de confiances

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quels sont les deux tests statistiques pour évaluer la normalité?

A
  • Test de normalité Shapiro-Wilks: échantillon de 50 et moins
  • Test de normalité Kolmogorov-Smirnov (KS): plus de 50
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

En quoi consiste le test statistique de normalité?

A

Teste l’hypothèse (H0: distribution est normale, H1: distribution est non normale)

  1. Choisir le bon test selon N
  2. Identifier p colonne SIG
  3. Comparer p à 0,05 (5%)
  4. Rédiger notation avec 3 décimales (p = 0,093)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

En quoi consiste le calcul des intervalles de confiance?

A

Si distribution normale, les indices d’asymétrie et d’aplatissement devraient s’approcher de 0 DONC vérifie si 0 est compris entre les deux intervalles

Formule:
[Asymétrie +/- (2x erreur standard)]
[Aplatissement +/- (2x erreur standard)]

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quelles sont les 4 approches pour limiter le biais de non-normalité?

A
  1. Tronquer les données (trimming)
  2. Windsoriser
  3. Estimation robuste (rééchantillonage/bootstraping)
  4. Transformation non-linéaires des données

*2-3 sont les meilleures

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qu’est-ce que le tronquage de données?

A

Couper 5% des données de chaque côté

MAIS

  • Peut nuire pour trouver des résultats
  • Pas représentatif du phénomène
  • Pas très éthique
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qu’est-ce que la windsorisation?

A

Remplacer données extrêmes par données élevées (3 ÉT)

= biaise moins la distribution tout en conservant les données

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est-ce que le bootstrapping?

A

Ne change pas les données, mais demande à SPSS de faire un échantillon robuste lorsque vient le temps de faire une analyse inférentielle (ajuste uniquement le temps de l’analyse)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Qu’est-ce que la transformation non-linéaires des données

A

Corrige l’asymétrie positive (commencer par 1 puis passer à l’autre si marche pas)

  1. Racine carré (sqrt variable)
  2. Logarithmique (lg10 variable)
  3. Inverse (1/ variable)

Si asymétrie négative:
-Reflet puis 1,2,3

**Crée une nouvelle variable = besoin de tester si normal

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quel est l’avantage des intervalles de confiances par rapport au test de normalité?

A

Un peu moins sévère = va davantage dire que c’est normal

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Que devons-nous faire pour utiliser la distribution normale centrée réduite?

A

Nous devons transformer les données de la variable en score Z
**Si pas normal au départ, ne sera pas plus normal avec Z

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quelle est l’aire totale sous la courbe?

A

1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly