Cours 5 Flashcards
Quels sont les 2 types de données manquantes?
- Aléatoire: pas attribuable aux caractéristiques du participant (ex: questionnaire perdu, erreur de codage, perte de coordonnées)
- Non-aléatoire: attribuable aux caractéristiques du participant (ex: ne sait pas lire ou écrire, décide de ne par répondre, ne peux pas participer à l’étude, etc.)
À partir de quel niveau, est-ce que les données manquantes sont problématiques?
Si les donnes sont manquantes de façon aléatoire et représente plus de 10%, cela peu poser un problème au niveau de la généralisation
Quelles sont les caractéristiques de la loi normale?
- La courbe à une forme de cloche
- La courbe est symétrique par rapport à la droite verticale qui passe par la moyenne
- La mode, la médiane et la moyenne ont la même valeur
- La distribution suit une règle empirique: 68.3% des observations se situent à un écart type de la moyenne, 95.4% à 3 écart-type, 99.7% à 3 écarts-types
Qu’est ce que la symétrie?
Quand le mode, la médiane et la moyenne sont égaux
Qu’est ce qu’une asymétrie négative?
Quand le mode est plus élevé que la médiane et la moyenne
Concentration des valeurs fortes/élevés
Qu’est ce qu’une asymétrie positive?
Le mode est plus faible que la médiane et que la moyenne
Concentration des valeurs faibles/peu élevés
Qu’est ce que le coefficient d’asymétrie?
Une mesure utilisé pour vérifier si la distribution est plus ou moins normale. Si le coefficient est de 0, la courbe est normale.
Lorsque la valeur est positive, on a une asymétrie positive et lorsqu’elle est négative, on a une asymétrie négative
Plus le ratio est élevé, plus l’échantillon est anormalement distribué (skewness)
Qu’est ce qu’une courbe mésokurtique?
Une courbe normale
Comment appelle-t-on un courbe élancée avec une distribution relativement homogène?
Une courbe Lépokurtique
Comment appelle t’on un courbe plus plate avec une forte variation et une distribution relativement hétérogène?
Platikurtique
Qu’est ce que le kurtosis?
Le coefficient d’aplatissement pour vérifier si la distribution est plus ou moins normale. Pour le calculer, on utilise le rapport d’aplatissement et l’erreur standard d’aplatissement
Le kurtosis sera de 0 lorsque la distribution est normale, lorsqu’il est positif la distribution est leptokurtique, lorsque la valeur est négative, la distribution est platikurtique
Si le kurtosis est de + de 3.29, on ne respecte pas le postulat de normalité
Quelle est l’option à privilégier et l’option de dernier recours pour tenter de normaliser la courbe?
Transformation est la méthode à privilégier et éliminer les valeurs extrême est celle de dernier recours
Pourquoi doit-on parfois recoder nos variables?
Limiter le nombre de catégories
Suite à l’inspection de la répartition des répondants dans les diverses catégories (si moins de 10% dans une catégorie)
Mieux répondre à nos objectifs de recherche
Suite à l’inspection de la normalité de la distribution, si problématique