Cours 5 : Inspection des données Flashcards
Pourquoi est-il important d’inspecter ses données ?
- Permet de nous familiariser avec les données en main
- Permet de vérifier la faisabilité/respect de critères de base
- Permet de déterminer le type d’analyse statistique adéquat
Quelles sont les observation des données selon le type de variable (quanti vs quali)
Quali :
* Observation et déclaration des valeurs manquantes
* Inspection de la répartition des effectifs parmi les différentes catégories
Quanti :
* Inspection de la normalité de la distribution
* Gestion des valeurs « extrêmes » si nécessaire
Quelles sont les 2 types de données manquantes et leur caractéristiques ?
Aléatoire :
- N’est pas attribuable aux caractéristiques du participant
* Questionnaire perdu, perte des coordonnées du participant, erreur de codage ou d’entrée de données, …
Non-aléatoire :
- Attribuable aux caractéristiques du participant/biais de l’étude
* Ne sais pas lire ou écrire, décide de ne pas répondre à
certaines questions, ne peux pas participer à l’étude car incarcéré/hospitalisé, …
Quelles sont les étapes de l’inspection des variables quali et leur caractéristiques ?
1- Observation des données manquantes
- NSP
2- Inspection de la répartition/ distribution des effectifs
- Recoder pour éviter d’avoir des catégories sous les 10%
- Éviter d’utiliser des variables pour laquelle seulement 10% ou - de l’échantillon se retrouve dans une des deux catégories (dichotomique)
Quelles sont les étapes pour l’inspection des variables quantitatives et leurs caractéristiques ?
1 - Identification des données manquantes
- % de données manquantes pour chaque variables
2- Inspection de la normalité de la distribution
Quelles sont les caractéristiques de la loi normale ?
- La courbe a la forme d’une cloche
- La courbe est symétrique par rapport à la droite verticale qui passe par la moyenne
- Le mode, la médiane et la moyenne ont la même valeur
- La distribution des données suit une règle empirique
- Environ 68.3% des observation se situent à +- 1écart-type de la moyenne
- Environ 95.4% des observation se situent à +- 2écart-type de la moyenne
- Environ 99.7% des observation se situent à +- 3écart-type de la moyenne
Quelles sont les types de symétrie ?
- Symétrie
- Asymétrie positive : valeurs à droite
- Asymétrie négative : valeurs à gauche
Quels sont les types d’aplatissement ?
- Mésokurtique : courbe normale
- Leptokurtique : courbe élancée
- Platikurtique : courbe plate
Pourquoi recoder une variable ?
- Variables qualitatives
- Limiter le nombre de catégories
- Suite à l’inspection de la répartition des répondants dans les diverses catégories (- de 10% d’effectifs)
- Mieux répondre à nos objectifs de recherche
Pourquoi transformer et éliminer les valeurs extrêmes ?
- Variables quantitatives
- Suite à l’inspection de la normalité de la distribution, si
problématique