Cours 4 Flashcards
Inspection des données def + variable quali vs quanti
Étape cruciale, permet de nous familiariser avec les données en main. Permet de vérifier la faisabilité / respect de critères de base, de déterminer le type d’analyse statistique adéquat.
Variable qualitative (nominale, ordinale) : observation et déclaration des valeurs manquantes, inspection de la répartition des effectifs parmi les différentes catégories.
Variable quantitative (intervalle, continue) : observation et déclaration valeurs manquantes, inspection de la normalité de la distribution, gestion des valeurs extrêmes.
Sorte de données manquantes
- De façon aléatoire : pas attribuables aux caractéristiques du participant (questionnaire perdu, perte de coordonnées du participant, …)
- De façon non aléatoire : ne sais pas lire ou écrire, décide de ne pas répondre à certaines questions, …)
- Si aléatoire et/ou moins de 5-10% manquante = moins problématique. Sinon problème au niveau de la généralisation.
Inspection de la répartition / distribution des effectifs
Variable dichotomique ou catégorielle (nominale / ordinale) : recoder pour éviter d’avoir des catégories avec moins de 10%.
Inspection de la normalité de la distribution
Courbe forme de cloche, symétrique par rapport à la droite verticale qui passe par la moyenne, mode, médiane et moyenne ont la même valeur.
Règle empirique de la loi normale : 68.3% plus ou moins 1 écart type de la moyenne. 95,4% plus ou moins 2. 99,7% plus ou moins 3 écart types.
Symétrie vs asymétrie (types)
Symétrie = mode = médiane = moyenne (cloche normale)
Asymétrie =
- Positive : mode « médiane « moyenne. Concentration des valeurs faibles / peu élevées (à gauche).
- Négative : mode » médiane » moyenne. Concentration des valeur fortes / élevées (à droite).
*Coefficient d’asymétrie utilisé pour vérifier si distribution +- normale. 0 = normale. Valeur positive = asymétrie positive. Valeur négative = asymétrie négative. Si asy./ES » 3.29 = non-respect, échantillon anormalement distribué
Aplatissements (3)
- Mésokurtique : courbe normale (cloche)
- Leptokurtique : courbe élancée (concentration des cas qui prennent les valeurs égales ou proches de la moyenne) (homogène)
- Platikurtique : courbe plate, cas s’éloignent de la moyenne, forte variation (hétérogène)
*Coefficient d’aplatissement : 0 = normale. Positive = lepto. Negative = Plati.
Valeurs extrêmes et normalité
plus l’échantillon est gros, moins le fait d’avoir une distribution plus ou moins normale est grave.