Cours 5 Flashcards
Que permet l’inspection des données ?
*Étape cruciale de la recherche quantitative
- Permet de nous familiariser (mieux comprendre) avec les données en main
- Permet de vérifier la faisabilité/respect de critères de base
- Permet de déterminer le type d’analyse statistique adéquat
Quels sont les deux étapes à l’inspection des données: Variable qualitative (nominale, ordinale)
- Observation et déclaration des valeurs manquantes
- Inspection de la répartition des effectifs parmi les différentes catégories
Quels sont les 3 étapes à l’inspection des données: Variable quantitative (intervalle, continue)
- Observation et déclaration des valeurs manquantes
- Inspection de la normalité de la distribution
- Gestion des valeurs “extrêmes” si nécessaire
Quels sont les deux raisons qui peuvent faire en sorte d’avoir des données manquantes ?
**(1) De façon aléatoire **
- N’est pas attribuable aux caractéristiques du participant
*Les données manquantes ne sont pas de la “faute” du participant, découle du hasard…
- Questionnaire perdu, perte des coordonnées du participant, erreur de codage ou d’entrée de données, …
**(2)De façon non aléatoire **
- Attribuable aux caractéristiques du participant/biais de l’étude
*Les données manquantes sont de la “faute” du participant
- Ne sais pas lire ou écrire, décide de ne pas répondre à certaines questions, ne peux pas participer à l’étude car incarcéré/hospitalisé, …
Dans quel cas, est il utile d’utiliser les analyses statistiques ?
- Pour vérifier si les données manquantes sont de façon aléatoire et/ou
- Pour vérifier si moins de 5%-10% des données sont manquantes = moins problématique, car on tolère ce pourcentage de données manquantes
*Sinon, cela peut poser problème au niveau de la généralisation de lÉchantillon à la population
Quel sont les deux étapes de l’inspection des variables qualitatives ?
Étape 1 –Observation des données manquantes + identification de celles-ci
Étape 2 – Inspection de la répartition/distribution des effectifs
*Variable dichotomique ou catégorielle (nominale/ordinale)
- Évitez d’utiliser une variable pour laquelle seulement 10% ou - de l’échantillon se retrouve dans une des catégories
- Recoder pour éviter d’avoir des catégories avec moins de 10%
- Ce qui permet une puissance statistique – pour que le poids dans toutes les catégories soit semblable, pour ensuite faire nos comparaisons.
Exemple de récodage pour avoir un moins un seul de 10%, sinon manque de puissance statistique
- (0)= Vol de moins de voiture (70%); (1)=Vol de moins de moins de 5000$ (25%); (2)=Cambriolage (4%); (3)=Vol qualifié (1%)
- *Recoder en: (0) Vol de voiture (70%); (1) Autre crime contre les biens (30%)
Quels sont les deux étapes de l’inspection des variable quantitatives ?
Étape 1 – Identification des données manquantes
Étape 2 – Inspection de la normalité de la distribution ( vérifier si loi normale dans la distribution de l’histogramme)
Quels sont les caractéristiques de la Loi normale ?** (4)
- La courbe a la forme d’une cloche
- La courbe est symétrique par rapport à la droite verticale qui passe par la moyenne
- Le mode, la médiane et la moyenne ont la même valeur
- La distribution des données suit une règle empirique :
*Si ma variable est bien distribuée, la distribution va respecter 3 éléments
Quel sont les 3 éléments sont toujours présents dans la Loi normale ? *****
- Environ 68.3% des observations se situent à ± 1σ de la moyenne
- Environ 95.4% des observations se situent à ± 2 σ de la moyenne
- Environ 99.7% des observations se situent à ± 3 σ de la moyenne
σ = Écart-type pour une population
S = Écart-type pour un échantillon (É.-T.)
(connaître les % et ce qu’il représente): ex – le 68,3 % de mes répondant se trouve à 1 écart type dans le cadre d’une loi normale
Lorsque vous avez cette carte, référez-vous aux images de la distribution de la loi normal dans les notes
Tout ce qui se trouve à l’extérieur de nos écarts type de 3 (+ ou - ), ce sont des événements qui sont très peu probables = Valeurs extrêmes
Que permet la symétrie ?
La symétrie nous permets de déterminer si nos valeurs sont distribués normalement.
Les 2 éléments à considérer pour savoir si nos valeurs suivent une loi normale ou non: symétrie + asymétrie
Expliquer la Symétrie en lien avec la Loi normale
Symétrie : Lorsque notre mode, médiane et moyenne sont égales, cela signifie que notre distribution est normalement distribuée. (elle suit la loi normale)
Expliquer l’Asymétrie en lien avec la Loi normale ?
Asymétrie: L’important c’est d’observer le bas de notre courbe puisqu’on va dire que est asymétrique… lorsque :
- Négative : Le mode est plus grand que la médiane et la médiane est plus grand que la moyenne.
- ## Positif : mod est plus petit que la médiane, la médiane est plus petit que la moyenne.
Nommez et expliquer les 3 types de courbes de l’aplatissement
Ce sont tous des courbes qui suit la loi normale mais ont un aplatissement différent et s’interprète différemment
- Mésokurtique: suit la loi normale - les valeurs sont bien réparties
- Leptokurtique: valeurs très semblables entre elles
- Platikurtique : valeurs très variés entre elles
*Aller voir image cours 5 car doit etre en mesure d’interpréter un tableau SPSS les types de courbes