Module 2A: Questions, objectifs et hypothèses de recherche Flashcards
Variable:
Caractéristique susceptible d’être différente selon les personnes, lieux ou temps
Valeur:
Tout état que prend la variable
(ex: variable sexe → 2 valeurs, masculin/féminin)
Types de variables: (3)
- Variables de personnes: attributs anatomiques, physiologiques, sociaux, économiques, culturels
- Variables de lieux: pays, régiom, situation géographique
- Variables de temps: quand?
Classification des variables: (2 types, 2 sous-types chaque)
-
Variable quantitative: numérique
- Discrète → uniquement nombres entiers (ex: # d’enfants)
- Variable → continue, contient des fractions (ex: taille)
-
Variable qualitative: attributs, toujours discrète
- Dichotomique → possèdent que deux modalités
- Ordinale → avec séquence claire
Moyenne vs. proportion:
Moyenne: valeurs quantitatives
Proportion: valeurs qualitatives
Échelle de classification:
Doit permettre de distribuer toutes les observations (chacune dans une seule catégorie)
Échelle de classification:
Doit permettre de distribuer toutes les observations (chacune dans une seule catégorie)
Deux conditions pour assurer que le classification des observations est juste:
- Mutuellement exclusives: each data point can only be in one class
- Collectivement exhaustives: must apply to all data
Trois types d’échelles de classification:
- Échelle nominale: classes sont nommées
- Échelle ordinale: classes sont nommées et ordonnées (plus petit → plus grand ou vice versa)
- Échelle par intervalle: nommées et ordonnées et une relation de distance entre les valeurs
Passage d’une échelle → une autre:
Each pass down = more data lost, therefore becomes +++ general
individuel (6 years old) → intervalle (1-7 years old) → ordinale (school-aged child) → nominale (child)
Distributions de fréquences:
Rend les données plus claires et intelligibles
Fréquence absolue:
= #observations/classe
Colonnes dans tableau de distribution de fréquences: 4
- Classes
- Effectif/fréquence absolue
- Fréquence relative (% de répartition des effectifs dans les classes) → 10/70 people = 12.8%
- Fréquence relative cumulée (additionne fréquence relative des classes, % in that class and those above it)
Représentation graphique: échelle nominale/ordinale
-
Diagramme en secteurs proportionnelles (pie graph)
- Proportions des valeurs prises par une variable
- Seulement une série de données
-
Diagramme en barres proportionnelles
- Analogue à la représentation par tarte
-
Diagramme en barres
- Chaque barre représente fréquence de la classe d’une variable
Représentation graphique: échelle par intervalle (4)
-
L’histogramme:
- Utilisée pour variables quantitatives continue:
-
Chaque rectangle doit:
- Suivent l’ordre des classes
- Base coïncide avec l’intervalle de la classe correspondante
- Aire de rectangle = fréquence de la classe correspondante
-
Chaque rectangle doit:
- Utilisée pour variables quantitatives continue:
-
Polygone de fréquences:
- Utilisée pour variables continue et discrètes mais réservée pour les variables continues
- Obtenu par passer ligne par milieu des sommets des rectangles de l’histogramme
-
Graphe en lignes:
- Variable y en fonction d’une variable x
-
Graphe des percentiles:
- Partagent une distribution en 100 parties égales entre elles
Règles générales de représentation graphique
- Doivent êtres aussi simples que possible
- Titre clair, concis, et précis
- Échelle et unités spécifiques
- Sources indiquées
- Légende ajoutée si nécessaire
IMPORTANT D’ÉVITER SOUTE SURCHARGE
Trois mésures de tendance centrale:
- Moyenne
- Médiane
- Mode