Chapitre 2 : L’approche statistique de la réalité Flashcards
En épidémiologie, les variables peuvent être regroupées suivant trois dimensions. Nommez les.
- Personnes
- Lieux
- Temps
Décrire : Variables quantitatives (2)
- numérique
- on partage les valeurs numériques en valeurs discrètes et continues
Différenciez variable quantitative discrète et continue
- Discrète : ne peut être exprimée par une fraction
- Continue : peuvent s’exprimer par une fraction
Décrire : Variable qualitative ou catégorielle (2)
- correspond à des qualités, des attributs
- par convension, est discrète
Pour une variable donée, l’ensemble des classes constitue une…?
une échelle de classification
Pour qu’un classement des observation soit juste, les classes qui constituent l’échelle doivent nécessairement satisfaire à 2 conditions.
Nommez les.
- mutuellement exclussives : chaque individu ou chaque observation de la variable ne peut appartenir qu’à une seule classe
- mutuellement exhaustives : chaque individu ou chaque observation de la variable doit appartenir à une classe
Nommez les types d’échelles de classification
- Échelle nominale
- les classes ne sont que nommées
- Échelle ordinale
- les classes sont nommées et ordonnées
- Échelle par intervalle
- nommées et ordonnées
- relation de distance entre les valeurs
Chaque regroupement des données pour effectuer le passage d’une échelle à l’autre entrâine une perte de quoi?
perte d’informations
il s’agit donc, en quelque sorte, d’une voie à sens unique
Le nombre d’observations regroupes dans une classe est appelé ____ de cette classe.
fréquence absolue ou effectif
Décrire : Distribution de fréquences
L’ensemble des classes d’une échelle avec leur fréquence
On peut noter qu’un tableau de distribution de fréquences comporte généralement 4 colonnes.
Nommez les.
- Les classes
- L’effectif ou la fréquence absolue de chaque classe
- Fréquence relative qui présente en pourcentage la répartition des effectifs dans les différentes classes
- Fréquence relative cumulée qui additionne la férquence relative des classes
Nommez les représentations graphiques possibles pour : Échelle nominale ou ordinale (3)
- Diagramme en secteurs proportionnels
- Diagramme en barres proportionnelles
- Diagramme en barres
Nommez les représentations graphiques possibles pour : Échelle par intervalle (4)
- Histogramme
- Polygonne de fréquences
- Graphe en lignes
- Graphe de percentiles
Décrire : Mesure de tendance centrale
- Caractérise par le fait que toutes els valeurs observées tendent à se rassembler autour d’elle
- 3 types
Nommez les 3 types de mesures de tendance centrale
- moyenne
- médiane
- mode
Nommez les principaux types de moyennes qui figurent dans la littérature médicale e tpsychosociale (3)
- arythmétique
- pondérée
- géométrique
Nommez la lacune de la moyenne arithmétique
influencée par les valeurs extrêmes (atténuée si le nombre d’observations est grand)
Comment calculer la moyenne pondérée?
- Façon #1 : La somme des moyennes de chaque classe multipliée par le nombre d’observations dans chaque classe, divisée par le nombre total
- Façon #2 : Utiliser le point milieu de chaque classe. Cette approche suppose que la répartition des données est symétrique et uniforme à l’intérieur de chaque groupe.
Décrire : Moyenne géométrique
- Utilise le produit des valeur sobservées, n’est définie que pour des valeurs positives
- Permet de réduire l’influence des valeurs extrêmes, surtout basses
- Particulièrement utilisée dans le contexte des analyses de laboratoire où les distributions sont souvent asymétriques

Décrire : Médiane (4)
- Cette mesure divise en deux aprtie ségales en nombre l’ensemble des valeurs observées, préalablement mises en ordre croissant.
- Une moitié des valeur sobservées est inférieure à la médiane, et l’autr emoitié est supérieure à celle-ci.
- Pas influencée par les valeurs extrêmes
- Lorsque la valeur n (nombre de d’observations) est paire, la médiane se situe entre deux valeurs observées et doit être calculée.
Décrire : Mode (5)
- valeur qui revient le plus souvent
- influencé par els fréquences des observations
- plis sensible aux changements et moins stables que la moyenne, surtout si l’on dispose de peu d’observations
- possible de le déterminer pour des variables tant qualitatives que quantitatives
- possible d’avoir plusieurs modes dans une même distribution
C’est quoi la relation entre les échelles de classification et les mesures de tendance centrale?
- Nominale : Mode
- Ordinale : Mode, médiane
- Par intervalle : Mode, médiane, moyenne
Les mesures de dispersions fournissent quoi comme renseignements?
Renseignements sur la variabilité des observations
Nommez les principales mesures de dispersion (5)
- Étendue
- Quantiles
- Variance
- Écart type
- Coefficient de variation
Décrire : Étendue (2)
- Différence entre lav aleur la plus grande (maximale) et plus petite (minimale) d’un ensemble d’observation
- Subit l’influence que des valeurs extrêmes
Décrire : Quantiles (2)
- Permettent de diviser l’ensemble en un certain nombre de partie ségales
- Exige que les données soient ordonnées
Décrire : Variance
- L’idée d’utiliser la distance (ou l’écart) de chaque valeur par rapport à la moyenne

Décrire : Écart type
Racine carrée de la variance

Lorsqu’on calcule l’écart type dans un sous-ensemble d’une population, soit un échantillon, on utilise quelle formule?

Selon l’objet d’étude est une population ou un échantillon, on utilise une notation différence.
Différenciez les
- Population
- Moyenne = μ
- Variance = σ2
- Écart type = σ
- Échantillon
- Moyenne = m
- Variance = s2
- Écart typique = s
Décrire : Coefficient de variation (4)
- Permet de comparer deux distributions d’une m^ême variable ou de variables différentes
- Rapport de l’écart type à la moyenne
- CV = σ/μ
- Le résultat est une fraction ou un pourcentage
- Plus la valeur du coefficient de variation es télevée, plus grande est la variabilié des données observées
Décrire : Échantillon
Sous-ensemble de la population que l’on souhaite étudier
Un grand échantillon permet de détecter une information plus ___ qu’un petit échantillon
plus précise
Plus il y a de variabilité dans l’information recherchée, plus l’échantillon doit être comment?
grand
La taille de l’échantillon dépendra de quoi? (4)
- Plus petite différence que l’on veut détecter
- Précision souhaitée
- Puissance souhaitée
- Variabilité des données
Nommez les types d’échantillonage (4)
- Aléatoire simple
- Aléatoire stratifié
- Systématique
- En grappes
Décrire : Échantillonnage alétatoire simple
Chaque personne ou objet de la population a la même probabilité de faire partie de l’échantillon puisqu’ils sont tous pigés au hasard.
Décrire : Échantillonnage aléatoire stratifié
En se basant sur une caractéristique de la population ciblée, on la divise d’abord en strates (sous-groupes de la population) pour ensuite sélectionner de façon aléatoire des membres de chacune des strates en respectant leur proportionnalité dans la population.
Décrire : Échantillonage systématique
Chaque élément qui compose l’échantillon est choisi de façon régulière, selon un intervalle régulier, à l’intérieur de la population ciblée.
Décrire : Échantillonnage en grappes
En se basant sur la position géographique de la population ciblée, on la divise d’abord en grappes (sous-groupes de la population) pour ensuite en sélectionner un certain nombre de façon aléatoire afin de former l’échantillon.