Module 2 Flashcards
Types de variables
De personnes, de lieux et de temps
Classification des variables
Qualitatives et quantitatives
Types de variables quantitatives
Continues ou discrètes
Sur une échelle de classification, quelles sont les 2 conditions auxquelles doivent répondre chaque classe de données?
- Exclusivité mutuelle
- Exhaustivité collective
Types d’échelles de classification
- Nominale
- Ordinale
- Par intervalles
Distribution de fréquences
Ensemble de classes d’une échelle avec leur fréquence absolue et relative dans un tableau
4 colonnes d’un tableau de distribution de fréquences
- Classes
- Effectif (fréquence absolue)
- Fréquence relative (%)
- Fréquence relative cumulée (%)
Types de diagrammes pour représenter échelle nominale ou ordinale
Diagrammes en secteurs proportionnels (tarte), en barres proportionnelles ou en barres
Types de diagrammes pour représenter échelle par intervalles
Histogramme, polygone de fréquences, graphe en lignes ou graphe de percentiles
Histogramme représente quel type de variables?
Quantitatives continues
Conditions à respecter pour chaque rectangle d’un histogramme
- Se suivent dans l’ordre des classes
- Chaque base coïncide avec l’intervalle de la classe correspondante
- Chaque aire mesure la fréquence de la classe correspondante
- Toutes les bases sont de largeur égales
C’est quoi les différences entre un histogramme et un polygone de fréquence?
Un polygone de fréquence, c’est un histogramme avec une ligne qui passe par le milieu du sommet de chaque rectangle
Quel type de graphe est surtout utilisé lorsque l’objectif n’est pas d’extrapoler à partir de valeurs trouvées?
Graphe en points
Mesures de tendance centrale
Moyenne, médiane, mode
3 types de moyennes
Arithmétique, pondérée, géométrique
Moyenne arithmétique
Somme des valeurs divisée par le nombre de valeurs
C’est quoi une moyenne pondérée? Ça se calcule comment?
- Quand les données sont regroupées en classes, on donne un poids à chaque classe selon le nombre de valeurs (poids) qu’elle contient
- Somme des moyennes arithmétiques de chaque classe multipliée par le nombre d’observations dans la classe, divisée par le nombre d’observations total
Moyenne géométrique
- Produit des valeurs observées, exposant (1/nb d’observations)
- Seulement pour des valeurs positives
- Surtout dans contexte d’analyses de laboratoire, où les distributions sont souvent asymétriques
La médiane est-elle influencée par les valeurs extrêmes?
Non
C’est quoi le mode?
La valeur qui revient le plus souvent
Mesures de dispersion
Étendue, quantiles, variance, écart-type et coefficient de variation
C’est quoi l’étendue?
La différence entre la valeur la plus élevée et la plus basse
C’est quoi la variance?
La moyenne de l’écart de chaque valeur par rapport à la moyenne de l’ensemble. La somme de ces écarts est toujours égale à 0.
Comment calculer la variance? Quelle est sa relation avec l’écart-type?
On doit faire la moyenne de l’écart de chaque valeur par rapport à la moyenne de l’ensemble. Toutefois, comme la somme de ces écarts est toujours égale à zéro, on doit mettre au carré chaque écart avant de calculer la moyenne des écarts (variance). La variance s’exprime donc au carré, et la racine carrée de cette valeur se nomme l’écart-type.
Symbole qui exprime la moyenne dans une population? Dans un échantillon?
Population: µ
Échantillon: m
Symbole qui exprime la variance dans une population? Dans un échantillon?
Population: σ^2
Échantillon: s^2
C’est quoi le coefficient de variation?
Permet de comparer 2 distributions d’une même variable ou de variables différentes. C’est le rapport de l’écart-type à la moyenne (σ/µ ou s/m). S’exprime en pourcentage ou entre 0 et 1.
Critères d’inclusion
Critères fixés pour guider le choix de l’échantillon afin d’atteindre l’objectif de l’étude
Critères d’exclusion
Caractéristiques permettant de venir fausser le résultat
Puissance statistique
- Permet de quantifier la confiance que l’on peut accorder à un résultat observé.
- Augmente avec la taille de l’échantillon
Méthodes d’échantillonnage
Aléatoire simple, aléatoire stratifié, systématique, en grappes
Mesures de fréquence
- Proportion
- Taux
- Ratio
- Indice
Proportion
- Rapport dans lequel le num et le dénom proviennent du même ensemble
- Le num est inclus dans le dénom
Taux
- Rapport qui mesure la vitesse ou la force (intensité) de survenue d’un événement
- Mesure instantanée de densité
- Le num dénombre les événements survenus et le dénom cumule le temps d’observation total des entités analysées
Ratio
- Num et dénom proviennent du même ensemble, mais sont mutuellement exclusif (ex: H:F)
- Pas d’unités
Indice
- Num n’est pas compris dans le dénom; l’un et l’autre renvoient à 2 événements distincts
- Utile quand le dénom n’est pas bien connu
Prévalence (P)
- Proportion de personnes affectées par une maladie à un moment donné
- [P = m/N] où m = malades et N = population totale.
Taux d’incidence (I)
- “Densité d’incidence”
- Mesure de la vitesse de propagation
- [I=n/T] où n = nouveaux cas apparus pendant l’observation et T = temps de l’observation, qui prend fin quand le sujet tombe malade ou lorsque l’étude se termine
Incidence cumulée (IC)
- Risque de survenue d’un événement
- [IC = n/R] où n = nouveaux cas pendant l’observation et R = nombre de personnes à risque au début de l’observation.
- Toujours associer la durée de l’observation.
Cote
- Quand une caractéristique divise une population en 2 groupes
- Ex: Ratio malades/non-malades
Une population dynamique peut être…
Ouverte ou fermée
Quand on a une population dynamique ouverte, quelle formule est utile pour calculer la prévalence? Cela implique quoi?
[P = I x D]
- Lorsque la prévalence est faible (P < 10%)
La probabilité de décès est en fait une…
Incidence cumulée
Létalité
- Proportion de personnes atteintes (m) qui décèdent (d) après un certain temps d’observation
- Incidence cumulée
- [L = d/m]
Taux d’attaque
- Mauvaise attribution du mot taux; c’est en fait une incidence cumulée
- Proportion des personnes qui tombent malades par rapport aux personnes exposées à un facteur de risque connu
Espérance de vie
- Moyenne
- Calculée à partir de la table de mortalité
- Pour chaque âge, l’espérance de vie correspond au cumul des années vécues dans l’intervalle considéré et dans tous les intervalles subséquents, divisé par le nombre de vivants à cet âge
Méthodes d’ajustement des mesures
Direct et indirect
Ajustement direct
Appliquer un taux réel à une population fictive, lorsque les 2 populations à l’étude sont trop différentes pour pouvoir les analyser de façon non-biaisée. (ex: taux de mortalité d’une population vieille vs une jeune, on prend le même taux mais dans une population fictive
Ajustement indirect
L’inverse de l’ajustement direct; on applique des taux identiques fictifs aux distributions de population réelles.