Module 2 Flashcards
3 types de variables
- variables de personnes (âge, occupation, état civil, habitudes de vie)
- variables de lieux (pays, région)
- variables de temps (durée, fréquence de la maladie)
Classification des variables
- variable quantitative (numériques)
- discrète (ne peut pas être exprimée par fraction)
- continue (peut être exprimée par fraction) - variables qualitatives (qualités, attributs)
3 types d’échelles de classification
- échelle nominale (sexe, groupe sanguin)
- échelle ordinale (satisfaction)
- échelle d’intervalle (âge 1-4, 5-7, etc)
*Passage possible: intervalle -> ordinale -> nominale (sens unique seulement)
Distribution des fréquences dans un tableau
intervalle -> effectif -> fréquence relative -> fréquence relative cumulée
Distribution des fréquences dans un graphique
Échelle nominale ou ordinale
- secteurs proportionnels (pointe de tarte)
- barres proportionnelle (voir p.25 livre)
- en barres (chaque barre représente la fréquence de la classe d’une variable)
Échelle par intervalle
- histogramme (pour les variables quantitatives continues)
- polygone de fréquences (variables continues ou discrètes)
- graphe en ligne (y en fonction de x)
- graphe de percentiles (distribution en 100 parties égales)
Autres représentations
- représentation cartographique
- graphe en point (si extrapolation des valeurs non nécessaire)
Mesure de tendance centrale: les moyennes
Arithmétique: somme des valeurs observées divisée par le nombre de valeur (inconvénient: influencée par les valeurs extrêmes, surtout élevées)
Pondérée: somme des moyennes des classes multipliée par le nombre d’observation par classe
Géométrique: xème racine du produit des valeurs (avantage: réduit l’influence des valeurs extrêmes, surtout basse)
Mesure de tendance centrale: la médiane
Divise en deux parties égales l’ensemble des valeurs en ordre croissant.
Avantage: n’est pas influencée par les valeurs extrêmes; la prioriser lorsque distribution asymétrique
*Si le total des valeurs est pair, faire la moyenne entre les 2 valeurs médianes
Mesure de tendance centrale: le mode
Valeur qui revient le plus souvent
Mesure de dispersion: l’étendu
Différence entre la valeur maximal et la valeur minimal
Inconvénient: ne subit l’influence que des valeurs extrêmes
Mesure de dispersion: quantiles
Diviser l’ensemble en un certain nombre de parties égales
**Données en ordre croissant; quartiles vs quintes vs percentiles
Mesure de dispersion: variance
Somme des carrés des écarts p/r à la moyenne divisée par le nombre d’observation
Mesure de dispersion: écart-type
Racine carrée de la variance
Mesure de dispersion: variation
Rapport de l’écart-type à la moyenne
Quelles mesures de tendance centrale peuvent être utiliser avec l’échelle nominale?
Mode
Quelles mesures de tendance centrale peuvent être utiliser avec l’échelle ordinale?
Mode, médiane
Quelles mesures de tendance centrale peuvent être utiliser avec l’échelle par intervalle?
Mode, médiane, moyenne
Critère d’échantillonnage
Critère d’inclusion (pour guider la sélection des individus, en liens avec l’objectif)
Critère d’exclusion (pour éviter de fausser le résultat, on exclue volontairement les individus)
Taille de l’échantillon (plus on veut augmenter la précision des renseignements recueillis, plus la taille de l’échantillon doit être grande)
à déterminer -> plus petite différence que l’on veut détecter, précision souhaitée, puissance souhaitée, variabilité des données
les 4 méthodes d’échantillonnage
- aléatoire simple (au hasard)
- aléatoire stratifié (au hasard parmi un groupe déterminé selon le contexte)
- systémique (lorsqu’on a un très grand groupe de personnes, sélectionne le xe individu sur la liste selon un chiffre aléatoire de 1-10 puis bonds réguliers pour sélectionné individus)
- en grappes (se déplacer de grappes en grappe selon un protocole établi; “old style”)
Meure de fréquence (rapport): Proportion
Rapport dans lequel les deux entités proviennent du même ensemble et où le numérateur est inclus dans le dénominateur
*Valeur d’une proportion TOUJOURS comprise entre 0-1 soit 0-100%
Mesure de fréquence (rapport): taux
Rapport qui mesure la vitesse ou la force de survenue d’un évènement
*Mesure instantanée
Dénominateur = cumul du temps d’observation de chaque personne/entité -> unité = personne-temps ou distance-temps
Mesure de fréquence (rapport): ratio
Rapport dans lequel le numérateur et le dénominateur proviennent du même ensemble, mais où le numérateur n’est pas compris dans le dénominateur
* le ratio n’a pas d’unité
Mesure de fréquence (rapport): indice
Rapport utilisé lorsque le numérateur n’est pas compris dans le dénominateur et que l’un et l’autre renvoient à deux évènements distincts.
Exemple: décès maternels dus à une cause puerpérale/ nombre de naissance vivante
Mesure en épidémio: Prévalence (P)
Proportion des personnes affectées par cette maladie à un moment donné dans la population
P= m/N soit le nombre de personne malade/ le nombre de personne dans la population
Domaine de variation: 0-1
*Photographie instantanée d’une situation
Mesure en épidémio: Taux d’incidence (I)
Mesure de la vitesse, de la force ou de l’intensité de propagation d’une maladie
I= n/T soit le nombre de nouveaux cas survenus/le cumul du temps de chaque personne à risque de tomber maladie
Domaine de variation: 0-infini
*Représente le nombre de nouveaux cas
Mesure en épidémio: Incidence cumulée (IC)
Probabilité ou risque de survenu d’un évènement
IC= n/R soit le nombre de nouveaux cas/ le nombre de personnes susceptibles de devenir des cas
*Toujours associer le temps de suivit
Mesure en épidémio: Cote
Lorsqu’une caractéristique/exposition divise une population en deux
Exemple: sur 120 filles, 40 ont contracté le VPH pendant l’étude et 80 ne l’ont pas contracté. La cote d’infection est donc de 40/8 ou 0,5
Définition d’une population statique
Population figée dans le temps pour l’observer (comme une photo)
Avantage: proportions, ratios ou indices
-Désavantages: ne permet pas de calculer un taux ou mesures d’incidence (ni taux d’incidence ni incidence cumulée)
Définition d’une population dynamique
Population observée pendant une période de temps plus ou moins longue
Avantages: taux d’incidence et incidence cumulée, prévalence
Définition d’une population dynamique FERMÉE
Tous les participants débutent l’étude au même moment, personne ne vient s’ajouter en cours de route et tous sont suivis jusqu’à la fin de la période d’observation
-> peut calculer IC facilement
Définition d’une population dynamique OUVERTE
Nombre de personnes à risque est modifié tout au long de l’étude -> Peut calculer la prévalence si P<10%
P=IxD -> relation linéaire entre prévalence, taux d’incidence et durée moyenne d’une maladie
Taux de mortalité définition
Population dynamique fermée: se calcule comme un taux d’incidence
Population dynamique ouverte: doit estimer les personnes-temps du dénominateur en postulant que les personnes décédés au cours de l’année d’observation ont vécu en moyenne 1/2 de la période d’observation
Probabilité de décès
Nombre de décès survenus pendant la période d’étude/nombre de personne à risque en début de suivi
*IC dans une population dynamique fermée
Létalité (L)
Proportion des personnes atteintes d’une maladie qui décèdent après un certain temps d’observation
L= d/m = nombre de décès/nombre de malade
Définition Morbidité
Taux d’attaque (TA): proportion des personnes maladies par rapport aux personnes exposées à un risque connu
Espérance de vie: âge moyen au décès des personnes dans une population
*Calculée à partir d’une table de mortalité
Ajustement des mesures direct
Appliquer des taux spécifiques réels à une distribution de population identique fictive
Ajustement des mesures indirect
Appliquer des taux identiques fictifs aux distributions de population réelles.