Module 2A: Questions, objectifs et hypothèses de recherche Flashcards
Variable: Définir + exemples
- Déf: On appelle variable toute caractéristique susceptible d’être différente selon les personnes, les lieux ou le temps.
- Exemples: L’âge, le sexe, le groupe sanguin, la tension artérielle et le nombre de lits par hôpital sont des variables
Valeur: Définir
- À la notion de variable s’ajoute celle de valeur. Tout état que prend la variable étu- diée est une valeur.
Variable: Types
- Variable de personnes
- Variable de lieux
- Variable de temps
Variable: Types - Variables de personnes - Définir + exemples
- Les variables de personnes renvoient aux attributs anatomiques, physiologiques, sociaux, économiques ou culturels. Les plus fréquemment considérées sont l’âge, le sexe, l’état civil, les habitudes de vie, l’occupation et le statut socioéconomique.
- Les variables de personnes permettent de répondre à la question : « De qui parle-t-on ?
- Ex. Yako est un garçon de 5 ans et 3 mois. Il pèse 17 kg et mesure 105 cm.
Variable: Types - Variables de lieux - Définir + ex
- La fréquence d’une maladie peut varier selon le pays, la région ou la situation géogra-phique de la population (zone urbaine ou rurale).
- Les variables de lieux permettent de répondre à la question : « Où se déroulent les événements dont on parle ? »
- Exemples
- La région de Lanaudière a connu une épidémie de rougeole.
- La mère de Yako travaille dans une manufacture de chaussures.
Variable: Types - Variables de temps - Définir + ex
- De façon générale, la fréquence d’une maladie varie avec le temps.
- La durée est une caractéristique de la maladie qui permet de marquer sa gravité et son évolution.
- Le temps est donc un élément nécessaire à la définition des mesures épidémiologiques et une composante de base des concepts de cause.
- Les variables de temps permettent de répondre à la question : « Quand l’événement est-il survenu ? »
- Exemples
- Au début de l’année scolaire, Anne-Marie s’inquiète de la taille de Yako.
- Le cancer du poumon a fortement augmenté chez les femmes depuis 20 ans.
- Trois heures après son repas, Jeanne a éprouvé de sérieuses crampes abdominales
Variables: Classification - Nommez-les
- Variables quantitatives
- Variables qualitatives
Variables: Classification - Variables quantitatives - Définir
- La valeur de la variable quantitative est numérique.
- On partage les valeurs numériques en valeurs discrètes et en valeurs continues.
- Une variable quantitative est discrète lorsque ses valeurs sont des quantités isolées, séparées les unes des autres.
- Les valeurs d’une telle variable sont obtenues par dénombrement
Variables: Classification - Variables quantitatives - 2 types + leur déf
- Le fait que ces valeurs soient isolées ou non les unes par rapport aux autres constitue un autre facteur distinctif.
- Ainsi, entre une classe de 20 enfants et une autre de 21 enfants, il n’y a pas de valeur intermédiaire possible ; le nombre d’enfants dans une classe est donc une variable dont les valeurs sont isolées.
- Par contre, entre les kilogrammes, il y a toujours les grammes, entre les grammes, les milligrammes, entre les milligrammes, les microgrammes, etc. ; les valeurs du poids ne sont donc pas isolées.
- Ces distinctions entraînent la classification des variables en variables qualitatives ou quantitatives ; ces dernières peuvent être discrètes ou continues.
- Ainsi, une variable discrète ne peut être exprimée par une fraction. À l’inverse, une variable est continue lorsque ses valeurs sont des quantités qui peuvent s’exprimer par une fraction
Variables: Classification - Variables qualitatives - Définir
- La valeur de la variable qualitative ou catégorielle correspond à des qualités, des attributs.
- Ainsi en est-il du sexe (masculin, féminin) et du groupe sanguin (A, B, AB, O).
- La variable qualitative est, par convention, discrète.
- En effet, même si l’on peut observer une continuité dans le ton d’une couleur (de très pâle à très foncé), on conviendra par exemple de les catégoriser en cinq groupes comme « très pâle », « pâle », « moyen », « foncé » et « très foncé ».
Variables: Classification - Variables qualitatives - Discrète ou continu?
- La variable qualitative est, par convention, discrète.
- En effet, même si l’on peut observer une continuité dans le ton d’une couleur (de très pâle à très foncé), on conviendra par exemple de les catégoriser en cinq groupes comme « très pâle », « pâle », « moyen », « foncé » et « très foncé ».
Échelle de classification des observations: Définition + pertinence
- Pour une variable donnée, l’ensemble des classes constitue une échelle de classification.
- Les quatre classes A, B, AB, O (voir le tableau 2.1) constituent une échelle de clas- sification pour la variable groupe sanguin.
- Une échelle de classification doit permettre de distribuer toutes les observations, chacune ne pouvant appartenir qu’à une seule catégorie.
- Pour qu’un classement des observations soit juste, les classes qui constituent l’échelle doivent nécessairement satisfaire à deux conditions.
- D’une part, elles doivent être mutuellement exclusives : chaque individu ou chaque observation de la variable ne peut appartenir qu’à une seule classe.
- Les classes d’âge « 1-5 ans », « 5-15 ans », « 15-25 ans » et « 25 ans et plus » ne sont pas mutuellement exclusives, car les individus de 5 ans, 15 ans et 25 ans appartiennent à plus d’une classe. Par contre, les classes « 1-4 ans », « 5-14 ans », « 15-24 ans » et « 25 ans et plus » le sont.
- D’autre part, elles doivent être collectivement exhaustives : chaque individu ou chaque observation de la variable doit appartenir à une classe.
- Les classes d’âge « 1-4 ans », « 5-14 ans », « 15-24 ans » et « 25 ans et plus » ne sont pas collectivement exhaustives si un enfant âgé de moins de 1 an se retrouve dans l’ensemble de données. Il faut alors ajouter la classe d’âge « Moins de 1 an » pour en faire des classes collectivement exhaustives.
- Si l’on choisissait de classer les personnes selon les groupes sanguins A ou O, on n’obtiendrait pas une échelle comportant des classes collectivement exhaustives puisque Jeanne, qui est du groupe B (voir le tableau 2.1), ne pourrait être classée. Il faudrait donc ajouter à l’échelle les classes « B », « AB » – et même prévoir au besoin une catégorie pour les données manquantes.
Échelle de classification des observations: Nommez les caractéristiques obligatoires des classes
- Les classes doivent être mutuellement exclusives (chaque donnée appartient à une seule classe)
- Les classes doivent être collectivement exhaustives (chaque donnée doit appartenir à une classe)
Les types d’échelles de classification des observations: Nommez-les
- Échelle nominale
- Échelle ordinale
- Échelle par intervalle
Les types d’échelles de classification des observations: L’échelle nominale - Définir
- Dans une échelle nominale, les classes ne sont que nommées
Les types d’échelles de classification des observations: L’échelle ordinale - Définir
- Dans une échelle ordinale, les classes sont nommées et ordonnées, allant de la plus petite valeur à la plus grande ou de la plus grande valeur à la plus petite.
Les types d’échelles de classification des observations: L’échelle ordinale - Définir
- Dans une échelle par intervalle, les classes sont nommées et ordonnées ; il existe deplus une relation de distance entre les valeurs.
Les types d’échelles de classification des observations: Le passage d’une échelle à une autre
- Il existe une hiérarchie dans les échelles : il est possible de passer de l’échelle par intervalle à l’échelle ordinale, puis à l’échelle nominale.
- Chaque regroupement des données pour effectuer le passage d’une échelle à l’autre entraîne une perte d’information. Il s’agit donc, en quelque sorte, d’une voie à sens unique.
- On aura noté que la même perte d’information survient quand on passe des données brutes à un regroupement en classes.
- Stéphanie, nutritionniste à la polyclinique Milo, passe en revue les dossiers de sespatients. Elle peut noter, dossier après dossier, la cholestérolémie de chacun d’entreeux. Toutefois, si elle veut présenter un tableau d’ensemble à ses collègues de lapolyclinique, elle doit classer les observations. Si elle utilise une échelle par intervalle, elle perdra l’information sur chacun des patients, mais pourra connaître le nombre de ceux dont la cholestérolémie se situe de 2,8 mmol/l à 3,3 mmol/l, de 3,4 mmol/l à 3,9 mmol/l, …, de 5,2 mmol/l à 5,9 mmol/l, etc. Si elle désire présenter une information plus facile à saisir, elle peut construireune échelle ordinale en définissant les classes suivantes : cholestérolémie basse, cholestérolémie peu élevée, cholestérolémie élevée et cholestérolémie très éle- vée. Ainsi, les classes « 2,8-3,3 mmol/l » et « 3,4-3,9 mmol/l » pourraient être regroupées dans la classe « cholestérolémie basse » ; les classes « 4,0-4,4 mmol/l », « 4,5-4,9 mmol/l » et « 5,0-5,4 mmol/l » pourraient être regroupées dans la classe « cholestérolémie peu élevée », et ainsi de suite. Enfin, pour simplifier davantage, Stéphanie peut brosser un tableau de la cholesté- rolémie de sa clientèle en supprimant toute notion d’ordre et en créant deux catégo- ries : cholestérolémie normale et cholestérolémie anormale. Regroupant dans cette seconde classe les patients de la classe « cholestérolémie basse » et « cholestérolémie très élevée », elle sacrifie la notion d’ordre et passe à une échelle nominale. Pour gagner en simplicité de représentation, Stéphanie accepte de perdre de l’infor- mation, d’abord en regroupant les données individuelles en classes, puis à chaque passage d’une échelle à l’autre. Il est bien clair que la démarche inverse ne peut se faire et qu’une personne qui ne dispose que de l’information que fournit une échelle nominale ne peut reconstruire ni les échelles ordinales ni les échelles par intervalle.
Les distributions des fréquences: Structure d’un tableau de distribution de fréquences
- On peut noter qu’un tableau de distribution de fréquences comporte généralement quatre colonnes.
- La première présente les classes ; la deuxième, l’effectif ou la fréquence absolue de chaque classe ; la troisième, la fréquence relative qui présente en pourcentage la répartition des effectifs dans les différentes classes (exemple pour la classe 20-24 ans : 10/78 = 12,8 %) ; et la dernière, la fréquence relative cumulée, qui additionne la fréquence relative des classes (exemple pour la classe 25-29 ans : 12,8 % + 14,1 % = 26,9 %).
- Les tableaux de fréquences, comme tous les tableaux, doivent être numérotés, porter un titre concis qui précise l’information présentée et fournir la source des données utilisées.
Les représentations graphiques des distributions de fréquences: Échelles nominale ou ordinale - Nommez les sortes de représentations graphiques les plus communs
- Le diagramme en secteurs proportionnels
- Le diagramme en barres proportionnelles
- Le diagramme en barres
Les représentations graphiques des distributions de fréquences: Échelles nominale ou ordinale - Le diagramme en secteurs proportionnels
- Aussi appelés « tartes », les diagrammes en secteurs proportionnels représentent les proportions des valeurs prises par une variable.
- Ils ne permettent cependant pas de représenter aisément plusieurs séries de données.
Les représentations graphiques des distributions de fréquences: Échelles nominale ou ordinale - Le diagramme en barres proportionnelles
Cette représentation graphique est analogue à la représentation par tarte, sauf que les fréquences sont partagées sur une barre
Les représentations graphiques des distributions de fréquences: Échelles nominale ou ordinale - Le diagramme en barres
- Dans ce type de présentation graphique, les données représentées sous forme de barres sont disposées horizontalement ou verticalement.
- Chaque barre représente la fréquence de la classe d’une variable