Module 2 Flashcards
Nommer 3 types de taux permettant de comparer 2 (ou plusieurs) populations.
Brut, spécifique, ajusté
(s’applique à n’importe quelle mesure de fréquence, pas seulement taux)
Différence entre taux d’incidence brut et taux de mortalité brut.
TIbrut = # cas de maladie / # pers-temps d’observation dans population entière
* Dénominateur = personnes-durée
* Mesure la vitesse d’apparition des nouveaux cas dans un temps T
TMbrut = # décès / # pers-temps d’observation dans population entière
* Dénominateur = personnes-durée
* Mesure de la vitesse d’apparition des décès dans un temps T
Les taux brut sont les taux … dans une population définie.
globaux
Donner un exemple de taux brut.
En 2022, 24 600 canadiens ont reçu un dx de cancer de la prostate.
En 2022, il y avait 19 357 700 hommes au Canada
TIbrut cancer de la prostate Canada (2022)
= 24 600 nouveaux cas / 19 357 700 hommes-année
= 127 cas / 100 000 h-a.
(= 127/100 000a = 123/105a)
“127 cas pour 100 000 hommes en un an”
Que permet le taux spécifique?
De pouvoir spécifier par rapport à un groupe d’âge : si on prend l’exemple du cancer de la prostate, on peut connaître le taux brut de # nouveaux cas / # hommes-années. Cependant, les hommes de différents groupes d’âge n’ont pas le même risque, les plus âgés sont plus à risque contrairement aux plus jeunes.
Donc le taux spécifique nous permet de calculer le nombre de nouveaux cas selon le nombre de personne-année en fonction d’un certain âge.
TI spécifique âge= nouveaux cas (grp d’age)/pers-temps(grp d’age)
Sachant qu’il y a une association positive entre l’âge et l’incidence de cancer de la prostate, est-ce qu’on peut utiliser le taux brut du Canada et celui de l’Afrique du Sud et les comparer directement?
Non, car le taux d’incidence dépend de la distribution de l’aĝe de la population. Au Canada, on pourrait avoir une population plus vieille qu’en Afrique du Sud, donc automatiquement, on aurait plus de cas dans le taux brut.
Pourrait-on comparer le taux d’incidence spécifique à un groupe d’âge entre 2 pays?
Oui, en présument qu’au sein de chacune de ces groupes d’âge, le taux d’incidence est à peu près constant dans chaque pays.
Qu’est-ce que des procédures d’ajustement/de standardisation/de normalisation?
Se dit de procédures d’analyse de données visant à éliminer l’effet d’une ou de plusieurs sources de variation qui pourraient affecter un résultat donné
Qu’est-ce que la standardisation directe?
Consiste à se donner, comme standard, au départ, une population d’une composition d’âge donnée.
On standardise directement en multipliant les taux par âge de chaque population (exposées) par l’effectif de la population type (non-exposée)
Quand on compare,le taux standardisé deds exposés avec celui de la population type, on compare deux taux qui ont précisément la même population de base.
La population standard:
a une repartition par grp d’age connue, elle peut être rèelle/fictive, une de celles qu’on veut comparer, une population externe pertinente
Pour “ajuster” les taux par standardisation directe, que faut-il faire?
- Prendre les taux spécifiques aux groupes d’âge observés dans les populations à comparer
- appliquer à une population standard afin de calculer un nombre attendu de décès dans chaque population
- **Calculer le taux ajusté **en divisant le nombre total de décès attendus par la population standard totale
La population standard peut être : une de celles qu’on compare, la somme des 2 population, une population externe pertinente
En résumé, qu’est-ce que le taux brut?
Nbre cas / p.-a. de toute la population
Rapide à calculer, mesure réelle. Cependant, si 2 populations varient en composition par groupe d’âge, la différence entre les taux sera difficile à interpréter.
En résumé, qu’est-ce que les taux spécifiques?
Nbre cas / p.-a. groupe d’âge, sexe…
Comparaisons valides et spécifiques. Implique beaucoup de comparaisons si on veut comparer 2 populatons entières
En résumé, qu’est-ce que les taux ajustés?
Mesure sommaire, comme le taux brut, mais permettant une comparaison valide entre 2 populations. Les taux obtenus sont fictifs
Pourquoi faire attention au mot “spécifique”?
On vient d’apprendre qu’on utilise le mot spécifique pour calculer le taux dans un groupe d’âge, alors que si on dit le taux de mortalité spécifique au cancer de la prostate, ce n’est pas de calculer l’incidence dans un groupe précisément.
Quand on utilise le **mot spécifique suivi d’un nom de maladie, **ça demeure un taux de mortalité global/brut, parce que le nombre de personne-année va être constitué de toute la population.
Quelles sont les 3 grandes questions à répondre dans l’épi descriptive?
Personne : QUI sont les (plus) affectés?
Lieu : OU sont-ils (plus) affectés?
Temps : QUAND sont-ils (plus) affectés?
qu’est ce qui est important à faire en épidémio descriptibe
Essentiel de définir précisément un « cas »
- Critères diagnostiques doivent être clairs, non ambigus
et faciles à utiliser
- Définition peut être restrictive ou plus inclusive (plus
« sensible ») dépendamment de l’objectif
- Maladie grave et transmissible vs investigation d’une éclosion
- Une définition « standard » maximise la comparabilité
des cas, partout et en tout temps. Ainsi, la fréquence
des cas peut être comparée entre lieux et entre les
périodes
- Une définition peut évoluer/changer
Vrai ou faux?
La maladie se produit par hasard.
Faux, les caractéristiques des individus vont affecter le risque de maladie
Nommer des caractéristiques individuelles.
Démo : âge, sexe, race, état civil, etc.
Socio-écono : scolarité, revenu, occupation, etc.
Familiale : rang de naissance, fratrie, # enfants, etc.
HdeV : alcool, tabac, alimentation, etc.
Compléter.
… est le plus important facteur de risque, ce qui en fait aussi le plus important … dans la plupart des comparaisons.
l’âge
facteur de confusion
Que peut-on vérifier pour le lieu d’une maladie?
Géographie
* Comparaisons internationales, nationales, etc.
* Latitude, etc.
Agrégats vs dispersion
études sur les migrants: ex SEP
Qu’est-ce que les différences artificielles?
Il y a plein de différence entre les pays qui peuvent nous faire croire qu’il y a une différence par rapport à une maladie, mais qui s’avèrent être juste des différences artificielles
- Composition par groupe d’âge, définition d’un cas, méthodes diagnostiques, exhaustivité, justesse et rigueur du décompte des cas et des populations sous-jacentes
Que peut-on vérifier pour le temps d’une maladie?
- Variations périodiques ou cycliques (saisons, heures du jour, etc.)
- Variations à court terme
- Tendances séculaires (changement long-terme)
- Attention aux variations artificielles séculaires
Comment qualifier le temps?
Sporadique : présente une fois de temps en temps dans le temps, mais pas toujours
Endémique : toujours là, plus ou moins présente, mais à un niveau de base qui n’est pas épidémique
Épidémie : toute maladie dont la fréquence dans une population est supérieure à celle constatée habituellement
Qu’est-ce que les courbes épidémiques?
Description graphique de la progression du nombre de cas de maladie dans le temps
Fournis de nombreuses informations :
- Mode de transmission?
- Ampleur de l’éclosion
- Quand a eu lieu la première exposition?
- Date du 1er cas?
- Durée de la période d’incubation?
- Épidémie de source commune ponctuelle ou continue? Présence de cas secondaires?
Quels sont les modes de transmission des maladies?
Transmission directe (= personne à personne) : ex covid, infection intrautérine au VIH
Transmisse indirecte :
- Source commune ponctuelle : ex éclosion d’origine alimentaire
- Source commune continue : ex eau contaminée
- Vecteur : ex anophèles et malaria
À quel mode de transmission ceci correspond?
Transmission directe
Pics multiples possibles correspondant aux vagues d’infection
Les pics sont séparés par une période d’incubation et augmentent en intensité
À quel mode de transmission ceci correspond?
Transmission indirecte - source commune ponctuelle
Explosive - incubation courte (mais variable) - cas regroupés - rarement des cas secondaires - courbe asymétrique vers la droite
À quel mode de transmission ceci correspond?
Transmission indirecte - source commune continue
Le nombre de cas atteint un pleateau plutôt que de diminuer avec le temps
Nommer les 4 devis d’étude descriptive.
Étude de cas (ou série de cas)
Études transversales (ou de prévalence)
Études longitudinales (descriptives)
Études écologiques (corrélationnelles)
Les qualificatifs historique/concurrente s’appliquent-ils seulement aux études analytiques?
Non, même s’ils sont plus fréquents pour les études analytiques, ça peut aussi s’appliquer aux études descriptives
Qu’est-ce que les études de cas ou séries de cas?
- Description détaillée d’un patient ou d’un groupe de patient ayant la même présentation “inhabituelle”
- Fréquent dans les journaux médicaux
- Permettra de bien asseoir la définition d’un cas
- Souvent la façon d’identifier le début d’une pandémie : description (qui, ou, quand) et caractéristiques des patients/groupes “à risque”
- Souvent une étude historique, mais si on fait un suivi ça devient concurrent
Les études ou séries de cas permettent-elles de formuler une hypothèse? et d’en confirmer une?
Formuler, oui, mais pas confirmer une hypothèse, car :
- Elles reposent sur de trop petits nombres d’individus
- Ne comprennent pas de groupe contrôle contre lequel on pourrait comparer les cas
- Les choix des cas se fait souvent en fonction de leur disponibilité et non de leur représentativité
Qu’est-ce que les études transversales ou de prévalence?
- Portrait d’une population
- Grosses enquêtes menées afin de documenter de nombreuses variables liées à la santé et n’étant pas mesurées de façon routinière
- Expositions et maladies appréhendées au même moment chez les individus d’un échantillon de population. On mesure donc la prévalence de ces facteurs dans la population
- Si répétées régulièrement, permettent de surveiller l’évolution d’un problème ou évaluer les interventions en santé
- Peuvent aussi être utilisées pour mesurer l’association entre la prévalence d’une exposition et la prévalence d’une maladie (étude analytique)
Les études transversales permettent-elles de formuler des hypothèses? et de déterminer si l’exposition précède ou résulte de la maladie?
Formuler des hypothèses, oui, mais difficile (voire impossible) de déterminer si l’exposition précède ou résulte de la maladie, car (ex de consommation d’alcool et détresse psychologique) :
* On mesure la présence au moment même, on ne sait pas c’est lequel en premier
* Les phénomènes sont étudiés au même moment
Les études transversales identifient les cas …
prévalents (cas qui existent au moment de faire l’étude)
Quel est l’impact du fait que les études transversales identifient les cas prévalents?
- Sont souvent des survivants - pas l’ensemble des cas, ce sont des cas de longues durées, car les autres sont soit morts ou guérit, donc ils ne sont pas représentatifs (ex d’HLA2 qui est souvent présent avec leucémie, mais avec l’étude transversale, on ne sait jamais si c’est parce que l’HLA2 est liée à l’incidence ou à la durée de la maladie)
- Qui peuvent avoir modifié leur exposition aux facteurs de risque
- Impossible de mesrer le risque de maladie
Vrai ou faux?
Les études transversales sont toujours historiques.
Vrai
Qu’est-ce que les études longitudinales descriptives?
- Description d’un phénomène de santé qui se déroule dans le temps dans un groupe définir de sujets ou une population
- Le groupe à l’étude comprend des sujets sains qui sont suivis, certains desquels tombent éventuellement malades
- Permet d’apprécier l’incidence de la maladie dans la population
- Permet également de mesurer le temps entre le début de l’observation, l’apparition de la maladie, le décès ou la fin de la période d’observation -> évolution dans le temps
- Permet de connaître les caractéristiques des individus malades et donc d’identifier des groupes à risque, mais…
- L’absence de groupe de comparaison nous empêche de vérifier des liens de cause à effet
Qu’est-ce que les études écologiques (corrélationnelles)?
- Méthode brute pour explorer des associations linéaires entre environnement et maladie
- Le groupe (plutôt que l’individu) est l’unité de comparaison
- La question posée : les populations géographiques plus exposées à un facteur donné affichent-elles un taux plus élevé de maladie?
- Toujours historiques
- Données facilement disponibles, études rapides, peu coûteuses
Quels sont les inconvénients des études écologiques?
- Pas d’info sur les variables de confusion
- Difficile de détecter des effets non linéaires
- Impossible, avec ces données, de savoir si le lien trouvé existe aussi au niveau individuel, car on ne sait pas si, dans chaque région, les gens qui contractent la maladie étaient les plus exposés (attention au sophisme écologique)
Pourquoi faire attention aux études écologiques?
Puisqu’on a une valeur purement exploratoire et ne sert pas du tout à démontrer les liens entre des expositions et des maladies
Qu’est-ce que la surveillance?
Recueil systématique et continu, l’analyse et la dissémination rapide de données liées à la santé (incidence, mortalité, FDR) dans une population.
Il ne s’agit pas juste de ramasser les données, après il faut les analyser et les disséminer.
À quoi sert la surveillance?
- Dresser portrait de santé
- Décrire la distribution de maladie ou le FDR
- Détecter une épidémie
- Trouver des indices quant aux FDR potentiels
- Planifier les besoins en services de santé
- Guider le développement et l’implantation de mesures de contrôle et la prévention
- Évaluer les mesures de contrôle et de prévention
- Détecter les changements dans les pratiques médicales
Qu’est-ce que la surveillance passive?
Se fait de façon continue, à long terme, qui nous permet d’extraire les tendances générales et de faire le portrait global de santé de la population
Elle a une qualité variable, et on peut s’attendre à avoir de la sous-déclaration dans certains cas
Ex : registre MADO, MED-ECHO, certificats de naissance, décès, etc.
Qu’est-ce que la surveillance active?
Surveillance plus ponctuelle (à court terme), qui est faite dans un but précis (maladies émergents, épidémies). Elle requiert plus de ressources, mais on obtient une meilleure qualité d’information
Ex : enquetes transversales de santé, recensements, entrevues, etc.
Quels sont les rôles importants du clinicien lorsqu’on parle de surveillance?
Déclaration maladies contagieuses, MADO, nouvelles maladies
Détection épidémies
Contact santé publique
Certificats de décès, exactitude des diagnostics, etc.
Pour faire la surveillance, on va utiliser des …
indicateurs de santé
Qu’est-ce que les indicateurs de santé?
Variable susceptible d’être mesurée directement et qui rend compte de l’état de santé des personnes au sein d’une communauté
Souvent basées sur la maladie ou sur la mortalité
Nommer des exemples d’indicateurs
Morbidité :
* Nouveaux cas
* Taux d’incidence d’une maladie
* Hospitalisations spécifiques à une maladie
* Consultations pour une maladie spécifique (/1000 consultations)
Mortalité :
* Taux de mortalité brut spécifique à une maladie
* Mortalité proportionnelle, mortalité infantile
* Espérance de vie
* Années potentielles de vie perdues, etc.
composite: esperance de vie ajustée pour l’état de santé
Qu’est-ce que la mortalité proportionnelle?
**Équivaut à la proportion des décès selon chaque cause de décès **(ex 29,8% des décès au Canada sont causés par les cancers)
Cela nous dit donc la place de chaque cause en importance dans l’ensemble des décès ainsi que de la proportion des décès que l’on pourrait s’attendre à éviter si on était capable d’éradiquer une cause de mortalité
Le taux de mortalité est en fonction de quoi?
Du taux d’incidence de la maladie ainsi que du risque d’en mourir une fois la maladie contractée (létalité)
Pour les maladies dont la létalité est élevée (ex 80%), le taux de mortalité fournit une approximation raisonnable du taux d’incidence
* TM = TI x Létalité
Nommer les 3 cancers les plus importants.
Prostate, poumons, seins
Comment se fait-il que le TI et TM du cancer des poumons sont presque pareils?
Car quand les gens sont diagnostiqués, ils meurent presque tous et rapidement
Si le TI augmente, mais que le taux de mortalité diminue, cela veut dire que la létalité de la maladie …
diminue
Qu’est-ce que les années potentielles de vies perdues (APVP)?
Indicateur de mortalité prématurée
Correspond au nombre d’année de vie “perdues” quand un individu meurt prématurément, i.e. avant l’âge de 75 ans
Ex : une personne qui décède à 35 ans perd 40 années potentielles de vie
Comment se fait-il que l’ordre en importance des causes de décès n’est pas le même si on compare la mortalité proportionnelle et les APVP?
Car les maladies qui touchent les jeunes vont avoir plus de poids dans les APVP que les personnes âgées, car même si elles n’étaient pas mortes d’une telle cause, une personne âgée aurait vécu seulement quelques années de plus, alors qu’un adolescend qui décède d’un suicide perd de nombreuses années de vie, théoriquement.
Industrie A : s’il y a 180 décès pour cause de cancer respiratoire avec mortalité proportionnelle de 33% et que…
Industrie B : il y a 248 décès pour cause de cancer respiratoire avec mortalité proportionnelle de 45%…
Peut-on affirmer que l’industrie B a un risque plus élevé de mourir d’un cancer respiratoire que l’industrie A?
Non, car peut-être que dans l’industrie A a seulement 1000 employés et donc 180/1000 serait beaucoup, mais peut-être aussi que l’industrie B a 100 000 employés, donc 248/100 000 est petit.
Comme on peut le voir, pour calculer un risque, on a besoin du nombre total de personne à risque
Qu’est-ce que l’espérance de vie?
**Nombre moyen d’années de vie restant à un individu d’un certain âge, si on suppose que les taux actuels de mortalité **(spécifiques aux groupes d’âge) se maintiennent
Calculée à partir de tableaux de survie. Varie beaucoup entre populations et dans le temps.
Très bon indicateur sommaire de l’expérience de mortalité - et donc de santé - d’une population entière
Mesure la quantité plutôt que la qualité de vie.
Qu’est-ce que l’espérance de vie ajustée en fonction de l’état de santé (EVS)?
Nombre moyen d’années en bonne santé restant à un individu d’un certain âge, si on suppose que les taux actuels de mortalité et la prévalence de la morbidité se maintiennent.
* EVS = EV totale - EV mauvais état de santé fonctionnel
Comment se calcule la mortalité infantile?
**Nbre de décès d’enfants de moins d’1 an / nombre de naissance vivantes durant la même année
**
Souvent exprimée en /1000 naissances vivantes
Quelle est la différence entre mortalité néonatale et post-néonatale?
Néonatale :
* Mortalité dans les 4 premières semaines de vie
* Les causes sont endogènes
* Nbre de décès dans les 27 premiers jours x 1000 / nbre de naissances vivantes
Post-néonatale :
* Mortalité de la période de 4 semaines jusqu’à 1 an
* Causes sont exogènes
* Nbre de décès 28-365 jours x 1000 / nbre de naissance vivantes
Qu’est-ce que la mortalité périnatale?
Probabilité qu’un foetus viable soit mort-né ou meurt dans sa première semaine de vie
**
Nbre de décès foetus ou enfants entre S28 et 7 jours / nbre de naissance
(le dénominateur peut inclure ou non les mortinaissances)
Que reflète la mortalité périnatale?
La qualité du suivi pendant la grossesse et l’accouchement et les efforts de collaboration entre obstétriciens et néonatalogistes
La non-viabilité du foetus en raison de mutations et problèmes graves durant la grossesse
que reflète la mortalité infantile
- Indicateur de choix du niveau de santé d’un pays.
- Élevée, elle reflète des besoins sanitaires non-comblés (conditions économiques, malnutrition, éducation, hygiène, soins médicaux, etc.)
que reflète la mortalité néonatale
Relève de causes « endogènes »
(malformations, prématurité, hypertension gravidique, etc.)
Plus la mortalité infantile est basse, plus l’espérance de vie est …
élevée
sources de données - dénominateurs pour indicateurs de santé et surveillance
-
Recensement: Dénombrement périodique de la population, selon certaines caractéristiques de base: âge, sexe, langue, état
matrimonial, etc.
;) Complet (questionnaire court)
;) Questionnaire long obligatoire (20% des ménages) avec questions
sur déterminants sociaux (travail, éducation, revenu, etc.)
;(Périodes intercensitaires
;( Délai de disponibilté des données
;(Souvent impossible de distinguer individus « à risque » -
RED – Registre des événements démographiques («vital statistics»): Naissances :
;) Recueil systématique
;) Complet
;) Permanent
;( Limité à certains événements seulement (naissances, décès,
mortinaissances)
sources de données - Mortalité
pour indicateurs de santé et surveillance
RED – Registre des événements démographiques («vital statistics»): Décès et mortinaissances
Enregistrement obligatoire des décès et leurs causes par les
médecins (formulaire SP-3)
;) Recueil systématique
;) Complet
;) Permanent
;( Exactitude des causes ?
▪ Cause immédiate
▪ Cause initiale
▪ Causes intermédiaires
;( Limité à certains événements seulement (naissances, décès,
mortinaissances)
sources de données - morbidité pour indicateurs de santé et surveillance
-
Maladies à déclaration obligatoire (MADO): Devant légalement être déclarées aux autorités de santé publique par MD ou labos en raison du danger pour la population
;) Complet
;) Diagnostics valides
;( Seulement certaines maladies, souvent rares -
Registres de morbidité: Centralisent et recoupent plusieurs sources afin de documenter de façon exhaustive tous les cas incidents d’une maladie sur un territoire donné (p.ex. Registre québécois du cancer)
:) Complet
;) Diagnostics valides
;) Permet de mesurer des incidences
;( Seulement pour certaines maladies ou groupes de maladies
;( Lenteur de la mise en disponibilité des données
;( Complexe et coûteux -
Bases de données administratives: Mises sur pied à des fins de gestion de programmes et non de surveillance de santé (p. ex.
MED-ECHO, RAMQ, etc.)
;) Recueil systématique
;) Données normées
;) Permanent
;) Souvent large couverture de la population
;) Assez précis
;( Limité aux utilisateurs des services
;( Peut refléter la disponibilité des services plutôt que la morbidité
;( Validité des diagnostics? - Sondages ou panel web:
;) Rapidement accessibles, évolution rapide
;( Non représentatives de la population (volontaires, accès au web requis, etc.)
-Dossiers hospitaliers: La source de données la plus importante en épidémiologie mais prévue pour soins au patient et non recherche:
;( Incomplet, illisible ou manquant
;( Validité des diagnostics?
;( Population(s) à risque (dénominateurs) difficiles à cerner
-
Enquêtes transversales de santé: Grandes enquêtes populationnelles
;) Adaptées au besoin du moment
;) Solides du point de vue méthodologique (représentativité, etc.)
;( Diagnostics souvent autodéclarés
;( Morbidité prévalente plutôt qu’incidente
;( Sporadiques (ou parfois cycliques ☺)
;( Coûteuses et complexes
Quand on fait une étude épidémiologique, que fait-on?
(par rapport à l’inférence statistique)
On tire un échantillon d’une population
Dans cet échantillon, on estime une caractéristique de la population (un “paramètre”)
* E.g. enquête Santé-Québec : la proportion de fumeurs obtenue dans l’échantillon est une estimation. La véritable proportion dans la population québécoise entière est le paramètre que nous tentons d’estimer avec l’échantillon
* E.g. étude de cohorte, qualité des soins et mortalité : le RR obtenu dans l’échantillon de patients estime le véritable changement de risque de mortalité entre une population de gens bien soignés et une population mal soignée
Nous utilisons cette estimation pour conclure quant à la caractéristique de la population
Chaque fois que nous tirons une conclusion au sujet d’une population à partir de résultats obtenus dans un échantillon, nous faisons de l’inférence statistique
Quels sont les paramètres que nous estimons souvent en épidémiologie?
π : proportion d’une population qui souffre d’une certaine maladie ou est exposée à un agent particulier
* Proportion prévalente de maladie
* Risque de maladie, etc.
π1/π2 : rapport entre les proportions de sujets des populations 1 et 2 qui développent la maladie on sont exposés
* Risque relatif de maladie (ou de guérison)
* Odds ratio…
Qu’est-ce que la variabilité de l’échantillonnage?
Chaque fois qu’on déduit les caractéristiques d’une population à partir d’un échantillon, il est possible que cette déduction soit, par hasard, inexacte ou imprécice : c’est la variabilité de l’échantillonnage
Plus l’échantillon est grand, moins la variabilité de l’échantillonnage sera importante
Une fois qu’on a estimé une caractéristique de la population, on doit donc mesurer le rôle probable du hasard dans cette estimation. Cela se fait de quelles 2 façons?
Calculer un intervalle de confiance autour de l’estimation
Faire un test d’hypothèse
Qu’est-ce qu’un test d’hypothèse?
Test qui nous permet de vérifier si les résultats de notre (ou nos) échantillon(s) sont compatibles avec l’effet seul du hasard
* Si oui, ils ne sont prob pas éloquents et on ne rejettera pas l’hypothèse nulle
* Sinon, ils sont prob éloquents et on rejettera l’hypothèse nulle
Qu’est-ce que l’intervalle de confiance?
Étendue de valeurs dans laquelle se retrouve probablement le véritable paramètre de la population
L’IC a la forme générale suivante : IC = estimation ± marge d’erreur
La marge d’erreur (et donc l’étendue de l’IC) est en fonction de :
* Du niveau de confiance (1-α) que nous désirons avoir (i.e. le degré de certitude que l’IC contient le véritable paramètre)
* De la variabilité de l’échantillonnage
Plus nous voulons être certains que l’IC calculé contient le véritable paramètre, plus il doit être …
large
interprétation fréquentiste (stricte) et pratique de l’IC 95% (2.3; 4.3)
**Interprétation fréquentiste « stricte » de l’IC95%:
« Si cet essai était refait +++ fois dans les mêmes conditions et,
chaque fois, un intervalle de confiance calculé, 95% de ces
intervalles contiendraient le paramètre (c.-à-d. le véritable RR)
** Interprétation « pratique » de l’IC95%:
« La probabilité est de 95% que le véritable RR comparant les
populations traitée et non traitée soit entre 2,3 et 4,3 »
Si on utilise un IC à 95%, comment pouvons-nous être certains à 95% que le paramètre est compris dans cet IC?
On peut démontrer que si on calculait un IC 95% à partir d’un très grand nombre d’échantillons, le paramètre serait inclus dans l’IC pour 95% des échantillons.
Donc, toutes les fois que nous avons un seul IC 95%, nous sommes certains à 95% qu’il contient le paramètre
Que signifie un niveau de confiance de 95% ou de 99%?
**Niveau de confiance de 95% : **
* La propabilité est de 95% que le véritable RR comparant les populations traitée et non traitée soit entre X et Y.
Niveu de confiance de 99% :
* Nous sommes certains à 99% que le véritable RR comparant les populations traitée et non traitée est entre XX et YY
plus nous voulons être “confiants” que l’IC contient le paramètre, plus l’IC doit être large
Plus l’échantillon est grand, plus la variabilité de l’échantillonnage est … et plus l’IC est …
faible
étroit
ex: 100 sujets, IC95%: (12.3; 19.7)
1000 sujets IC95%: (14.8; 17.2)
Toutes les formules permettant de calculer un IC sont bâties à peu près de la même façon, i.e. en fonction de quoi? il existe quoi?
**Estimation ponctuelle
Niveau de confiance choisi
Mesure de la variabilité de l’échantillonnage
**
il existe des formules spécifiques permettant de calculer un IC autour de toutes les estimations qui nous intéressent en épidémiologie:
p, R, RR, DR, TIR, etc..
Au Québec, en 2020, 10% de la population >= 12 ans fume … »
- Enquête réalisée chez 2 800 québécois (>= 12 ans) ;
- On a trouvé 10% de fumeurs dans l’échantillon;
- Que peut-on dire sur la proportion de fumeurs dans la population adulte
québécoise entière?
L’IC autour d’une proportion « p »:
IC(1- a% = p +- z ● racine(pq/n)
IC95% = ,10 +- 1,96 ● racine(,10 x ,90 / 2 800)
= ,10 +- ,011
= [,089 ; ,111]
= [8,9% ; 11,1%]
« On est certains à 95% que la population québécoise de 12 ans ou plus compte entre 8.9% et 11.1% de fumeurs en 2020. »