Examens diagnostiques et de dépistage Flashcards

1
Q

Étape 1 : Élaboration du nouveau test diagnostique ou de dépistage

A

Ces études portent le nom d’études de validation (devis). Elles sont idéalement réalisées au moyen d’un échantillon représentatif de la population d’intérêt qui est sélectionné au hasard.

Méthode: On administre le nouveau test et l’examen de référence à tous les patients échantillonnés. On interprète ensuite leurs résultats de manière indépendante (sans avoir pris connaissance des résultats de l’autre test). Les résultats permettent de déterminer la validité du nouveau test.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Classification des résultats de tests Dx
types de contexte et type de résultats

A

Types de contextes (pourquoi on utilise des tests diagnostiques):
Diagnostiquer des sujets symptomatiques chez qui on veut confirmer un diagnostic;
Dépister des sujets asymptomatiques chez qui on cherche maladie;
Évaluer l’efficacité thérapeutique d’un traitement, d’une intervention, etc.

Types de résultats:
Qualitatifs ou quantitatifs
Exprimés sur des échelles nominales, ordinales ou par intervalles ou par proportion

Ex Échelle nominale (dichotomique): Une radiographie pulmonaire sera jugée normale ou anormale.
Échelle ordinale: Sur l’échelle de Braden un score de: 1) 18-23 = risque faible, 2) 14-17 = risque modéré, 3) 9-13 = risque élevé et; 4) 6 -8 = risque très élevé.
Échelle à intervalles: Le patient pèse 75 kg, 80 kg ou 100 kg.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Classification des résultats de tests dx

A

Idéalement, on devrait toujours utiliser l’examen de référence, soit le meilleur test diagnostique actuellement disponible (c.-à-d., le plus valide) ;
Mais ce test peut:
Présenter un risque pour le patient (p.ex.: réaction anaphylactique suite à l’injection d’un produit de contraste);
Être techniquement difficile ou long à réaliser;
Être coûteux à réaliser;
Être impossible à réaliser (contre-indications, non disponibilité, etc.);
Solution: Utiliser des tests diagnostiques alternatifs;
Mais est-ce des tests aussi bons, aussi valides?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Tableau de contingence (2 par 2): Permet de calculer différents indicateurs de la validité d’un nouveau test diagnostique par rapport à l’examen de référence

A

T : test diagnostique
M : examen de référence

VP : vrais positifs
FP : faux positifs
FN : faux négatifs
VN : vrais négatifs

Plus le FN est petit, plus la sensibilité est grande

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Rappel : Validité interne

A

Définition: Degré avec lequel un test mesure ce qu’il doit effectivement mesurer (absence de biais);
2 types :
Validité interne: mesure exacte dans l’échantillon étudié;
Validité externe: capacité de généraliser les résultats à d’autres patients;

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Étape 2 : Évaluation de la validité interne du nouveau test (comparaison avec test de référence)

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Validité interne : sensibilité (SE)

A

Définition: C’est la proportion des gens malades (M+) qui ont un test positif (T+). C’est donc la capacité du test à bien identifier les vrais positifs (VP), soit les personnes vraiment malades;

Formule: SE = (VP) / (VP + FN)

Complément (erreur): 1 – SE, nous donne la proportion de faux négatifs parmi les malades;

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Validité interne : spécificité (SP)

A

Définition: C’est la proportion des gens qui n’ont pas la maladie (M-) qui ont un test négatif (T-). C’est donc la capacité du test à bien identifier les vrais négatifs (VN), soit les non-malades.

Formule: SP = (VN) / (VN + FP)

Complément (erreur): 1 – SP, nous donne la proportion de faux positifs parmi les non malades

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Un test positif est relativement bon pour confirmer (rule in) la présence de la maladie (forte spécificité → peu de faux positifs).

Cependant, un test négatif ne permet pas de l’éliminer avec précision (rule out) (sensibilité faible-modérée → beaucoup de faux négatifs)

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Doit-on privilégier un examen sensible ou spécifique? sensibilité

A

Les examens à forte sensibilité sont utilisés:
Lorsque les conséquences d’un faux négatif sont importantes ou inacceptables:
Par exemple: pour détecter une maladie grave pour laquelle un traitement efficace existe (p.ex.: un patient chez qui on suspecte une thrombose veineuse profonde).
En début de démarche diagnostique afin d’exclure une ou plusieurs maladies de la liste des possibilités envisagées (to rule out diseases);
Par exemple: D-Dimer, sensibilité de plus de 98%. Si négatif, nul besoin de poursuivre avec Doppler chez les patients avec une faible probabilité clinique de thromboembolies veineuses;
En résumé: un test à forte sensibilité est utile en clinique quand son résultat est négatif (c.-à-d., fortes chances de ne pas être malade), car un tel test a peu de faux négatifs;

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Doit-on privilégier un examen sensible ou spécifique? spécifique

A

Les examens à forte spécificité sont utilisés:
Afin de confirmer une maladie dont on soupçonne fortement la présence à la suite d’une investigation antérieure (to rule in diseases)
Car un test à forte spécificité a un très faible nombre de faux positifs. Donc, si un résultat à un examen très spécifique est positif, les chances d’avoir réellement la maladie sont très grandes.
Lorsque les conséquences physiques, psychologiques et financières d’un faux positif sont inacceptables du point de vue du patient:
Exemples : lorsque le traitement entraine des effets secondaires majeurs (physiques ou psychologiques) (p.ex.: chimiothérapie, radiothérapie) ou lorsque le diagnostic est celui d’une maladie mortelle.
En résumé: un test à forte spécificité est utile en clinique quand son résultat est positif (c.-à-d., fortes chances d’être malade), car un tel test a peu de faux positifs.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Validité interne

A

Dans plusieurs situations cliniques, il est préférable d’avoir un test qui est à la fois très sensible et très spécifique;
Or, dans bien des cas, quand la sensibilité d’un test est très haute, sa spécificité est très basse, et vice versa;
Enfin, plusieurs tests diagnostiques sont mesurés sur des échelles numériques continues (p.ex.: pression artérielle); ce qui implique d’identifier un seuil permettant de différencier le plus correctement possible (c.-à-d., bonne sensibilité et bonne spécificité) les patients malades de ceux qui ne le sont pas (p.ex.: hypertendus vs. normo-tendus);
Comment alors identifier un tel seuil?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Seuil de normalité (ou seuil de positivité)

A

But : Convertir les résultats d’un test ordinal ou par intervalle en un résultat dichotomique afin d’en évaluer la validité interne;
Comment faire?
Fixer un seuil à partir duquel le résultat d’un test sera considéré comme positif (p.ex. TAD ≥ 80mm Hg). Calculer la sensibilité et la spécificité du test à ce seuil;
Répéter la première étape pour différents autres seuils (p.ex.: TAD ≥ 70, 75, 85, 90, 95mm Hg, etc.);
Rapporter les résultats sous forme de tableaux (voir prochaines diapos);
Choisir le seuil qui permet de maximiser la sensibilité et la spécificité du test;

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Conversion d’une échelle ordinale ou à intervalle en échelle nominale dichotomique:

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Validité interne : courbe ROC (receiver-operator characteristic curve)

A

Une courbe ROC donne la variation de la sensibilité en fonction du nombre de faux-positifs (1 – spécificité) pour chaque seuil possible.
Dans une courbe ROC, la meilleure valeur seuil (celle qui maximise la sensibilité et la spécificité) est celle qui est située le plus proche du coin supérieur gauche.
La ligne diagonale noire est celle d’un test sans valeur discriminative entre les malades et les non-malades

Si on revient à notre exemple de BNP (diapo 22), on voit que le seuil de 100 ph/ml est celui qui se rapproche le plus du coin supérieur gauche de la figure (c.-à-d., le seuil de 100 ph/ml est celui pour lequel les valeurs de sensibilité et de 1-spécificité se rapprochent le plus de 100%).

La courbe ROC aide donc à identifier le seuil qui maximise à la fois la sensibilité et la spécificité d’un test diagnostique.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

En résumé (1):
La sensibilité et la spécificité sont des propriétés d’un test qui résument sa capacité à discriminer entre les personnes qui sont malades et celles qui ne le sont pas;
Cependant, la sensibilité et la spécificité ne nous renseignent pas sur la probabilité qu’un patient x soit atteint ou non de la maladie d’intérêt (validité externe). Pour ce faire, les valeurs prédictives du test sont requises (voir diapos 30 et suivantes);

17
Q

En résumé (2):
L’aire sous la courbe ROC (area under the curve ou AUC) est un critère pour juger de la qualité «discriminante» d’un test diagnostic (discriminer entre malades et non-malades) ou encore pour sélectionner le meilleur test parmi un ensemble d’alternatives:
Dans certains articles, l’AUC est aussi appelée c-statistic (concordance statistic). C’est un synonyme.
On juge la valeur de l’AUC comme suit:
AUC > 0.9  discrimination exceptionnelle
AUC entre 0.8 et 0.9  discrimination excellente
AUC entre 0.7 et 0.79  discrimination acceptable
AUC < 0.7  discrimination faible

18
Q

En résumé (3):
Puisque la sensibilité, la spécificité et l’aire sous la courbe (AUC) d’un test diagnostic sont habituellement déterminées au moyen d’un échantillon de patients (idéalement sélectionnés au hasard), il est commun de rapporter ces trois mesures avec leurs intervalles de confiance à 95% (IC95%);
L’interprétation des IC95% est identique à ce que nous avons vu dans les cours précédents;
La taille de l’échantillon va venir influencer la largeur de l’intervalle de confiance, et donc la précision avec laquelle la sensibilité, la spécificité et l’AUC sont estimées (petit échantillon = moins de précision, et vice versa);

19
Q

1 Élaboration du nouveau test dx
2. évaluation de la validité interne du nouveau test (compraraison avec test de référence)
3 Prédiction de la probabilité d’être malade ou non selon le résultat de l’examen (validité externe)

20
Q

valeur prédictive positive

A

Valeur prédictive positive (VPP):
Définition: Probabilité (en %) qu’un individu soit réellement malade quand le résultat du test est positif;
Formule: VPP = (VP) / (VP + FP)
Complément (erreur): 1 – VPP, nous donne la probabilité d’observer un résultat faussement positif;

21
Q

valeur prédictive négative

A

Définition: Probabilité (en %) qu’un individu soit réellement sain quand le résultat du test est négatif
Formule: VPN = (VN) / (VN + FN)
Complément (erreur): 1 – VPN, nous donne la probabilité d’observer un résultat faussement négatif = 1 – VPN

22
Q

Interprétation (diapo 33):
Valeur prédictive positive (VPP): Parmi les 253 patients testés positifs (T+), seulement 55 (22%) avaient réellement une thrombose veineuse profonde. Ceci implique que 78% des test positifs étaient en fait des faux-positifs.
Un test + implique que le patient X a 22% de chance d’avoir une thrombose veineuse profonde;

Valeur prédictive négative (VPN): Parmi les 303 patients testés négatifs (T-), 99,7% n’avaient réellement pas de thrombose veineuse profonde. Ceci implique que 0,3% des tests négatifs, étaient en fait des faux-négatifs.
Un test – implique que le patient X a 99,7% de chances de ne pas avoir une thrombose veineuse profonde;

23
Q

Les valeurs prédictives sont influencées par :
La prévalence de la maladie dans la population d’intérêt:
Dans une population à forte prévalence de la maladie, la valeur prédictive positive (VPP) d’un test augmente; lorsque la prévalence de la maladie diminue, la VPP diminue aussi;
La sensibilité et la spécificité du test
Plus un test est sensible, meilleure sera sa valeur prédictive négative (VPN) et plus un clinicien pourra être confiant qu’un test négatif permet d’éliminer la maladie (rule out), car un tel test a peu de faux négatifs;
Plus un test est spécifique, meilleure sera sa valeur prédictive positive (VPP), et plus un clinicien pourra être confiant qu’un test positif confirme la présence de la maladie (rule in), car un tel test a peu de faux positifs;