LCA Flashcards
Objectifs de la randomisation
Assurer la comparabilité a priori des deux groupes (identiques sauf Tt)
Minimiser les biais de sélection (groupes homogènes)
Assure une réparition équilibrée des facteurs de confusion (connus ou non)
Permettre une analyse en intention de traiter / en sous-groupe (si stratifiée)
Analyse du diagramme de flux - flow chart
1 = population screenée:
pas forcément éligible mais considérée pour l’étude
2 = population éligible:
rechercher des critères d’exclusion / consentement
3 = population incluse (randomisée):
population en intention de traiter
4 = population par bras
après la randomisation / ceux recevant le traitement
5 = population analysée:
doit être la même que la population incluse (ITT) +++
!! Remarque: toujours vérifier
que la population analysée est égale à celle randomisée (analyse en ITT)
Critère de jugement principal doit être :
unique simple consensuel standardisé reproductible cliniquement pertinent
« consensuel » = critère validé par des publications (définitions internationales)
Risque alpha
Risque bêta
Hypothèses
Soit H0 l’hypothèse nulle: il n’existe pas de différence entre les 2 groupes
Soit H1 l’hypothèse alternative: il existe une différence entre les 2 groupe
Risque α (risque de 1ère espèce)
α = p (rejet H0 / H0) = probabilité de trouver une différence si elle n’existe pas
α augmente si le nombre de tests (= critères de jugement) augmente
En pratique, seuil de signification: α < 5%
Risque β (risque de 2nde espèce)
β = p (rejet H1/H1) = probabilité de ne pas trouver de différence si elle existe
En pratique, β = 20% (selon la puissance désirée)
Puissance = 1-β
1-β = probabilité de conclure à une différence entre les traitements si elle existe
la puissance augmente lorsque le nombre de sujets augmente
p = degré de signification
p = probabilité que la différence trouvée soit due entièrement au hasard
Remarque: p ≠ α : p est fixé de manière arbitraire à l’avance / α dépend de l’étude
Validité de l’étude
Validité interne
Définition: validité méthodologique des résultats obtenus
Evaluation = vérifier l’absence de biais
Biais de sélection: randomisation bien faite / perdus de vue / analyse en ITT
Biais de classement: double aveugle / critère principal unique, standard..
Biais de confusion: groupes comparables / stratification..
Validité externe
comprend :
l’applicabilité (ou généralisabilité) = pertinence clinique
définition: généralisabilité des résultats à la population « réelle »
évaluation
critères d’inclusion: patients représentatifs / pas trop restrictifs
taux de refus: limité / !! doit figurer dans le diagramme de flux
centres: multicentrique / mixtes / similaires à la pratique courante
critère d’évaluation: pertinence clinique (objectif thérapeutique)
groupe contrôle: existence d’autres Tt que celui choisi / placebo justifié ?
résultats: taille du bénéfice pertinente / rapport bénéfice-coût-tolérance
la cohérence externe
définition: concordance des résultats avec les connaissances préalables
évaluation
Résultat confirmé par au moins un autre essai
Cohérence avec les donnés
physiopathologiques
Cohérence avec une éventuelle méta-analyse
Différents biais et mesures préventives
Biais de sélection
Définition: concerne la comparabilité des groupes
Comprend:
Biais de recrutement (type de maladie, type de centres)
Biais des perdus de vue
Biais d’attrition: les patients analysés ne sont pas les patients randomisés
Effet-centre: lié à la non représentativité du centre. Ex: trop spécialisé, etc.
Mesures préventives Randomisation correcte (stratifiée si analyse en sous-groupe / par bloc, etc) Analyse en intention de traiter: ITT (biais d’attrition) Etudes multicentriques (effet-centre dans toute étude monocentrique)
Biais de classement (= biais de mesure)
Définition: concerne la mesure du critère de jugement principal
Comprend:
Biais de suivi (ou biais de performance): suivi / obervance ≠ selon le groupe
Biais d’évaluation: toujours une part subjective même dans un critère « objectif »
Biais de réalisation: soins prodigués de facon différente
Mesures préventives
Double aveugle
Critère d’évaluation principal unique / standardisé / validé / reproductible
Comité d’adjudication / évaluation double / évaluateurs indépendants
Investigateurs différents pour diagnostic / randomisation / acte thérapeutique / suivi
Biais de confusion
Définition: concerne l’existence de facteurs de confusion
!! Ne sera un biais que si la distribution des facteurs diffère entre les 2 groupes
Comprend:
effet placebo du médicament
caractéristiques intrinsèques des patients (âge, sexe, atcd, etc)
effet non médicamenteux de la prise en charge
évolution naturelle de la maladie
Mesures préventives
Groupe contrôle
A priori: stratification / restriction / randomisation / (appariement si cas-témoin)
A posteriori: ajustement par l’analyse multivariée
10 commandements de Bergman
Pour un essai thérapeutique
Essai controlé Etude randomisée Etude en double aveugle Calcul du nombre de sujet necessaire Population d’inclusion claire Critere principal d’evaluation unique Analyse en intention de traiter Analyse du critere principal en fin d’etude sur l’ensemble de la pop incluse Difference statistiquement significative Difference cliniquement signifiante
CRANI CIVD
Contrôlée Randomisée Aveugle double Nombre de sujet nécessaire Intention de traiter Critère de jugement principal (6) Inclusion critères Validité externe Significative différence
Biais classiques
Analyse en sous-groupe sur randomisation non stratifiée
Faire passer le critere d’evaluation II en critere principal
Analyse en per-protocole ou en intermediaire
Perdus de vue nombreux ou non detaillés
Analyse en intention de traiter incomplete
Plan résumé
Objectif
contexte
objectif principal
Méthodes
schéma expérimental (type d’essai, etc)
lieu (pays / type de structure)
patients (critères d’inclusion / nombre)
intervention (bras / durée de suivi)
critère de jugement principal +++
critères de jugement secondaires
analyse (si ITT / critères d’ajustement)
Résultats
patients (perdus de vue / durée de suivi)
sur le critère principal (analyse descriptive / univariée / multivariée)
sur les critères secondaires ou sous-groupes intéressants
tolérance +++
Conclusion
reprise du résultat principal
ouverture (pas indispensable)
Répondre à : “quel est l’objectif de l’étude?”
En pratique, ne pas se contenter de la phrase des auteurs +++ ; doit inclure (4)
Le type d’étude (évaluation de la supériorité, de la performance diagnostique, etc)
Le traitement (ou test) à l’essai
Le traitement du bras contrôle (placebo ou référence)
Le critère principal d’évaluation (sur la mortalité, sur tel critère..)
La maladie et la population à l’étude (chez tels patients)
Exemple Ne pas recopier: « évaluer l’efficacité du Tt A » Mais compléter avec: « comparer l’efficacité du Tt A versus placebo ou versus Tt B sur tel critère de jugement chez tels patients avec telle maladie »
Quel est le type de l’étude ?
Etude [thérapeutique / diagnostique (dépistage) / épidémiologique (pronostique ou étiologique)]
Observationnelle ou interventionnelle
Prospective ou rétrospective
Analytique ou descriptive (si épidémiologique)
De supériorité ou de non-infériorité (si thérapeutique)
Randomisée ou non randomisée
En 2 groupes parallèles ou en cross-over
Controlée contre placebo / contre Tt / non contrôlée
En double aveugle / simple aveugle / ouvert
Monocentrique ou multicentrique / internationale ou non
De phase III (ou I ou II)
Règles d’éthique/autorisations pour mener l’étude
Obtention d’un consentement éclairé écrit après information du patient
Obtention de l’avis favorable du comité de protection des personnes (CPP)
Obtention de l’accord de l’AFSSAPS en cas d’étude thérapeutique
Obtention de l’accord de la CNIL en cas de données nominatives
Obtention de l’avis favorable du comité d’éthique de l’hôpital
Protocole en accord avec la déclaration d’Helsinki / loi de bioéthique (Août 2004)
Conditions pour utiliser un placebo?
Objectifs du groupe contrôle?
Conditions pour utiliser un placebo
Il n’y a pas de traitement de référence
Il n’y a pas de perte de chance: les symptômes sont réversibles
!! Dans tous les autres cas un placebo n’est pas éthique: contrôler contre Tt de réference
Objectif du groupe contrôle
Minimiser les biais de confusion +++
Les deux groupes doivent être exactement identiques sauf pour le traitement
Donc randomisation initiale et double aveugle maintenu tout au long de l’étude
Discuter la comparabilité des groupes
Vérifier la comparabilité initiale des groupes = regarder le tableau 1
!! le petit p n’a pas d’intérêt hors facteurs de confusion majeurs
cf biais des comparaisons multiples: forcément ≥ 1 de positif sur le tas
→ vérifier la comparabilité des effectifs pour les critères cliniquement pertinents +++
Et détailler +++ : citer les effectifs dans la réponse pour chacun de ces critères
Vérifier le maintien de la comparabilité = regarder le Flow-chart (figure 1)
Vérifier que le nombre de perdus de vue est comparable
Vérifier que le nombre de patients exclus est comparable
Remarques
Si pas de p dans tableau 1, rechercher dans le texte la phrase sur la comparabilité
!! Une bonne randomisation assure des groupes comparables initialement
Quels critères permettent le maintien de la comparabilité ?
Comment assure-t-on le maintien du double aveugle ?
Pour assurer la comparabilité initiale = randomisation
Il faut vérifier qu’elle est bien faite (cf tableau 1: tous comparables)
En cas de facteurs de confusion: faire une randomisation stratifiée
Pour assurer le maintien de la comparabilité = double aveugle
Technique d’allocation du traitement appropriée
Séquences et présentation (galénique) des traitements identiques
Validation des critères de jugement en aveugle par un comité d’adjudication
Analyse statistiques par statisticiens en aveugle des groupes
Technique du double placebo
indispensable si impossible de faire des médicaments identiques
chaque patient reçoit deux « seringues/pilule » d’aspects identiques 2 à 2
Pour assurer la comparabilité finale = intention de traiter
ITT asssure que les groupes analysés sont bien les mêmes que ceux randomisés
Avantages étude multi-centrique
Recrutement plus important = plus de patients: puissance ↑
Recrutement plus large = applicabilité (cf effet centre): validité externe ↑
Recrutement plus rapide = évite un biais « effet temps » : validité interne ↑
Quel est le critère de jugement principal ?
Justifier un critère « mortalité totale » ou un critère composite
Critère de jugement principal: doit toujours être: (6)
!! unique / simple / consensuel / standardisé / reproductible / cliniquement pertinent
« consensuel » = critère validé par des publications (définitions internationales)
Critères de jugement secondaires
!! Comprend toujours la tolérance: effets indésirables (même si implicite !) (PMZ)
Ne pourront en aucun cas être mis au 1er plan de l’analyse +++
→ une autre étude en mettant le critère II en critère principal sera nécéssaire
Critère « décès toute cause » toujours préférable à décès « spécifique » car :
Evite le biais de classement dû à la difficulté à déterminer la cause spécifique du décès
Prend en compte les décès non spécifiques mais liés au Tt (ex: AVP sur somnolence)
Ne diminue pas la probabilité de montrer une différence car randomisation +++
Critère composite souvent préférable à un critère unique
Avantages
Augmente le nombre d’évènements et donc la puissance statistique
Correspond à la situation clinique réelle (ex: IDM, revascularisation..)
Permet de regrouper des facteurs d’efficacité et de tolérance
Inconvénients
Regroupe des évènements de gravité différente (ex: TVP et EP)
Sous-estime la gravité d’une suite d’évènement (ex: TVP puis EP)
Pertinence clinique d’un critère composite
Vérifier que les sous-critères sont de gravité comparable +++
(mais si décès inclus, des complications graves sont ok)
Remarque: critères d’évaluation dans les études diagnostiques
LE critère principal = paramètres opérationnels du test (Se-Sp / VPP-VPN / RVP-RVN)
Les critères secondaires = détermination du seuil optimal / du biais / de la corrélation..
Différents types d’analyses
Analyse en intention de traiter
L’analyse statistique doit prendre en compte la totalité des patients randomisés au depart
même si: interruption du Tt / Tt non pris / modification du rythme ou de la posologie
Mode d’analyse le plus rigoureux car (3) +++
Evite le biais d’attrition: conserve la comparabilité initiale issue de la randomisation
Option pragmatique: se rapproche des conditions de la vie réelle (arrêt sur ES..)
Hypothèse du biais maximum: renforce le niveau de preuve d’une différence
!! Seulement 2 situations où l’absence d’ITT est justifiée
- Essais de non-infériorité: l’hypothèse du biais maximum est celle du per-protocole
- Evaluation de la tolérance: l’hypothèse du biais maximum est celle du per-protocole
Analyse en sous groupe
Consiste à comparer le Tt dans une partie seulement de l’effectif total (ex: patients >65ans)
NPC: n’est pas une analyse multivariée mais univariée dans chacun des sous-groupes
Limites de l’analyse en sous-groupe (3)
Perte de la comparabilité (biais de sélection) en l’absence de stratification préalable
Petits effectifs donc IC très larges et puissance insuffisante
Comparaisons mutiples donc il faudrait ajuster (diminuer) le risque α
Conclusion sur une analyse en sous-groupe
Résultats descriptifs et exploratoires: « il semble que… »
Mieux si stratification: répartition équilibrée donc sous-groupes comparables
Mais dans tous les cas ne permet jamais de trancher de façon définitive
→ il faudra refaire une étude spécifique dans le sous-groupe considéré +++
Analyse de survie
= analyse temporelle du délai de survenue d’un critère principal binaire (décès, récidive..)
!! suppose que le risque de décès soit constant tout au long de l’étude ++
Courbe de Kaplan-Meier: analyse descriptive / !! peut être « inversée » : 1-S(t)
!! à t0, on doit retrouver la population en intention de traiter +++
Test du Log-rank: analyse univariée: comparaison des surfaces sous les courbes
Modèle de Cox: analyse multivariée: ajustement sur les facteurs de confusion
Quel est le NNT? Comment le calcule-t-on?
NNT = number needed to treat
C’est le nombre de sujet à traiter pour éviter la survenue d’un évènement
NST = 1 / RAR = 1 / (A-B) (!! A et B en pourcentages et non pas en effectifs)
Exemple: décès (A) = 20% et décès (B) = 10% → NST = 1/10% = 10 patients
Traduction clinique: « Il faut traiter 10 patients pendant 1an pour éviter 1 décès »
!! Remarque
NNT se calcule sur une durée donnée et pour un évènement (critère d’évaluation) donné
→ Il faut prendre la RAR correspondant à ce critère d’évaluation pour ce délai +++
exemple: NNT par an sur la mortalité, il faut prendre le résultat mortalité totale à 1an
Biais selon les types d’études
Comment les éviter?
A chaque biais se demander si il est différentiel ou non (= que dans un groupe)
Biais des essais thérapeutiques
Biais de sélection
classiques: recrutement / effet-centre / effet-temps / biais d’attrition / perdus de vue
contrôle: randomisation / essai multicentrique / analyse en intention de traiter
Biais de classement
classiques: biais de performance / biais d’évaluation / biais de réalisation
contrôle: double aveugle / critère d’évaluation validé / comité d’adjudication
Biais de confusion
classiques: effet placebo / caractéristiques des patients / évolution naturelle
contrôle: bras contrôle / stratification / ajustement (analyse multi-variée)
Biais des essais diagnostiques
Biais de sélection
Comme pour tout essai: étude monocentrique / patients volontaires / restriction..
Sélection des patients sur le résultat du test à l’essai et non sur la pathologie +++
Biais de classement
Biais d’interprétation: peu d’évaluateurs / biais d’apprentissage (machine neuve..)
Biais d’information: pas d’aveugle: on connait le résultat de l’un pour interpréter l’autre
Biais de vérification: tous les patients ne subissent pas les 2 tests (GS invasif, cher..)
Biais de confusion
Le gold standard est déterminé par le résultat du test à l’essai +++
ex: histologie que si suspicion de tumeur à la TEP et surveillance sinon
Biais des études épidémiologiques
Biais de sélection
classiques: biais d’auto-sélection / biais de survie sélective / perdus de vue
contrôle: appariement des cas et des contrôles
Biais de classement
classiques: biais de mémorisation / biais de jugement / biais d’évaluation
contrôle: enquêteurs en aveugle / questionnaire validé / variabilité inter-enquêteur
Biais de confusion
classiques: tout facteur indépendamment associé au facteur étudié et à l’évènement
contrôle: appariement initial / stratification / restriction / ajustement: multi-variée ++
Proposer un titre pour l’article
Toujours mettre 5 éléments dans un titre:
Le critère de jugement principal (+ durée)
Le traitement (ou le test) à l’essai
Le traitement (ou le test) de référence
La maladie en question / la population
Le type et design de l’étude (ETR, ENI..)
Classification des études épidémiologiques
Classification des études épidémiologiques
Epidémiologie interventionnelle (expérimentale)
= toute enquête où l’attribution de l’exposition est contrôlée par l’investigateur
Essais semi-expérimentaux: évaluation d’un programme de prévention (PP°)
Etudes « avant / après » = comparaison du même groupe avant et après le PP°
Etudes « ici / ailleurs » = comparaison de 2 groupes ayant suivi ou pas le PP°
Epidémiologie observationnelle (+++)
= toute enquête ou l’exposition au facteur étudié ne dépend pas de l’investigateur
!! Remarque: permettent d’établir un lien statistique mais pas causal (PMZ)
Enquêtes descriptives
Objectif = description de l’état de santé d’une population donnée
Etudes transversales descriptives: calcul de la prévalence (hors exposition)
Etudes de cohorte descriptives: calcul de l’incidence et mortalité
Enquêtes analytiques
Objectif = étudier le lien entre une maladie et une exposition à un facteur
Etudes de cohorte: calcul d’un risque relatif (RR)
Etudes cas-témoin: calcul d’un odds ratio (OR)
+++++
Etudes cas-témoins
avantages: maladie rare / plusieurs facteurs étudiés / durée courte / coût faible
inconvénients: biais de sélection et mémorisation / niveau de preuve faible (3-C)
Etudes de cohorte
avantages: exposition rare / plusieurs maladies étudiées / niveau de preuve élevé /
estime l’incidence
inconvénient: biais d’attrition (perdus de vue) / durée longue / coût élevé