14-Considérations statistiques + devis adaptatif Flashcards
Types de variables quantitatives:
Continue
Discrète
Types de variables qualitatives:
Nominale (pas d’ordre)
Ordinale (ordre)
Types d’inférences pour une variable quantitative
- Inférence sur une moyenne (espérance) de la variable
- On peut supposer une loi paramétrique ou non
Type d’inférence pour une variable qualitative
Inférence sur les effectifs ou proportions (ex: rapport de cote)
Test de student
Pour comparer les moyennes de deux groupes différents
Statistique de test
Une fonction qu’on va appliquer aux données (ex: la moyenne)
plus on a de suppositions, plus on a de puissance MAIS
plus on a de chances de se tromper
test T pour des variances non-égales
test de welch
les tests paramétriques ont un gain de ___ et une sensibilité aux ___
puissance, suppositions
l’équivalent du test t, mais non-paramétrique
Mann-Whitney-Wilcoxon
quel test permet l’inclusion d’une variables indépendante
ANOVA
test statistique pour ajustement pour des variables quantitatives (covariance)
ANCOVA
test statistique pour plusieurs variables dépendantes (issue d’intéret) = multivariée
MANOVA
But de la régression linéaire
minimiser la distance (carrée, pour les différences vers le haut et vers le bas) entre les points et la droite
Pour une augmentation unitaire de X, Y augmente de
Beta
Test d’hypothèse possible pour la regression linéaire
H0: Beta = 0, Beta étant la pente
Que veux dire une régression linéaire multivariables
il y a plusieurs X
Que veux dire une régression linéaire multivariée
il y a plusieurs y
Definition du coefficient de détermination du modèle de regression linéaire (R2)
La fraction de la variance de la variable dépendante qui est expliquée par le modèle
La régression linéaire suppose une:
proportionnalité: augmenter la variable d’une unité a toujours le même effet
La régression linéaire est elle toujours linéaire?
Non, ex: on ajuste pour l’âge au carré
Est ce que la régression linéaire est utile pour modéliser d’autres types de variables dépendantes?
Oui, ex: si l’issu est binaire = les modèles linéaires généralisés, permet d’accommoder différent types de variables dépendantes
Quelle fonction permet d’accommoder différents types de variables dépendantes dans la régression linéaire?
La fonction g
Modèle le plus populaire des modèles linéaires généralisés
La régression logistique
Dans la régression logistique, un augmentation de X d’une unité est associé à une augmentation ___ de Beta
la ln cote de Y
Interprétation habituelle pour la régression logistique
e^Beta est le rapport des cotes soit l’augmentation relative de la cote lorseque X augmente d’une unité
Les modèles linéaires généralisés sont utilisés fréquemment en recherche pour
Ajuster pour des covariables
3 applications des modèles linéaires généralisés dans des essais randomisés:
- Analyses post-hoc
- Ajustement pour imbalance statistique (analyse de covariables)
- Autres modèles similaires souvent utilisés comme analyse principale des essais ex: analyse de survie
Quel test pour la comparaison de proportions
Khi deux
Donner un exemple d’application pour un test khi deux
Comparer la proportion de femmes dans chaque groupe de traitement
Comparer le nombre d’AVC dans chaque groupe de traitement
3 tests pour la comparaison de proportion (autre que le khi 2)
- Test exact de fisher (parfois recommandé lorseque les effectifs sont faibles)
- Cochran-Mantel-Henszel (comparer des proportions en contrôlant pour une variable catégorique)
- Regression logistique
test d’équivalence
on veut montrer qu’un traitement expérimental ne diffère pas plus d’une marge prédéfinie (delta) d’un traitement de référence
dans quel cas on peut rejetter l’hypothèse nulle dans un test d’équivalence
on fait deux test t unilatéraux et on rejette si elle est rejetté par les deux tests (two one sided tests, TOST)
Un test statistique de non-infériorité seul n’est pas suffisant, on voudra mettre de l’avant aussi: (4)
- Innocuité
- Facilité d’utilisation
- Coût
- Pas d’ajustement de dose nécessaire
la FDA penses qu’on devrais plus utiliser le test bilatéral ou unilatéral
bilatéral a moins qu’il y ait de fortes justifications pour s’attendre a une différence dans une seule direction
erreur de type 1
faux positif (alpha)
erreur de type 2
faux négatif (beta)
H0 vraie - H0 rejetée
alpha erreur de type 1
H1 vrai - H0 rejetée
1-beta (puissance)
H0 vraie - H0 non-rejetée
1-alpha
H1 vrai - H0 non rejetée
Beta erreur de type 2
puissance statistique
capacité a rejeter H0 lorsequ’elle est fausse, paramètre essentiel dans la planification d’une étude
- avec les moyens qu’on a, quelle est la taille d’effet minimal qu’on peut détecter?
la variance d’une variable avec une distribution bernouilli(p) est
p(1-p)
comment on fait pour calculer la valeur de n pour la puissance si les groupes sont de taille inagale
- calculer la valeur de “n” nécessaire pour des groupes de tailles égales
- Appliquer le ratio nC/nE=k
formule pour le nombre effectif en tenant compte de l’attrition
N’=N/(1-L)
L=taux anticipé de sortie de l’étude
ex: L=0.1=taux d’attrition de 10%
Facteurs influençant l’atteinte de la taille de l’échantillon
- Winners curse = efficacité d’une nouvelle intervention est souvent surestimée (souvent quand on decouvre qqch c’est de la chance)
- les sujets inclus dans le groupe contrôle répondent souvent davantage que prévu (meilleur suivi que en pratique courante)
- critères d’inclusion/d’exclusion peuvent exclure des gens à haut risque d’avoir l’événement utilisé comme critère d’efficacité
- sous-estimation de la perte au suivi ou mauvaise adhérence
comment remédier aux facteurs influençant l’atteinte de la taille de l’échantillon
- repenser les critères d’inclusion/d’exclusion
- élargir la définition de l’issu
- recherche un paramètre substitut pour que l’efficacité soit estimée correctement
- allonger la durée de l’étude
- études multi-centriques: remplacer les centres à faible recrutement
si on ne fais rien pour tenir compte du nombre de tests (test dans plusieurs sous-groupes, tester plusieurs issues/critères d’évaluation) on peut parler de
inflation du risque alpha
3 méthodes pour la planification d’analyses intérimaires
- Pocock
- O’Brien-Flemming
- Peto-Haybittle
- elles spécifient différents seuils de significativité pour les analyses intérimaires
quelle méthode d’analyse intérimaire est plus conservatrice que Pocock
O’Brien-Fleming: il garde ses dépenses de alpha plus pour la fin de l’étude
deux solutions pour éviter l’inflation du risque alpha
- Peto-Haybittle
- Analyse dans l’estimation de l’effet
Peto-Haybittle
On choisit des très petits alpha pour les analyses intérimaires et on conserve le seuil habituel pour l’analyse finale
On suppose que la dépense du risque est négligeable
avantage de peto-haybittle (3)
- évite les calculs de seuil (on fait juste utiliser un petit alpha)
- interprétabilité facile car le seuil à la fin de l’étude est alpha
- arrêt de l’étude seulement si résultats très significatif
désavantages de peto-haybittle (2)
- innaplicable si trop d’analyses intérimaires
- approximatif, pas de garantie du seuil alpha
analyse intérimaire sans estimation de l’effet (sans test statistique)
- ajustement de la taille d’échantillon ciblée
- augmenter la durée de l’étude
- modifier les critères d’inclusion et d’exclusion
On peut regarder la variance ou le risque de base du critère d’efficacité
devis adaptatif et objectif
modification au devis de l’étude permise en fonction du résultat de l’analyse intérimaire
aide a la planification des essais cliniques dans des domaines ou les conditions expérimentales sont difficiles
genres de modifications du devis adaptatif
- taille de l’échantillon
- arrêt prématuré (efficacité ou futilité)
- mod des critères d’inclusion/d’exclusion
- mod de dose
- mod de durée de traitement
exigences particulières des devis adaptatifs
- analyse intérimaires et types de mod doivent être décrites et justifiées
- l’erreur de type 1 doit être contrôlée
Avantages des devis adaptatifs (3)
- économique (peut augmenter l’efficacité)
- éthique (peut nécessiter moins de patients donc moins d’exposition au placebo)
- devrais améliorer les fondements scientifiques pour la prise de décision
Désavantages des devis adaptatifs (2)
- danger d’introduire un biais si analyses intérimaires sans insu
- contrôle de l’erreur de type 1
types d’adaptation du devis adaptatif (5)
- taille d’échantillon
- population de patient
- sélection du bras de traitement
- allocation des participants
- sélection du critère de jugement
devis adaptatif: changement du N cible sans estimation de l’effet
- on ne connait pas la variance dont on a besoin pour bien calculer la puissance, on l’estime en analyse intérimaire pour guider la sélection de N
- on a besoin de p0 la probabilité de l’évènement dans le bras contrôle pour estimer la puissance
- assez inoffensif, mais danger si on a besoin de connaître l’assignation du traitement (briser l’insu, danger de maintien de l’intégrité)
devis adaptatif: changement du N cible avec comparaison de l’effet
- utile si difficile d’évaluer l’effet possible d’un traitement
- dangeureux et nécessite de briser l’insu, il faut faire très attention au risque d’erreur de type 1
Pourquoi Bonferroni est inadéquat pour un changement de N cible avec comparaison de l’effet
Parce que on a brisé l’insu, nos test k ne sont plus indépendants, ils sont rendus dépendants
Changement du N cible avec comparaison de l’effet: ajustement avec méthodes…
Pour combiner des statistiques de test de différentes étapes ou pour le maintient de l’erreur de type 1 conditionnelle
Type d’adaptation: population de patients
Si on pense que l’effet du traitement varie selon des sous-groupes, on peut choisit d’adapter la population cible après l’analyse intérimaire (doit être basé sur de l’évidence scientifique antérieur)
On peut commencer l’étude dans une population élargie et choisir soit de poursuivre ou de cibler une population pré-spécifiée après l’analyse intérimaire (devis d’enrichissement adaptatif)
Type d’adaptation: sélection du bras de traitement
on peut ajouter ou supprimer des bras de traitement
ex: on a plusieurs bras et on poursuit avec le meilleur
devis de réévaluation continue
type d’adaptation = sélection du bras de traitement
on augmente les doses selon les toxicité observées pour estimer la dose maximale tolérée pour un nouveau rx
type d’adaptation: allocation des participants
on distingue l’adaptation selon des caractéristiques au recrutement (covariables) vs l’adaptation selon la comparaison du critère de jugement
Permet d’améliorer l’équilibre d’une covariable entre les groupes de traitement
adaptation à l’allocation selon le critère de jugement
on change la probabilité d’allouer un participant a un traitement en fonction des résultats encourus par les autres participants
peut permettre plus de puissance, des essais plus courts, de plus petites tailles d’échantillon
pourquoi l’adaptation à l’allocation selon le critère de jugement peut être controversé
parce que on se base sur des résultats incertains d’analyse intérimaire pour changer les allocations
type d’adaptation: sélection du critère de jugement
on choisit le critère de jugement principale selon les résultats d’une analyse intérimaire
Si on consifère plusieurs issues primaires qui seraient acceptables mais qu’on ne peut pas prédire la taille de l’effet adéquatement
controversé et délicat!!! doit se faire en dialogue avec les organismes régulateurs
étude adaptative en continu (devis seamless)
combiner deux essais par exemple pour transformer une phase 2 en phase 3
étape 1: choisir la dose
etape 2: pour confirmer l’efficacité en se basant sur l’essai entier
inconvénient du devis seamless
peut réduire le temps de réflexion entre la phase 2 et 3 qui permet parfois une meilleur planification
défis logistiques du devis seamless (4)
- approvisionnement (changement de dose)
- coordination des centres (changement au recrutement, N cible par exemple)
- modification du consentement
- intéractions avec autorités réglementaires
adaptations fréquemment acceptées par les agences réglementaires (3)
- allocation basée sur la réponse en phase 2
- ré-estimation en insu de N
- arrêt prématuré pour innocuité, efficacité ou futilité
adaptations plutôt controversées pour les agences règlementaires (2)
- ré-estimation en ouvert de N
- essais seamless
adaptations quasi innaceptables par les agences réglementaires (3)
- enrichissement non planifié
- changement du paramètre primaire
- changement du choix de test statistique
adaptations concurrente ou ad hoc
non planifiée mais implémentées par nécessité via des amendements au protocole
adaptations rétrospectives
changement non indiqué au protocole mais qui doit être fait avant le gel de la base de données ou la levée de l’insu (avec autorisation d’un comité d’experts)
implique un changement du plan d’analyse statistique
definition de sensibilité d’un essai clinique
capacité d’un essai clinique à distinguer un traitement efficace d’un traitement inefficace ou moins efficace
si l’essai est inneficace on concluera…
que le traitement expérimental est inefficace (peut être à tort)
la non-infériorité même si le traitement est inefficace (ex si le comparateur active est inefficace)
la sensibilité est démontrée quand…
un essai de supériorité est positif
cas ou un essai pourrait manquer de sensibilité
étude démontrant la non-infériorité ou une étude ne démontrant pas la supériorité
un résultat négatif à un essai de supériorité peut être du a
un manque de puissance statistique
si on a pas la sensibilité dans un essai de supériorité on a un faux positif
erreur de type 2 dans un essai de non-infériorité
ne pas rejeter H0 alors qu’elle est fausse
cela implique de ne pas rejeter l’infériorité alors que le traitement est inférieur, ce qui n’est pas lié à la sensibilité de l’essai
vrai ou faux: la sensibilité pour les essais de supériorité est liée a la puissance
vrai
vrai ou faux: la sensibilité pour les essais de non-infériorité est liée a la puissance
faux
dans la sensibilité d’un étude de non-infériorité, le problème est l’incertitude sur l’effet du comparateur actif. il faut regarder:
- évidence historique d’essais similaires qui ont démontré leur sensibilité
- la conduite adéquate de l’essai (il n’y as pas de facteurs qui auraient pu nuire à la capacité de l’essai de distinguer un traitement efficace)
sensibilité de l’essai: non-infériorié: critère 1: évidence historique
on démontre avant l’essai que, dans le contexte de l’étude, des médicaments actifs comparables ont démontré un effet de façon fiable
idéalement, on a une preuve directe de l’efficacité du comparateur actif (ex une étude montrant la supériorité)
pour un essai de non-infériorité, quand l’évidence historique de l’effet du traitement est limitée, il devient difficile de
fixer la marge de non-infériorité
dans un essai de non-infériorité il ne faut surtout pas que l’effet réel du comparateur (delta) soit compatible avec
la futilité (il est difficile de conclure que notre traitement expérimental est au moins aussi bon parce que il pourrais également ne pas avoir d’effet)
si on a pas de comparaison entre le traitement test et de réference, comment choisir la marge?
- établir un intervalle de confiance 95% “historique” de l’effet du traitement test vs placébo
- choisir delta plus petit que l’effet minimal du traitement (faire une vérification a posteriori de l’effet du traitement test vs placebo: par extrapolation de l’effet)
2 choses a s’assurer quand on fait le choix du delta
- doit s’assurer de préserver la sensibilité de l’essai
- doit s’assuruer que une différence de delta ne soit pas consideré comme cliniquement significative
sensibilité de l’essai: non-infériorié: critère 2: conduite adéquate de l’essai
- on s’assure que le devis était similaire aux études antérieurs
- on s’assuruer que les populations réelles étaient similaires (méds concommitants, population clinique)
- on regarde les pertes au suivi, l’adhérence
4 points pour montrer la sensibilité d’un essai de non-infériorité
- déterminer l’évidence historique d’efficacité du comparateur
- planifier l’étude en s’assurant l’arrimage avec les études ayant montré l’efficacité
- choisir une marge de non-infériorité
- mener l’étude en s’assurant de conserver l’arrimage avec les études historiques
une solution intéressante pour assurer de la sensibilité d’un essai de non-infériorité
Essais a trois bras
(permet de s’assurer de la sensibilité en comparant le comparateur actif au placebo)