module 4 Flashcards
qu’est ce qu’un PAS?
plan d’analyse statistique
document qui définit les principales analyses statistiques
quand est obligatoire le PAS?
dans une demande de subvention et dans le protocole d’étude
*une très brève description est de rigueur dans les articles scientifiques
y a t-il plusieurs façons d’analyser les donnes?
oui! et donne toutes des résultats différentes
comment le PAS assure une certaine objectivité?
car prévient la subjectivité dans le choix des analyses et dans l’impact de ce choix sur le résultat
=lors de la publication des résultats d’un essai clinique, les revues avec un facteur d’impact élevé exigeante une copie du PAS à la soumission de l’article et la date ou il a été scellé/finalisé
quand est écrit le PAS?
avant le début de l’étude et donc avant d’avoir eu les résultats!
qu’est ce que le problème de multiplicité en statistique?
si on présente seulement le “billet gagnant”; soit les résultats positifs soutenant l’hypothèse du chercheur nous ont présentés à la suite d’un exercice de tripotage de données=analyse gagnante seulement!
**on peut tenir compte de la multiplicité mais doit être déclarée dans l’article avant tous! (dans le PAS)
peut on inclure le PAS au complet?
non par faute d’espace (PAS complet est de 50-300 pages)
=concentre principalement sur analyse se rapportant au CRP (analyse principale)
quelles types de revues exigent une copie de PAS?
NEJM
quels sont les 6 sections des recommandations sur le contenu d’un PAS?
- section1;détails administratifs (promoteur, chercheur principal, auteur du PAS)
- section 2;résumé de l’étude et de la question de recherche
- section 3; design et méthodes de l’étude (randomisation, insu)
- section 4; principes et statistiques utilisées
- section 5; population de l’étude
- section 6; description des analyses statistiques prévues
estce que le PAS peut donner des résultats?
NON car écrit avant le début de l’étude!
=décrit les méthodes analytiques seulement et ne donne aucun résultat
=plan d’architecte pour les analyses statistiques afin de répondre à la question de recherche et aux questions secondaires
qu’est ce qu’une variable mesurée lors d’un essai clinque?
caractéristique socio-démographique ou clinique mesurée sur chaque participant/patient de l’étude
=mesure plusieurs centaines de variables (voir millier) par patient
à quelle fréquence on mesure une variable?
-une fois durant l’étude car elle est constante (homme/femme)
ou
-plusieurs reprises durant le suivi du patient afin de permettre de déterminer son évolution (taux de cholestérol)
la variable est au centre de quoi?
erreur aléatoire
*indique que la caractéristique varie entre les patients et/ou durant le suivi
(variation est au centre de l’erreur aléatoire)
comment sont mesurée les variables?
selon le protocole fixe d’évaluation; une cédule de visite
quelles sont les variables mesurées avant la randomisation et le début des interventions?
- socio démographique (genre,age,education, ehtnicité)
- exposition (intervention, usage tabac. caféine)
- cliniques (tension artérielle, IMC, grade du cancer, médicamentation concomitante)
- autres variables potentiellement associées au CRP (biomarqueurs)
- facteur de confusion connus (généralement associés au CRP)
comment appelle t-on l’évaluation au recrutement?
baseline
quelles sont les variables mesurées durant le suivi après la randomisation et le début des interventions?
- CRP
- variable d’exposition (intervention/traitement reçu)
- critères secondaires; variables sur lesquelles l’intervention pourrait avoir un impact
- variables d’innocuité (effets néfastes et indésirables des interventions)
- variables de mécanisme (taille tumeur d’un cancer, pharmaco dynamique, pharmaco cinétique)
- variable d’adhérence
- autres variables selon le contexte
est ce qu’une étude peut avoir plusieurs CRP?
oui, mais typiquement en bas de 3
pourquoi l’adhérence est une variable si importante?
-pour patient puisse bénéficier d’un traitement (si il est efficace), il doit avoir utiliser le traitement selon l’intention du protocole!
comment se mesure l’adhérence?
évaluation auto-rapportées par les patients (avez vous pris votre traitement?) et /ou par un comptage de pilules des fioles retournées
**ou autres méthodes
variables et la cédule de visite d’un ECR sont résumés à l’aide de…
MATRICE
estce qu’une évolution peut avoir plusieurs variables?
oui! démographique=âge, revenu, éducation, genre etc…
qu’est ce que le diagramme CONSORT?
*premier diagramme à produire lors de la présentation des résultats d’un ECR
*consolidated standards of reporting trials
=organisme faisant la promotion de la transparence dans la publication des résultats cliniques
que permet le diagramme CONSORT?
-identifier rapidement combien de participants/patients ont été approchés pour participer à l’étude, combien ont participé à l’étude, combien ont été perdus durant le suivi et combien ont été inclus dans l’analyse principale sur le CRP
qu’est ce qui est une très bonne indication de la qualité de l’étude?
les pertes au suivi
=plus il y a de perte et plus la validité interne de l’étude diminue/est affaiblie
donner un exemple d’étude considéré comme de qualité selon le diagramme CONSORT?
VIH
donner un exemple d’étude considéré comme de mauvaise qualité selon le diagramme CONSORT?
traitement de l’obésité de l’enfant
*près du quart des participants sont perdus au suivi et sont exclu de l’analyse principale sur le CRP (grand potentiel de biais introduit)
=validité interne de cette étude est relativement faible
donner les 2 principes pour l’analyse principale des résultats d’un ECR
- intention de traiter ITT (intention to treat)
- intention du protocole ITP (per protocol analysis)
est-ce que les deux analyses sont incluses dans les publications (ITT et ITP) ?
oui
d’ou provient l’analyse ITT?
besoin d’un encadrement formelles conditions d’exclusions dans l’analyse principale d’un ECR
quel est l’avantage de l’ITT?
ne permet AUCUNE exclusion de patients dans les analyses principales
=un patient recruté et randomisé est de facto inclus dans l’analyse principale
*préserve l’intégrité de la randomisation et donc de la protection contre les biais de confusion
*analyse le CRP selon la randomisation prévue à l’origine (pour décourager les abus au niveau de l’allocation des patients au traitement)
quels sont les désavantages de ITT?
- pas facile d’inclure tous les patients randomisés
- on doit avoir mesuré le CRP sur tous les patients randomisés
- dilue amplitude de la réponse en sous estimant le bénéfice et en surestimant l’innocuité = on permet le mITT (modified ITT permettant quelques exclusions très spécifiques; mais définie dans le PAS avant début de l’étude)
on confond ITT avec quoi?
avec une analyse avec toutes les données disponibles
analyse selon l’ITP a pour but d’inclure seulement quel patient?
le patient parfait; celui qui utilise le traitement tel que prescrit, vient à chacune des visites prescrites par le protocole et adhère à toutes les autres procédures de l’étude
(donc ceux qui sont le plus susceptibles de répondre au traitement)
on a des résultats plus favorables avec ITP ou ITT?
ITP
(mais de manière générale, les conclusions obtenues par les analyses selon ITT et ITP peuvent être similaires ou différentes)
côté négatif de ITP
expose l’étude au biais de confusion car plus il y a d’exclusions, plus on s’éloigne de la randomisation initiale et de la compatibilité des groupes
donner un exemple d’étude qui comporte 2 analyses, ITT et ITP
ECR SPORT
*comporte aussi 3 CRPS de nature continue (douleur, score fonctionnel et score de capacité)
=patients qui refusent de se faire randomiser sont inclus à part dans une étude observationnelle
ITT et ITP représente quoi dans l’étude?
- ITT=différence de moyenne entre les 2 interventions selon la randomisation initiale
- ITP=différences de moyennes selon l’intervention réellement reçue
en pratique, est-il facile de faire une analyse selon ITT?
NON!
beaucoup plus simple de faire une analyse selon ITP
quel analyse est moins suspeptible au biais?
ITT (meilleure analyse interne!)
qu’est ce que l’analyse descriptive?
donne un premier coup d’oeil sur les résultats d’un ECR
analyse descriptive utilise quoi?
tableaux, diagrammes, figures pour présenter un résumé des données
AD permet quoi?
- permet de décrire la population de participants recrutés pour l’étude
- permet d’entrevoir certains problèmes dans les données (données manquantes ou aberrantes) et/ou de comparatibilité entre les groupes
- fournit des estimations ponctuelles de la réponse à la question de recherche clinique
la première table d’un article présente quoi normalement?
statistiques descriptives des variables mesurées à la visite de recrutement (statistiques socio-démographiques et cliniques)
*car l’intérêt principal est de comparer les groupes; il est nécessaire de faire une présentation qui permet facilement cette comparaison n mettant les groupes côte à côte
estce qu’on doit inclure toutes les variables disponibles?
non pas en pratique, il y en beaucoup trop et espace limité dans les articles!
=on en inclut quelques unes (âge, genre etc..)
quelles variables devons-nous présentées?
-sociodémographique
-décrivent présentation clinique participants/patients
-modérément ou forment associés avec le CRP (connus de la littérature)
=on a besoin de ses variables pour déterminer le risque de biais de confusion
quel est le CRP de la recherche ECR VOICE?
infection au VIH
les études thérapeutiques vont inclure quelles types de variables?
beaucoup de variables cliniques!
qu’est ce que les données brutes?
les données sont vérifiées et validées à la fin de l’étude
donner un exemple de variable dérivée
IMC
car on doit calculer le poids divisé par la taille
**la plupart des analyses statistiques sont faites à partir de variables dérivées
but des AD
permettent de résumer l’information afin de faciliter l’interprétation et de faire émerger des tendances/associations
(résumé veut donc dire perte d’information)
quels sont les 2 groupes permettant de regrouper l’information d’une variable?
-Mesures de tendance centrale (ex : moyenne) et de dispersion (ex : étendue, écart-type, etc)
Typiquement, ces mesures sont tabulées dans des tables similaires à la Table 1 de l’ECR VOICE
-Distribution présentée à l’aide d’une figure (ex : histogramme).
**espace restreint dans les articles scientifiques ne permet pas l’ajout de distribution
estce qu’une table ou. figure peut avoir plusieurs dimensions?
OUI
dans ECR VOICE; 2 dimensions;
-variables au recrutement
-tabulées par groupe d’exposition
une AD univarié utilise combien de dimension?
1
- bivariée=2 dimensions
- mutlivariée=plusieurs dimensions
ajout de plusieurs dimensions permet quoi?
permet de déterminer les différences/tendances/association
comment mettre en relief les dimensions?
différentes façons! couleur, ligne, pointillé
plus il y a de dimensions et plus..
la table/figure est informative
qu’est ce que IQR?
intervalle interquartile
IQR=…
Q3-Q1
*la moitié des observations se retrouvent en très Q1 et Q3
estce que le diagramme en boite/diagramme de quartileinclut l’écart type?
NON
IQR et l’écart type sont des mesures de …
dispersion
quel dimension il est nécessaire d’ajouter dans un ECR?
les groupes d’interventions
peut ton représenter le diagramme en boite par groupe?
OUI
comment représenter la distribution de l’âge?
histogramme
comment présenter les groupes d’interventions?
histogramme en miroir
comment la distribution et les statistiques descriptives sont complémentaires?
L’histogramme est plus qualitatif mais plus informatif tandis que les statistiques descriptives sont quantitatives mais peuvent masquer des informations
importantes. (par exemple des “pics” dans la distribution du bio marqueur)
=importance de visualiser les données et d’aller au de la des statistiques descriptives
pourquoi les valeurs manquantes sont un problème important pour un ECR?
Pour une variable donnée, une valeur
manquante est une information inconnue à propos d’un participant, soit parce que la valeur n’a pas été mesurée
et/ou que le participant n’était pas présent lors de l’évaluation (il y a une multitude de raisons qui causent des
valeurs manquantes). Les valeurs manquantes sont particulièrement problématiques pour le CRP et l’exposition
: plus il y a de valeurs manquantes, plus il y a un risque d’introduire des biais de confusion. La quantité de
valeurs manquantes est également un indicateur de qualité de l’exécution de l’étude.
la nature de la variable détermine…
les statistiques descriptives qui pourront être utilisées
une proportion peut avoir des variables…
dichotomique
catégorique
ordinale
continue
un centile peut avoir des variables..
ordinale
continue
un IQR peut avoir des variables…
ordinale
continue
une moyenne peut avoir des variables…
continue
un écart type peut avoir des variables…
continue
un diagramme en boite peut avoir des variables…
ordinale
continue
un histogramme peut avoir des variables..
ordinale
continue
par rapport a une variable ordinale, quand est-ce que les proportions ne seront pas utilisées?
si la variable ordinale a beaucoup de valeurs possibles
les centiles (dont la médiane), le diagramme en boite et l’histogramme ne sont pas utilisés si…?
si la variable ordinale a PEU de valeurs possibles
nommer les mesures de dispersion
IQR et écart type
nommer les mesures de tendance centrale
médiane et la moyenne
qu’est ce qu’un centile?
valeurs qui divisent les observations en 100 parts égales
=correspond à la proportion des valeurs inférieures ou égales à un valeur déterminée
par la méthode des centiles; Q2 représente quoi?
le 50e centile
par la méthode des centiles; Q1 représente quoi?
25e centile
par la méthode des centiles; Q3 représente quoi?
75e centile
IQR représente quoi alors?
intervalle entre Q1 et Q3 donc= 50% des patients auront des valeurs dans cet intervalle
qui est plus robuste, la moyenne ou la médiane?
la médiane; elle est moins sensible aux valeurs extrêmes et aux distributions asymétriques
qu’est ce qu’une distribution symétrique?
distribution miroir par rapport à sa moyenne, sinon elle est asymétrique
*la médiane, le mode et la moyenne vont être égale dans une distribution UNIMODALE!!! attention si bimodale on a 2 modes, 1 moyenne et 1 médiane (médiane et moyenne sont des valeurs uniques!)
comment s’observe la distribution observée d’une variable?
avec l’histogramme
*distribution observée=histogramme
est ce qu’un histogramme est symétrique?
non rarement
nommer une distribution symétrique
la loi normale
*les statisticiens utilisent des formules mathématiques pour décrire des distributions théoriques (des lois)
des valeurs observées d’une distribution théorique forment quoi?
une distribution MAIS cette distribution observée n’est pas nécessairement symétrique même si les valeurs proviennent d’une loi symétrique
qu’est ce que le mode?
la valeur la plus fréquente dans une distribution
estce qu’il peut y avoir plus d’un mode dans une distribution?
oui
quel est le rôle du mode?
décrire de faon qualitative une distribution observée
qu’est ce qu’une distribution multi modale?
distribution possède plusieurs bosses (modes)
qu’est ce qu’une distribution unimodale?
distribution avec seulement une bosse prédominante
qu’est ce que la moyenne arithmétique?
somme de toutes les valeurs non manquantes divisée par le nombre de participants avec des valeurs non manquantes
comment calculer la médiane avec un nombre de valeurs pairs?
- calculer la moyenne entre les 2 valeurs du milieu
- moyenne géométrique
qu’est ce que l’écart type?
mesure d’écart moyen par rapport à la moyenne
*concentration des valeurs autour de la moyenne
qu’est ce que la variance?
le carré de l’écart type
on utilise quel type d’écart type?
écarts quadratiques car la somme des écarts moyens donne toujours O
but d’un écart type
central pour déterminer l’erreur aléatoire et la précision de la réponse à la question clinique
pourquoi on divise la somme des écarts quadratiques par N-1 et non par N?
*si on diviserait par N on obtiendrait un écart moyen=mais à tendance à sous estimer l’écart type qui a été utilisé pour générer les données
*en divisant par N-1 on corrige la sous estimation
=si N est grand ne fait pas trop de différence par contre si N est petit la différence est plus importante
quelle est la différence entre l’écart type et l’erreur type?
- ecart type est une mesure de dispersion associée à la distribution d’une variable dans une population
- erreur type (erreur standard); mesure de dispersion d’une statistiques obtenue sur un échantillon de la population
le concept d’écart type s’étend à quoi?…
aux variables dichotomique (calcul en fonction de la proportion)
quand l’écart type est a son maximum? nul?
- max si p=0.5
- zero si p=1 ou p=0
quelles variables sont difficiles à décrire?
variables avec des temps d’incidence
*on utilise les centiles pour les décrire
quelles courbes sont les plus utilisées pour décrire les variables sur des temps d’incidence?
Kaplan Meier
comment présenter les variables de nature dichotomique ou catégorique (ou même ordinale)?
tableau de contingence
dans un tableau de contingence 2x2, comment s’appelle la colonne total?
la distribution marginale (ou marge)
=donne la distribution du CRP indépendante des groupes et la distribution des groupes indépendantes du CRP
si dans un tableau de contingence on observe 2 traitements équivalents et donnent des résultats identiques?
la proportion observée dans une cellule sera identique aux produits des marginales
*P( A et B)=P(A) P (B)
=si différent; veut dire que le CRP ne semble pas indépendant entre les 2 groupes (différence pourrait être causée par l’erreur aléatoire et ou la présence de biais)
qu’est ce que le concept d’indépendance?
*manière d’exprimer la différence entre 2 traitements
=indépendance entre le CRP et les groupes s’il n’y a pas de différence entre les traitements
que donne la dépendance?
va créer une association au sens ou connaitre le groupe donne une certaine information sur le CRP
*association=dépendance
la proportion d’une variable de nature dichotomique est une mesure de tendance centrale si…
on utilise des valeurs binaires pour représenter les catégories; 0 ou 1 pour chacune des catégories
=on peut aussi faire l’inverse selon la proportion qui nous intéresse! donc on calcule le complément; proportion des échecs=1-proportion des succès
comment on organise un tableau de contingence?
généralisables par rangé x colonne pour accommoder les CRP de nature catégorique et/ou plusieurs groupes d’expositions
est ce que les temps d’incidence (ou autrefois durée de survie) peut être utilisée pour autre chose que le décès?
OUI
infection VIH, rémission du cancer, accident cardiovasculaire etc…
quelles sont les difficultés avec les données de type temps d’incidence?
-partiellement observées
estce que le recrutement dans un ECR se fait au même moment pour tout le monde?
NON
échelonnée dans le temps car il n’est pas possible de recruter tous les participants le jour ou débute l’étude
comment calculer l’incidence?
divisant le nombre d’infections par le nombre de mois de suivi
comment décrire le suivi des participants?
avec 2 échelles temporelles; temps calendrier (ou tous les patients commence au moment de leur recrutement) et le temps depuis le début de l’étude (ou tous les patients commencent au même point)
est-ce que si la moyenne ne fait pas de sens pour des données incomplètes il en est de même pour les autres mesures résumées? (écart type, histogramme, diagramme en boite)
OUI
la courbe KM commence toujours à…
100% ou à 0%
*car les études d’incidence recrutent toujours des participants/patients qui n’ont pas encore éprouvé l’évènement (décès, infection au VIH) mais qui sont à risque durant le suivi
(commence à 0 si on montre la probabilité de décès et à 1 si on montre le risque de ne pas être infecté)
qu’indique l’axe des x et l’axe des y de la courbe KM?
x=échelle de temps
y=probabilité de non infection
qu’est ce qui est typique d’une courbe KM?
forme en escalier
*les marches deviennent moins perceptibles plus le nombre de patients et de cas incidents sont importants
qu’est ce qui crée une marche?
si un premier patient est infecté
=créer une marche!
*une marche à chaque cas d’infection!
que peut on déduire à partir de la courbe KM?
des centiles ou même le temps médiane d’infection (point sur l’axe des X qui correspond à une probabilité de 50%)
dans quel contexte sont très utilisés les courbes de KM?
pour comparer l’incidence pour deux groupes ou plus
à quel moment la courbe KM peut atteindre 0?
si tous les patients sont morts!
pourquoi porter attention au croisement de ces courbes et au bénéfice à court et à long terme?
- car un traitement peut avoir un effet immédiat de courte durée qui se fait rattraper par l’autre traitement plus tard
- certaines analyses ne sont pas appropriées lorsque les courbes se croisent!