module 4 Flashcards

1
Q

Le plan d’analyse statistique (PAS) = ?

A

document qui définit les principales analyses statistiques.
Le PAS est obligatoire dans une demande de subvention et dans le protocole de l’étude.
Le PAS assure une certaine objectivité dans l’analyse et prévient la subjectivité dans le choix des analyses et dans l’impact de ce choix sur les résultats.
Le PAS est généralement écrit et défini avant l’exécution de l’étude et donc avant d’avoir vu les résultats.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

‘harking’ =?

A

tripotage des données et on constate une forte progression de ce problème dans la dernière décennie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

qu’est-ce que le problème de multiplicité?

A

tripotage des données pour faire en sorte qu’une certaine catégorisation de l’échantillon donne la CRP voulue par le chercheur –> donne des réponses d’analyses que le chercheur voulait comme conclusion (qui avantage son hypothèse)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Pour assurer l’objectivité des analyses (et restreindre le tripotage de données) lors de la publication des résultats d’un essai clinique, les revues avec un facteur d’impact élevé exigent ….

A

une copie du PAS à la soumission de l’article ainsi que la date où il a été scellé/finalisé. Ceci afin d’assurer que les analyses statistiques ont été réalisées de façon objective et qu’il n’y a pas eu de tripotage de données.

Dans un contexte d’homologation, les organismes réglementaires (ex : Santé Canada) exigent non seulement les PAS mais aussi des preuves qu’ils ont été scellés/finalisés avant le début de l’étude.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Les PAS des articles (publiés) se concentrent principalement sur…

A

l’analyse se rapportant
au CRP (qu’on appelle l’analyse principale)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Il existe sur le contenu d’un PAS, comprenant les 6 sections suivantes :

A

Section 1 : Détails administratifs (promoteur, chercheur principal, auteur du PAS, etc.) Section 2 : Résumé de l’étude et de la question de recherche
Section 3 : Design et méthodes de l’étude (randomisation, insu, etc.)
Section 4 : Principes statistiques utilisés
Section 5 : Population de l’étude
Section 6 : Description des analyses statistiques prévues

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

vrai ou faux. le PAS peut donner les résultats de l’ECR.

A

faux
À noter que le PAS décrit les méthodes analytiques seulement et ne donne aucun résultat (car il est écrit avant le début de l’étude). C’est un plan d’architecte pour les analyses statistiques afin de répondre à la question de recherche et aux questions secondaires.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

dans un essai clinique, quelle est la définition d’une variable?
+ types de variables et fréquence de la mesure

A

caractéristique socio-démographique ou clinique mesurée sur chaque participant/patient de l’étude.

peut être mesurée qu’une seule fois durant l’étude si elle est constante (ex : homme/femme) ou à plusieurs reprises durant le suivi du patient afin de permettre de déterminer son évolution (ex : taux de cholestérol)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

qu’est-ce qui est au centre de l’erreur aléatoire?

A

Le nom variable indique que la caractéristique varie entre les patients et/ou varie durant le suivi. C’est cette variation qui est au centre de l’erreur aléatoire.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Au recrutement avant la randomisation et le début des interventions, les variables mesurées lors des essais cliniques sont :

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

. Durant le suivi après la randomisation et le début des interventions, les variables mesurées lors des essais cliniques sont selon la cédule de visite :

A

CRP : Une étude peut avoir plusieurs CRP mais typiquement ≤ 3.

Variable d’exposition (intervention/traitement reçu)

Critères secondaires : Ce sont des variables sur lesquelles l’intervention pourrait avoir un impact.

Variables d’innocuité
Ex : effets néfastes et indésirables des interventions.

Variables de mécanisme
Ex : taille de la tumeur d’un cancer, pharmaco-dynamique, pharmaco-cinétique, etc.

Variables d’adhérence

Autres variables selon le contexte

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

qu’est-ce que la variable d’adhérience et comment se mesure-t-elle?

A

adhérence = le degré auquel le patient/participant à une étude suit le protocole à l’égard du traitement (peut créer des biais si ce n’est pas bien suivi)
Par exemple, l’innocuité d’un traitement expérimental peut sembler être excellente dans un ECR où la majorité des participants n’ont pas utilisé le traitement prescrit. L’adhérence se mesure soit par des évaluations auto-rapportées par les patients (ex : avez-vous pris votre traitement ?) et/ou par un comptage de pilules des fioles retournées. Il existe d’autres méthodes pour mesurer l’adhérence.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Les variables et la cédule de visite d’un ECR sont souvent résumées à l’aide d’..

A

une matrice.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qu’est-ce que le le diagramme CONSORT?

A

Le CONSORT (CONsolidated Standards Of Reporting Trials)
est un organisme qui fait la promotion de la transparence dans la publication des résultats des études cliniques. Cet organisme a établi plusieurs guides et recommandations qui sont entérinés par divers organismes réglementaires à travers le monde (Santé Canada, FDA, etc.) et par nombreuses revues médicales.

permet
d’identifier rapidement combien de participants/patients ont été approchés pour participer à l’étude, combien ont participé à l’étude, combien ont été perdus durant le suivi, et combien ont été inclus dans l’analyse principale sur le CRP.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

qu’Est-ce que le nombre de pertes (de participants) dans une étude nous indique sur l’étude?

A

les pertes au suivi sont un très bon indicateur de la qualité d’une étude : plus il y a de pertes au suivi, plus la validité interne de l’étude est affaiblie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

L’analyse principale des résultats d’un ECR peut se faire selon 2 principes :

A

Intention de traiter ITT (en anglais intention-to-treat analysis ou ITT)

Intention du protocole ITP de l’étude (en anglais per protocol analysis ou PPA)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

nécessité de l’analyse “Intention de traiter”? + ça fait quoi?

A

L’analyse ITT provient du besoin d’un encadrement formel des conditions d’exclusions dans l’analyse principale d’un ECR.

Clairement, on peut fausser ou amplifier les résultats en excluant les patients du groupe expérimental qui ne répondent pas bien au traitement et ceux du groupe placebo qui répondent bien au traitement. Plusieurs abus dans ce sens ont été observés dans le passé et ceci, dans certains cas, afin de faciliter l’homologation d’un nouveau médicament.

Afin de palier à ce problème, les organismes réglementaires ont exigé que les analyses principales soient exécutées sous ITT.

Bref, l’ITT ne permet aucune exclusion de patients dans les analyses principales : un patient recruté et randomisé est de facto inclus dans l’analyse principale. Un des avantages de l’ITT c’est qu’elle préserve l’intégrité de la randomisation et donc de la protection contre les biais de confusion.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

limites de l’ITT?

A

Premièrement, ce n’est pas facile d’inclure tous les patients randomisés. Pour ce, on doit avoir mesuré le CRP sur tous les patients randomisés.

L’ITT ne permet pas de valeurs manquantes sur le CRP. L’ITT va également plus loin en analysant le CRP selon la randomisation prévue à l’origine; ceci, dans le but de décourager les abus au niveau de l’allocation des patients au traitement.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

opinion des opposants sur l’ITT

A

Les opposants à l’ITT disent que l’ITT dilue l’amplitude de la réponse en sous-estimant le bénéfice et en surestimant l’innocuité. . Ce qui est vrai.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

nécessité de l’analyse “Intention du protocole”? + ça fait quoi?

A

L’analyse en ITP va permettre d’exclure certaines conditions et types de patients de l’analyse principale. Par contre, ces exclusions seront définies a priori dans le PAS avant le début de l’étude (ceci afin de prévenir les abus).

pour but d’inclure seulement le patient « parfait » : soit, celui qui utilise le traitement tel que prescrit, vient à chacune des visites prescrites par le protocole, et adhère à toutes les autres procédures de l’étude. En bout de ligne, ceux qui sont le plus susceptibles de répondre au traitement.

on s’attend à des résultats plus favorables que ceux obtenus sous l’ITT. Par contre, l’ITP expose l’étude au biais de confusion car plus il y a d’exclusions, plus on s’éloigne de la randomisation initiale et de la comparabilité des groupes (

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Analyse selon l’ITT est difficile à réaliser en pratique:

A

ne permet aucune exclusion des patients qui ont été randomisés, et ce, pour aucune raison. Ceci inclue les valeurs manquantes. Par exemple, un patient randomisé qui est absent lors de sa visite clinique pour mesurer son CRP. Ceci génère une valeur manquante du CRP pour ce patient. En pratique, ceci implique qu’il est très difficile de réaliser une analyse selon l’ITT au sens pur du terme. (parce que comment traiter si le patient vient même pas)

21
Q

pourquoi la validité de l’ITT est supérieur à celle de l’ITP?

A

l’analyse selon l’ITT est beaucoup moins susceptible aux biais que l’analyse selon l’ITP.

22
Q

utilité de l’analyse descriptive?

A

donne un premier coup d’œil sur les résultats d’un ECR.

utilise des tableaux, des diagrammes, et des figures pour présenter un résumé des données.

Elle permet de décrire la population de participants recrutés pour l’étude.

elle permet d’entrevoir certains problèmes dans les données (données manquantes/aberrantes) et/ou de comparabilité entre les groupes. Enfin, elle fournit des estimations ponctuelles de la réponse à la question de recherche clinique.

23
Q

quelles variables sont nécessairement présentes dans la première table d’un article sur un ECR?

A

Typiquement, on doit inclure quelques variables socio-démographiques (âge, genre, etc.).
Les autres variables à inclure sont celles qui décrivent la présentation clinique des participants/patients et celles qui sont modérément ou fortement associées avec le CRP (connues de la littérature). Ces dernières variables sont nécessaires afin de déterminer le risque de biais de confusion. L’analyse descriptive des autres variables (non incluses dans la Table 1) est effectuée mais exclue de la Table 1.

24
Q

données brutes = ?

A

les données sont vérifiées et validées À la fin de l’étude

25
Q

qu’est-ce qu’une variable dévirée?

A

la création d’une variable à partir de variables mesurées séparément (relation en 2 variables)

ex. L’IMC est calculé en divisant le poids (kg) par la taille (m) au carré. Un ECR qui mesure le poids et la taille doit calculer l’IMC ; une variable dérivée.

26
Q

Il y a différentes façons de résumer l’information d’une variable mais principalement on peut les regrouper en 2 groupes comme suit :

A

Mesures de tendance centrale (ex : moyenne) et de dispersion (ex : étendue, écart-type, etc) Typiquement, ces mesures sont tabulées dans des tables similaires à la Table 1 de l’ECR VOICE

Distribution présentée à l’aide d’une figure (ex : histogramme).

27
Q

vrai ou faux. il y a plus de perte d’information lorsqu’on examine la distribution d’une variable.

A

faux. Cette façon est plus visuelle et complémentaire. Il y a moins de perte d’information lorsqu’on examine la distribution d’une variable. Par contre, l’espace restreint dans les articles scientifiques ne permet pas l’ajout des distributions.

28
Q

utilité des dimensions dans les tables/figures?

A

Une table ou une figure peut avoir plusieurs dimensions. Par exemple, la Table 1 de l’ECR VOICE comporte 2 dimensions : variables au recrutement (1ère dimension) tabulées par groupe d’exposition (2e dimension). Une analyse descriptive univariée utilise une seule dimension, bivariée deux dimensions, et multivariée plusieurs dimensions. L’ajout de plusieurs dimensions permet de déterminer les différences/
tendances/associations.

De façon générale, une dimension est une variable. La variable groupe dans un ECR est une dimension qui prend 2 valeurs: expérimental ou placebo.

29
Q

L’IQR (l’intervalle interquartile) = ?

A

(IQR = Q3 - Q1); c’est- à-dire, la moitié des observations se trouvent entre Q1 et Q3. La ligne rouge au centre représente la médiane (Q2, le 2e quartile).

30
Q

utilité(s) de l’histogramme?

A

La distribution de l’âge peut être visualisée à l’aide d’un histogramme

On peut utiliser un histogramme en miroir pour présenter les histogrammes par groupe d’interventions

La distribution et les statistiques descriptives sont complémentaires. L’histogramme est plus qualitatif mais plus informatif tandis que les statistiques descriptives sont quantitatives mais peuvent masquer des informations importantes.

31
Q

vrai ou faux. les statistiques descriptives n’aident pas à détecter cette particularité dans la distribution du biomarqueur.

A

vrai

32
Q

Nombres de valeurs manquantes : une statistique importante:

A

Les valeurs manquantes sont un problème important pour un ECR. Pour une variable donnée, une valeur manquante est une information inconnue à propos d’un participant, soit parce que la valeur n’a pas été mesurée et/ou que le participant n’était pas présent lors de l’évaluation (il y a une multitude de raisons qui causent des valeurs manquantes). Les valeurs manquantes sont particulièrement problématiques pour le CRP et l’exposition : plus il y a de valeurs manquantes, plus il y a un risque d’introduire des biais. La quantité de valeurs manquantes est également un indicateur de qualité de l’exécution de l’étude.

33
Q

qu’est-ce qui détermine les stastistiques descriptives qui pourront être utilisées dans une analyse?

A

nature de la variable

34
Q

utilisation de la variable ordinale?

A

Pour une variable ordinale avec beaucoup de valeurs possibles, les proportions ne seront pas utilisées. À l’inverse, les centiles (y compris la médiane) ne sont pas utilisés si la variable ordinale a peu de valeurs possibles. Idem pour le diagramme en boîte et l’histogramme.

35
Q

types de mesure de l’IQR, écart-type, médiane et moyenne

A

L’IQR et l’écart-type sont des mesures de dispersion tandis que la médiane et la moyenne sont des mesures de tendance centrale.

36
Q

qu’est-ce que le centile (explication + description)?

A

centiles correspondent à des valeurs qui divisent les observations en 100 parts égales. Le centile correspond à la proportion des valeurs inférieures ou égales à une valeur déterminée.

Par exemple, si un patient a une tension artérielle systolique de 135 mm Hg et que cette tension est supérieure ou égale à celle de 92 % des autres patients du groupe, cela le place dans le 92e centile. La médiane (Q2) représente le 50e centile; le 1er quartile (Q1), le 25e centile; et le 3e quartile (Q3), le 75e centile. L’IQR est l’intervalle entre Q1 et Q3 (IQR = Q3 - Q1); 50 % des patients auront des valeurs dans entre le 25e et 75e centile (ou entre Q1 et Q3), par définition.

37
Q

distinction médiane vs. moyenne

A

La médiane est plus robuste que la moyenne car elle est moins sensible aux valeurs extrêmes et aux distributions asymétriques.

38
Q

distribution asymétrique vs. symétrique?
(présence en pratique)

A

Une distribution est symétrique si elle est miroir par rapport à sa moyenne (sinon elle est asymétrique). La distribution observée d’une variable se visionne avec l’histogramme. En pratique, une distribution observée (un histogramme) est rarement purement symétrique.

Les statisticiens utilisent des formules mathématiques pour décrire des distributions théoriques (des lois). Certaines de ces distributions sont symétriques (c’est le cas de la loi normale). Des valeurs observées d’une distribution théorique forment également une distribution mais cette distribution observée n’est pas nécessairement symétrique même si les valeurs proviennent d’une loi symétrique.

39
Q

qu’est-ce que le mode?

A

Le mode représente la valeur la plus fréquente dans une distribution. Il peut donc avoir plus d’un mode dans une distribution. En pratique, on utilise le mode pour décrire de façon qualitative une distribution observée. Une distribution multi-modale implique que la distribution possède plusieurs bosses. Une distribution unimodale est une distribution avec seulement une bosse prédominante.

40
Q

comment calcule t’on la moyenne et la médiane?
+ qu’est-ce qu’une proportion?

A
41
Q

qu’est-ce que l’écart type? + comment le calculer?

+ quelle autre variable découle de l’écart type

A

Le concept d’écart-type s’étend aux variables de nature dichotomique. Par contre, le calcul est beaucoup plus simple et il est en fonction de la proportion elle-même. L’écart-type est :

√[p(1-p)]

où p est la proportion observée dans un groupe de N patients.

l’écart-type est à son maximum lorsque p=0,5. L’écart-type est zéro lorsque p= 0 ou p= 1

ce qui fait du sens car tous les patients ont échoué ou tous les patients ont été un succès : dans les deux cas il n’y a pas de variation entre les participants.

42
Q

qu’est-ce que l’erreur type?

A

mesure de dispersion d’une statistique (ex : la moyenne) obtenue sur un échantillon de la population.

43
Q

quel type de tableau?
+ explication de la marginale

A

Tableau de contingence

La colonne ‘Total’ s’appelle la distribution marginale

La marginale donne la distribution du CRP indépendante des groupes et la distribution des groupes indépendante du CRP.

43
Q

utilité du concept d’indépendance?

A
44
Q

qu’est-ce que la cote?

A
45
Q

qu’est-ce que la durée de survie?

A

Les CRP utilisés dans les ECR sont souvent des temps d’incidence. Ce type de donnée s’appelle aussi durée de survie dans la littérature. Le nom porte un peu à confusion car il ne s’applique pas seulement à des CRP concernant le décès. À l’origine, les méthodes concernant les durées (temps d’incidence) s’appliquaient effectivement à la construction des tables de mortalité. Aujourd’hui, ces mêmes méthodes sont utilisées pour des incidences autre que le décès (ex : infection au VIH, rémission d’un cancer, accident cardiovasculaire, etc.).

La difficulté première avec ce type de données c’est qu’elles ne sont que partiellement observées. Il est donc difficile d’utiliser les méthodes décrites dans les sections précédentes.

46
Q

caractéristiques de la courbe de KM

A
47
Q

qu’Est-ce que le temps médian sur une courbe de Kaplan-Meier?

A

point sur l’Axe des X qui correspond à une probabilité de 50%

48
Q

mathématiquement, si y’a indépendance entre l’évènemenent A et B - on s’attend à quoi comme formule mathématique:

A
49
Q

comment sait-on si y’a dépendance?

A

Le produit des marginales P(A) * P(B) est différent de P(A et B), il y a donc une dépendance.

50
Q

La nature de la variable détermine les statistiques descriptives qui pourront être utilisées :
(tableau)

A