MODULE 4 Flashcards

1
Q

Qu’est-ce qu’un plan d’analyse statistique (PAS)?

A

-document qui définit les principales analyses statistiques
-obligatoire dans une demande de subvention et dans le protocole de l’étude
-assure une certaine objectivité dans l’analyse et prévient la subjectivité dans le choix des analyses et dans l’impact de ce choix sur les résultats
-généralement écrit et défini avant l’exécution de l’étude et donc avant d’avoir vu les résultats

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Donnez un exemple de multiplicité

A

L’association sur les temps d’attente à l’urgence et le risque d’une visite subséquente dans l’année suivante. Est-ce que les catégories d’exposition (temps d’attente) ont été établies a priori ou est-ce que plusieurs catégorisations ont été évaluées et on nous présente le billet gagnant dans l’article?

–> on peut tenir compte de cette multiplicité, mais elle doit être déclarée avant tout (dans le PAS)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Pour assurer l’objectivité des analyses lors de la publication d’un essai clinique, qu’est-ce qui est exigé?

A

Pour assurer l’objectivité des analyses (et restreindre le tripotage de données) lors de la publication des résultats d’un essai clinique, les revues avec un facteur d’impact élevé exigent une copie du PAS à la soumission de l’article ainsi que la date où il a été scellé/finalisé.

Ceci afin d’assurer que les analyses statistiques ont été réalisées de façon objective et qu’il n’y a pas eu de tripotage de données.

Dans un contexte d’homologation, les organismes réglementaires (ex : Santé Canada) exigent non seulement les PAS mais aussi des preuves qu’ils ont été scellés/finalisés avant le début de l’étude.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

VRAI OU FAUX : Le PAS doit OBLIGATOIREMENT être inclus au complet dans des articles et des demandes de subvention

A

FAUX

Le PAS est obligatoirement inclus dans la plupart des
articles et des demandes de subvention (quelques
lignes/paragraphes). L’espace étant limité, il n’est pas
possible d’inclure le PAS au complet. Les PAS des articles
se concentrent principalement sur l’analyse se
rapportant au CRP (qu’on appelle l’analyse principale).

Le PAS complet d’un protocole d’étude et/ou soumis dans un contexte d’homologation est beaucoup plus long (50-300 pages)

NEJM exigent une copie du PAS au complet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quelles sont les recommandations sur le contenu d’un PAS?

A

Section 1 : Détails administratifs (promoteur, chercheur principal, auteur du PAS, etc)
Section 2 : Résumé de l’étude et de la question de recherche
Section 3 : Design et méthodes de l’étude (randomisation, insu, etc)
Section 4 : Principes statistiques utilisés
Section 5 : Population de l’étude
Section 6 : Description des analyses statistiques prévues

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Est-ce que le PAS donne nous informe sur les résultats?

A

À noter que le PAS décrit les méthodes analytiques seulement et ne donne aucun résultat (car il est écrit avant le début de l’étude). C’est un plan d’architecte pour les analyses statistiques afin de répondre à la question de recherche et aux questions secondaires.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

VRAI OU FAUX : L’essai clinique typique va mesurer une seule variable par patient

A

FAUX
L’essai clinique typique va mesurer plusieurs centaines de variables (voir millier) par patient

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Définir “variable”

A

Une variable est une caractéristique socio-démographique ou clinique mesurée sur chaque participant/patient de l’étude.

Elle peut être mesurée qu’une seule fois durant l’étude car elle est constante (ex : homme/femme) ou à plusieurs reprises durant le suivi du patient afin de permettre de déterminer son évolution (ex : taux de cholestérol).

Le nom variable indique que la caractéristique varie entre les patients et/ou varie durant le suivi. C’est cette variation qui est au centre de l’erreur aléatoire.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Au recrutement avant la randomisation et le début des interventions, les variables mesurées lors des essais cliniques sont :

A

“Baseline”

Variables socio-démographiques
Ex : identifiant unique, genre, âge, éducation, ethnicité, région, site, etc.

Variables d’expositions
Ex : intervention, usage tabac, caféine, etc.

Variables cliniques
Ex : tension artérielle, IMC, grade du cancer, médicamentation concomitante, etc

Autres variables potentiellement associées au CRP
Ex : biomarqueurs Facteurs de confusion connus (variables généralement associées au CRP)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Durant le suivi après la randomisation et le début des interventions, les variables mesurées lors des essais cliniques sont selon la cédule de visite :

A

CRP : Une étude peut avoir plusieurs CRP mais typiquement ≤ 3.

Variable d’exposition (intervention/traitement reçu)

Critères secondaires : Ce sont des variables sur lesquelles l’intervention pourrait avoir un impact.

Variables d’innocuité
Ex : effets néfastes et indésirables des interventions.

Variables de mécanisme
Ex : taille de la tumeur d’un cancer, pharmaco-dynamique, pharmaco-cinétique, etc.

Variables d’adhérence
L’adhérence au traitement ou à une intervention est une variable importante dans un ECR. Afin qu’un participant/patient puisse bénéficier d’un traitement (si le traitement est efficace), il doit avoir utiliser le traitement selon l’intention du protocole. Certains patients seront non-adhérents ou que partiellement adhérents ce qui peut avoir une influence substantielle sur les résultats. Par exemple, l’innocuité d’un traitement expérimental peut sembler être excellente dans un ECR où la majorité des participants n’ont pas utilisé le traitement prescrit. L’adhérence se mesure soit par des évaluations auto-rapportées par les patients (ex : avez-vous pris votre traitement ?) et/ou par un comptage de pilules des fioles retournées. Il existe d’autres méthodes pour mesurer l’adhérence.

Autres variables selon le contexte

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quel est le premier diagramme à produire lors de la présentation des résultats d’un ECR?

A

Le diagramme CONSORT

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Qu’est-ce que le CONSORT?

A

CONsolidated Standards Of Reporting Trials

est un organisme qui fait la promotion de la transparence dans la publication des résultats des études cliniques. Cet organisme a établi plusieurs guides et recommandations qui sont entérinés par divers organismes réglementaires à travers le monde (Santé Canada, FDA, etc.) et par nombreuses revues médicales.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Que permet le diagramme CONSORT?

A

-permet d’identifier rapidement combien de participants/patients ont été approchés pour participer à l’étude

-combien ont participé à l’étude, combien ont été perdus durant le suivi

-combien ont été inclus dans l’analyse principale sur le CRP.

À noter que les pertes au suivi sont un très bon indicateur de la qualité d’une étude : plus il y a de pertes au suivi, plus la validité interne de l’étude est affaiblie. Le diagramme est relativement simple.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

L’analyse principale des résultats d’un ECR peut se faire selon 2 principes, lesquels

A

Intention de traiter ITT

Intention du protocole ITP

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Pourquoi a-t-on établi l’analyse ITT?

A

-Provient du besoin d’un encadrement formel des conditions d’exclusions dans l’analyse principale d’un ECR

-Plusieurs abus ont été observés (fausser/amplifier les résultats)

-L’ITT ne permet AUCUNE exclusion de patients dans les analyses principales : un patient recruté et randomisé est de facto inclus dans l’analyse principale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Nommez un avantage de l’ITT

A

Préserve l’intégrité de la randomisation et donc de la protection contre les biais de confusion

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Pourquoi dit-on que l’ITT n’est pas le “remède universel”?

A

-Ce n’est pas facile d’inclure tous les patients randomisés (pour ce, on doit avoir mesuré le CRP sur tous les patients randomisés)

-L’ITT ne permet pas de valeurs manquantes sur le CRP

-L’ITT va également plus loin en analysant le CRP selon la randomisation prévue à l’origine; ceci, dans le but de décourager les abus au niveau de l’allocation des patients au traitement

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Les opposants à l’ITT disent quoi? + Exemple

A

Ils disent que l’ITT dilue l’amplitude de la réponse en sous-estimant le bénéfice et en surestiment l’innocuité

Par exemple, les participants qui ne sont pas adhérents au traitement, pourquoi les garder dans l’analyse principale et ne pas les exclure? Puisque ces patients n’ont pas utilisé le traitement, ils ne peuvent pas en bénéficier s’il s’avère efficace. À l’extrême, on voit qu’aucun bénéfice ne peut être observé si aucun patient n’utilise le traitement; ceci, même si le traitement expérimental est réellement efficace. À l’inverse, l’innocuité du traitement sera similaire à celle du groupe placebo, si personne ne l’utilise. Donc, dilution à zéro du bénéfice et surestimation de l’innocuité

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Les mITT permettent quoi?

A

(Modified ITT)
Ces analyses permettent quelques exclusions très spécifiques

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Que permet l’analyse en ITP (intention du protocole)?

A

-Cette analyse va permettre d’exclure certaines conditions et types de patients de l’analyse principales

-Ces exclusions seront définies a priori dans le PAS avant le début de l’étude (ceci afin de prévenir les abus)

-Le but est d’inclure seulement le patient “parfait” : celui qui utilise le traitement tel que prescrit, vient à chacune des visites prescrites par le protocole, et adhère à toutes les autres procédures de l’étude

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

ITP expose l’étude à quel biais?

A

Typiquement, on s’attend à des résultats plus favorables que ceux obtenus sous l’ITT.

Par contre, l’ITP expose l’étude au biais de confusion, car plus il y a d’exclusions, plus on s’éloigne de la randomisation initiale et de la comparabilité des groupes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

VRAI OU FAUX : La validité interne de l’analyse selon l’ITT est supérieur à celle selon l’ITP

A

VRAI

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Que permet l’analyse descriptive?

A

-donne un premier coup d’oeil sur les résultats d’un ECR

-utilise des tableaux, des diagrammes et des figures pour présenter un résumé de données

-permet de décrire la population de participants recrutés pour l’étude

-permet d’entrevoir certains problèmes dans les données (données manquantes/aberrantes) et/ou de comparabilité entre les groupes

-fournit des estimations ponctuelles de la réponse à la question de recherche clinique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

La première table d’un article pour une analyse description présente généralement quoi?

A

Généralement, la première table d’un article présente les statistiques descriptives des variables mesurées à la visite de recrutement

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Dans l’analyse description, quelles sont les variables qui sont inclus?

A

-on n’inclut pas toutes les variables disponibles, car il y en a bcp trop et l’espace est limité dans les articles

-on doit inclure quelques variables socio-démographique (âge, genre, etc)

-les autres variables à inclure sont celles qui décrivent la présentation clinique des participants/patients et celles qui sont modérément ou fortement associées avec le CRP (connues de la littérature)

-ces dernières variables sont nécessaires afin de déterminer le risque de biais de confusion

26
Q

Donnez un exemple de variable dérivée

A

IMC

Il y aura une étape où les variables dérivées seront calculées. Ces variables s’ajouteront à la base de données de l’ECR. Un exemple d’une variable dérivée est l’indice de masse corporelle (IMC). L’IMC est calculé en divisant le poids (kg) par la taille (m) au carré. Un ECR qui mesure le poids et la taille doit calculer l’IMC ; une variable dérivée. La plupart des analyses statistiques seront faites à l’aide des variables dérivées.

27
Q

Il y a différentes façons de résumer l’information d’une variable mais principalement on peut les regrouper en 2 groupes comme suit :

A

-Mesures de tendance centrale (ex : moyenne) et de dispersion (ex : étendue, écart-type, etc)
Typiquement, ces mesures sont tabulées dans des tables similaires à la Table 1 de l’ECR VOICE

-Distribution présentée à l’aide d’une figure (ex : histogramme).

28
Q

L’ajout de plusieurs dimensions à une analyse permet quoi?

A

De déterminer les différences/tendances/associations

29
Q

Décrivez l’anatomie du diagramme en boîte

A

-IQR est l’intervalle interquartile (par exemple IQR = Q3-Q1 où la moitié des observations se trouvent entre Q1 et Q3)

-la ligne rouge au centre représente la médiane

-le diagramme en boîte n’inclut pas pas l’écart-type

-le diagramme en boîte est aussi connu sous le nom de diagramme de quartiles

-l’IQR et l’écart-type sont des mesures de dispersion

-on peut également présente le diagramme en boîte par groupe

30
Q

Un histogramme peut nous permettre de visualiser quoi?

A

-La distribution de l’âge
-on peut utiliser un histogramme en miroir pour présenter les histogrammes par groupe d’interventions

31
Q

Les histogrammes sont plus qualitatifs ou plus quantitatifs?

A

L’histogramme est plus qualitatif, mais plus informatif tandis que les statistiques descriptives sont quantitatives mais peuvent masquer des informations importantes

32
Q

Les valeurs manquantes sont problématiques pour quoi?

A

Les valeurs manquantes sont particulièrement problématiques pour le CRP et l’exposition : plus il y a de valeurs manquantes, plus il y a un risque d’introduire des biais. La quantité de valeurs manquantes est également un indicateur de qualité de l’exécution de l’étude

33
Q

La nature de la variable détermine les statistiques descriptives qui pourront être utilisées

Nommez quelle statistique peut être utilisée pour chacune des variables suivantes : dichotomique, catégorique, ordinale et continue

A

Proportion : dichotomique, catégorique, ordinale

Centile : ordinale et continue

Intervalle interquartile (IQR) : ordinale et continue

Moyenne : continue

Écart-type : continue

Diagramme en boîte : ordinale et continue

Histogramme : ordinale et continue

34
Q

Nommez 2 situations où une méthode statistique ne peut pas être utilisée pour la variable ordinale

A

Pour une variable ordinale avec beaucoup de valeurs possibles, les proportions ne seront pas utilisées. À l’inverse, les centiles (y compris la médiane) ne sont pas utilisés si la variable ordinale a peu de valeurs possibles. Idem pour le diagramme en boîte et l’histogramme

35
Q

L’IQR et l’écart-type sont des mesures de __________ tandis que la médiane et la moyenne sont des mesures de _______

A

L’IQR et l’écart-type sont des mesures de dispersion tandis que la médiane et la moyenne sont des mesures de tendance centrale.

36
Q

Définir les centiles

A

Les centiles correspondent à des valeurs qui divisent les observations en 100 parts égales

Le centile correspond à la proportion des valeurs inférieures ou égales à la valeur déterminée

37
Q

Donnez un exemple de centile

A

Par exemple, si un patient a une tension artérielle systolique de 135 mm Hg et que cette tension est supérieure ou égale à celle de 92 % des autres patients du groupe, cela le place dans le 92e centile.

La médiane (Q2) représente le 50e centile; le 1er quartile (Q1), le 25e centile; et le 3e quartile (Q3), le 75e centile.

L’IQR est l’intervalle entre Q1 et Q3 (IQR = Q3 - Q1); 50 % des patients auront des valeurs dans entre le 25e et 75e centile (ou entre Q1 et Q3), par définition.

38
Q

Pourquoi est-ce que la médiane est plus robuste que la moyenne?

A

Car elle est moins sensible aux valeurs extrêmes et aux distributions asymétriques

39
Q

Une distribution est symétrique si..

A

Elle est miroir par rapport à sa moyenne

40
Q

VRAI OU FAUX : En pratique, une distribution observée (un histogramme) est majoritairement symétrique

A

FAUX
En pratique, une distribution observée (un histogramme) est rarement purement symétrique. Les statisticiens utilisent des formules mathématiques pour décrire des distributions théoriques (des lois). Certaines de ces distributions sont symétriques (c’est le cas de la loi normale). Des valeurs observées d’une distribution théorique forment également une distribution mais cette distribution observée n’est pas nécessairement symétrique même si les valeurs proviennent d’une loi symétrique.

41
Q

Qu’est-ce que la distribution “mode”? + (multi-modale vs unimodale)

A

-le mode représente la valeur la plus fréquente dans une distribution

-il peut y avoir plus d’un mode dans une distribution

-en pratique, on utilise le mode pour décrire de façon qualitative une distribution observée

-une distribution multi-modale implique que la distribution possède plusieurs bosses et une distribution unimodale est une distribution avec seulement une bosse prédominante

42
Q

Quelle est la différence entre la moyenne et la médiane

A

La moyenne représente la moyenne arithmétique (somme de toutes les valeurs non-manquantes divisée par le nombre de participants avec des valeurs non manquantes)

La médiane est plus complexe à calculer (ainsi que les centiles) et il existe plusieurs façons de le faire. En fonction du nombre de participants, il n’est pas toujours possible de diviser le groupe en 2 parts égales (ou en 100 parts égales pour les centiles). Par exemple, si nous avons seulement 5 patients avec des tensions artérielles systoliques de 110, 125, 135, 140, et 165, la médiane est 135, la valeur au milieu. Par contre, si nous avons 6 patients avec les valeurs 110, 125, 131, 135, 140, et 165, il n’y a pas de point central. Une des méthodes est de faire la moyenne entre les 2 valeurs du milieu : 131 et 135. Ce qui donne une médiane de 133.

43
Q

Dans quel cas est-ce qu’une proportion est une moyenne?

A

À noter qu’une proportion est une moyenne si on code les données dichotomiques avec des 0 et 1 (ex : 0 = échec du traitement et 1 = succès du traitement).

44
Q

Qu’est-ce que l’écart-type?

A

L’écart-type est une mesure d’écart moyen par rapport à la moyenne. La concentration des valeurs autour de la moyenne. La formule de l’écart-type est :
=√1 N −1∑N i=1(xi − ¯x)2

où N est la taille d’échantillon, xi la valeur pour le patient i, et ¯x la moyenne. Le signe ∑ représente la somme sur tous les patients.

L’écart-type est une mesure de dispersion associée à la distribution d’une variable dans une population. On ne doit pas la confondre avec l’erreur-type qui est une mesure de dispersion d’une statistique (ex : la moyenne) obtenue sur un échantillon de la population.

45
Q

Pourquoi est-ce qu’on utilise les écarts quadratiques dans les écart-types?

A

À noter qu’on utilise les écarts quadratiques (carré de la différence entre (xi − ¯x)) car la somme des écarts moyens donne toujours 0.

46
Q

Le carré de l’écart-type s’appelle..

A

La variance

47
Q

Quelle est l’unité de l’écart-type?

A

L’écart-type hérite de l’unité de la variable (ex : mm Hg)

48
Q

Pourquoi est-ce que l’écart-type d’un CRP joue un rôle important?

A

L’écart-type (ou la variance) d’un CRP joue un rôle important car il est central pour déterminer l’erreur aléatoire et la précision de la réponse à la question de recherche clinique.

49
Q

Pourquoi la somme des écarts quadratiques est divisée par N-1 et non N ?

A

Pour obtenir un écart moyen, il faudrait diviser par N.

Par contre, on peut le démontrer mathématiquement (trop complexe pour ce cours) mais l’écart-type calculé avec N a tendance à sous-estimer l’écart-type qui a été utilisé pour générer les données.

En le divisant par N-1 au lieu de N, ceci corrige la sous-estimation.

En pratique, lorsque N est grand, ceci ne fait pas beaucoup de différences. La différence est plus substantielle lorsque N est petit.

50
Q

Lorsque l’écart-type s’étend aux variables de nature dichotomique, quel est le calcul?

A

Par contre, le calcul est beaucoup plus simple et il est en fonction de la proportion elle-même.

L’écart-type est : √ p(1 − p)

où p est la proportion observée dans un groupe de N patients.

Par exemple, si on observe 20% d’échec au traitement dans un groupe de 100 patients, l’écart-type est √0.2 × 0.8 = √0.16 = 0.40. À noter que l’écart-type est à son maximum lorsque p = 0.5. L’écart-type est zéro lorsque p = 0 ou p = 1 ;ce qui fait du sens car tous les patients ont échoué ou tous les patients ont été un succès : dans les deux cas il n’y a pas de variation entre les participants.

51
Q

Pourquoi est-ce que les variables avec des temps d’incidence sont-elles difficiles à décrire de façon descriptive?

A

Les variables avec des temps d’incidence sont difficiles à décrire de façon descriptive, principalement à cause de la censure (administrative), et ce, autant pour les mesures de tendance centrale que pour les mesures de dispersion (y compris les diagrammes en boîte et les histogrammes

52
Q

Quelles sont les courbes les plus souvent utilisées pour décrire les variables sur des temps d’incidence?

A

Les courbes de Kaplan-Meier

53
Q

Décrivez le tableau de contingence

A

-les cellules du tableau présentent les effectifs et les proportions entre parenthèses

-les proportions qui sont pertinentes sont les proportions selon la colonne (et non la rangée)

-la colonne “Totale” s’appelle la distribution marginale (marge). La marginale donne la distribution du CRP indépendante des groupes et la distribution des groupes indépendante du CRP

54
Q

Si les 2 traitements sont équivalents et donnent des résultats identiques, la proportion observée dans une cellule d’un tableau de contingence sera..

A

Identique aux produits des marginales

Ceci vient de la relation suivante : P (A et B) = P(A) P(B) si A et B sont 2 événements indépendants

55
Q

Il y a indépendance entre le CRP et les groupes si et seulement si..

A

Il n’y a pas de différences entre les traitements

56
Q

La dépendance entre le CRP et les groupes va créer quoi?

A

Une association au sens où connaître le groupe donne une certaine information sur le CRP.

Par exemple, un patient du groupe expérimental à plus de chance d’être dans la catégorie 1 qu’un patient du groupe placebo. On observe donc une association (une dépendance)

57
Q

Qu’est-ce que le rapport de cote (RC) ?

A

Certains chercheurs utilisent des mesures d’association pour décrire l’association entre l’exposition (les traitements) et le CRP. Une de ces mesures est le rapport de cote (RC).

Ce rapport est relativement
facile à calculer : c’est le produit croisé des effectifs des 4 cellules

La cote est une façon différente d’exprimer les chances qu’un événement se produise (similaire à une cote donnée à un cheval pour gagner une course).

La cote est définie p/(1 − p).

58
Q

Comment est-ce que le RC peut être 1, >1, <1?

A

Lorsque la différence de proportion entre les groupes est nulle, RC=1.

Plus la différence est importante, plus le RC est élevé > 1.

Le RC peut être < 1 si la différence est négative.

Le RC peut être grand même si la différence entre les proportions est relativement petite.

59
Q

VRAI OU FAUX : Dans un contexte d’un tableau de contingence et d’un ECR, les RCs sont moins informatifs que la différence de proportions

A

VRAI

60
Q

Qu’est-ce qu’une probabilité conditionnelle?

A

On cherche à calculer la probabilité d’un succès pour un patient randomisé au traitement expérimental pour l’exemple du tableau de contingence avec 200 patients. Cette probabilité est une probabilité conditionnelle : on cherche la probabilité de succès sous la condition que la patient est dans le groupe avec le traitement expérimental.

61
Q

Qu’est-ce qu’une durée de survie?

A

Les CRP utilisés dans les ECR sont souvent des temps d’incidence (durée de survie)

Le nom porte un peu à confusion, car il ne s’applique pas seulement à des CRP concernant le décès

La difficulté première avec ce type de données c’est qu’elles ne sont que partiellement observées