9 - Analyse statistique Flashcards

1
Q

6 éléments à prendre en compte dans le choix du test statistique

A
  1. Type de variable étudiée (qualitative, quantitative, censurée,…)
  2. Distribution de la variable
  3. Type d’expérience
  4. Conditions d’application
  5. Logiciels utilisés: reconnus (SAS-SPSS-EPI info) ou non
  6. Références bibliographiques: indispensables pour justifier l’utilisation de tests peu courants
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

2 types de distributions de la variable + type de test applicable

A
  • normale = tests paramétriques
  • non normale = tests non paramétriques
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

condition d’application du Chi-2

A

effectifs théoriques n > 5

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

condition d’application du T de Student ou l’ANOVA (analysis of variance)

A

effectifs théoriques n > 30 ou distribution normale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Situations de multiplicité de tests au cours d’un essai thérapeutique : (4)

A
  • multiplicité des tests du fait du nombre de critères d’évaluation (critère principal et critères secondaires)
  • multiplicité des tests sur différents sous-groupes
  • multiplicité des tests du fait du nombre de groupes de traitement évalués (2 bras de traitement)
  • multiplicité des tests du fait de la réalisation d’analyses intermédiaires
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Plan de l’analyse statistique (toujours le même en LCA)

A

1ère étape = analyse descriptive

2ème étape = analyse univariée

3ème étape (optionnelle) = analyse multivariée

Ces niveaux d’analyse diffèrent en fonction du type de variable.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Définition d’analyse descriptive ?

A

1ère étape

description brute des variables étudiées

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Définition d’analyse univariée

A

2ème étape

comparaison des deux analyses descriptives pour étudier l’association entre une variable (FDR facteur pronostique, nouveau traitement) et un critère de jugement

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Définition d’analyse multivariée

A

3ème étape (optionnelle)

évaluation de l’association entre plusieurs variables simultanément et un critère de jugement afin de tenter de controler des facteurs de confusion potentiels

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

3 types de variables (bien les distinguer pour l’ECN)

A

Variables QUALITATIVES (ou catégorielles)

Variables QUANTITATIVES

Variables CENSURÉES

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Définition de variables qualitatives

A

variable qui n’est pas naturellement essociée à une valeur numérique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

3 types de variables qualitatives

A

Ordinales -> catégories ordonnées (ex : stade de gravité = 1? 2 ou 3)

Nominales -> catégories non ordonnées (ex:groupe sanguin ABO, sexe F ou M…)

Dichotomiques (cas particulier d’un variable ordinale ou nominale) -> uniquement 2 catégories possibles (ex: sexe M ou F, malade ou non malade)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Définition de variables quantitatives

A

mesure d’une quantité prenant des valeurs numériques avec une signification concrète

l’écart entre deux valeurs et le calcul d’une moyenne ont un sens

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

2 types de variables quantitatives

A

Discrètes -> nombre fini et dénombré de valeurs possibles - distinctes sans valeur intermédiaire possible

Ex : nombre d’événement, nombre d’enfant

Continues -> nombre infini et non dénombrable de valeurs possibles - valeurs intermédiaires possibles entre deux écarts

Ex : poids, dosage biologique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Distinction entre variable quantitative discrète et variable qualitative ordinale

A

quantitative discrète = s’il s’agit de la mesure mise en classes d’une caractéristique des sujets (âge en années, poids en kg sans décimales)

qualitative ordinale = si les écarts entre deux catégories ne peuvent pas être comparés

les 2 dénominations possibles = s’il s’agit du nombre de malades dans un échantillon limité par la taille de l’échantillon

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Définition de variables censurées

A

suivi d’un groupe de patients sur une période donnée en recherchant comme critère de jugement la survenue d’un évènement binaire jusqu’à une date de point (date de fin de l’étude).

Après date de point, données sont dites censurées (on arrête de relever la survenue de l’évènement binaire chez les patients)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Tests adaptés si variable qualitative :

A
  • Si distribution normale = Soit Chi-2 (ac Nemar si apparié) soit test de Fisher
  • Si distribution anorale : Soit Chi-2 (ac Nemar si apparié) soit test de Fisher
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Test adapté si la variable quantitative pour une distribution normale ou une distribution non-normale

A
  1. Distribution normale :
    • si 2 groupes : T de Student
    • si > 2 groupes : ANOVA
  2. Distribution non normale :
    • si 2 groupes : Mann Whitney
    • si > 2 groupes : Kruskal Wallis
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Test adapté si la données appariées pour une distribution normale ou une distribution non-normale

A
  1. Distribution normale :
    • si 2 groupes : T apparié
    • si > 2 groupes : ANOVA mesures répétées
  2. Distribution non normale :
    • si 2 groupes : Wilcoxon
    • si > 2 groupes : Friedman
20
Q

Test adapté si la association entre 2 variables pour une distribution normale ou une distribution non-normale

A
  1. Distribution normale :
    • Régression linéaire
    • Coefficient de corrélation (Pearson)
  2. Distribution non normale :
    • Coefficient de corrélation (Spearman)
21
Q

Test adapté si la courbes de survie (données censurées) pour une distribution normale ou une distribution non-normale

A
  1. Distribution normale :
    • Courbe de Kaplan-Meier = pour estimation de la probabilité de survie
    • Test du Log-Rank = pour comparaison de 2 courbes de survie
    • Modèle de Cox = pour analyse multivariée (ajustement sur de potentiels facteurs de confusion)
  2. Distribution non normale : idem !!
22
Q

A lire: pièges sur les variables auxquels faire attention

A

Ne pas confondre “variable qualitative” (ex: décès) et “expresison quantitative de cette variable” (pourcentages)

Variable binaire = cas particulier de variable qualitative

Le fait que la variable ait une distribution normale ou non sera précisé dans l’énoncé du QCM

Par convention, il faut toujours un seul test statistique sur le critère de jugement principal

23
Q

Définition de test bilatéral

A

test statistique qui permet d’explorer 2 seuils: très utile si on ignore si le traitement A est supérieur ou inférieur au traitement B: traitement A peut être meilleur, égal, ou moins bon que le B (essai thérapeutique de supériorité)

On peut donc avoir:

  • A < B
  • A = B ou
  • A > B
24
Q

Définition de test unilatéral

A

Test statistique pour lequel on part du principe que la différence que l’on cherche à démontrer a un sens connu (essai thérapeutique de non-infériorité ou essai de supériorité)

Le nouveau traitement A est forcément meilleur ou égal à l’ancien traitement B

On peut donc avoir:

  • A > B ou
  • A = B
25
Q

Que veut-on mettre en évidence dans une étude de supériorité si le test statistique est unilatéral ?

A

mettre en évidence une différence d’efficacité dont le sens est connu “A > B”

26
Q

Que veut-on mettre en évidence dans une étude de supériorité si le test statistique est bilatéral ?

A

mettre en évidence une différence d’efficacité dont le sens n’est pas connu

A > B ou B > A

27
Q

Résumé des différents cas de figure de comparaison possibles rencontrés en étude thérapeutique (4)

A

hypothèse de recherche vise à montrer que:

  • soit l’un des 2 interventions est meilleure que l’autre (hypothèse de supériorité bilatérale)
  • soit l’intervention A est meilleure que le comparateur B (hypothèse de supériorité unilatérale)
  • soit l’intervention testée est au moins aussi performante que le comparateur (hypothèse de non-infériorité)
  • soit les deux interventions sont aussi performantes (hypothèse d’équivalence)
28
Q

Quand choisir un test unilatéral ou bilatéral ?

A

défini a priori dans le protocole

Si unilatéral: doit être justifié à priori:

  • ne faire de test unilatéral que si le sens de la différence attendue ne fait aucun doute et repose sur des données indiscutables de la littérature
  • Correspond aux essais de non-infériorité
29
Q

Piège ECNi :

Un test bilatéral non significatif peut donner un test significatif en unilatéral ?

A

=> Vrai : car la puissance nécessair epour un test unilatéral est moindre

30
Q

2 intérêts d’utiliser un test unilatéral ?

A

Soit augmenter la puissance car le degré de significativité p d’un test unilatéral est égal à la moitié du p d’un test bilatéral (PCZ)

Soit diminuer le nombre de sujets à inclure (pour une même puissance) mais attention: NSN d’une étude de non-infériorité >> NSN d’une étude de supériorité >> NSN d’une étude d’équivalence

-> car calcul NSN doit aussi tenir compte du territoire des hypothèses explorées par l’étude et pas seulement du type de test réalisé

31
Q

Définition des perdus de vue ?

A

Patient inclus pour lequel le résultat du critère de jugement principal n’est pas disponible

problème = on ne sait pas si le patient est guéri, ou si il a eu une complication grave qui l’empêche de revenir et donc pourquoi il n’est pas revenu

Surtout, on ne sait pas si la cause de la perte de vue est en lien ou non avec le traitement (importance pour les auteurs de préciser dans l’article de manière exhaustive les raisons des perdus de vue)

A savoir dans les études de non-infériorité: l’analyse est faite en ITT et en per-protocole

32
Q

Quelles sont les 5 caractéristiques de la proporitions des perdus de vue ?

A

Quantifiée (nb de perdus de vue)

Faible < 10%

Equilibrée entre les groupes (sinon craindre un biais de classement par défaut du double aveugle)

Etudée = le fait d’être perdu de vue est-il lié au critère de jugement principal ou au facteur étudié ? (recherche des causes des perdus de vue)

Représentée sur un diagramme de flux

33
Q

Quels sont les 2 risques liés aux perdus de vue ?

A
  • Biais de sélection des perdus de vue: échantillon non représentatif de la population cible
  • Biais d’attrition: perte de comparabilité des groupes (qui est aussi un biais de sélection)
34
Q

Définition de l’analyse multivariée pour ajustement ? + interets

A

Analyse de l’effet d’une variable en tenant compte de l’effet de covariables (facteurs de confusion potentiels):

si essais thérapeutiques: permet l’ajustement sur des facteurs de confusion potentiels (âge - comorbidités,…)

si études épidémiologiques: permet d’expliquer une variable en fonction de covariables dites “explicatives” (facteurs de confusion potentiels)

35
Q

Tableau synthèse des analyses descriptive, univariée et multivariée

A

Si courbes de survie :

  1. Analyse descriptive = Courbe de survie Kaplan Meier
  2. Analayse univariée = Test du Log Rank
  3. Analyse multivariée = Modèle de Cox

Si variable qualitative :

  1. Analyse descriptive = Pourcentage
  2. Analayse univariée = Test du Chi2
  3. Analyse multivariée = Régression logistique

Si variable quantitative :

  1. Analyse descriptive = Moyenne
  2. Analayse univariée = T-student
  3. Analyse multivariée = Régressin linéaire multiple

Le modèle de régression logistique est surtout utilisé quand le délai de survenue de la maladie est court ou lorsque l’ensemble de la cohorte a pu être suivie jusqu’à la fin

36
Q

Quel type de courbe étudie les données censurées ?

A

Courbe de survie

37
Q

Définition d’une variable censurée ?

A

suivi d’un groupe de patients sur une période donnée en recherchant comme critère de jugement la survenue d’un évènement binaire (mort/pas mort ou complciation/pas complication…) jusqu’à une date de point (date de fin de l’étude)

Après cette date de point, les données sont dites censurées (on arrête de relever la survenue del’évènement binaire chez les patients)

Notion de durée de participation sur variable censurée: calculer la durée de participation pour chaque patient de l”étude

38
Q

Quels sont les 4 cas de figure dans le calcul de la durée de participation pour chaque patient de l’étude ?

A

Si patient décédé avant la date de point = différence entre la date de décès et la date d’entrée dans l’étude

Si patient perdu de vue = différence entre la date du dernier contact et la date d’entrée dans l’étude

Si patient présente l’évènement binaire = différence entre la date de survenue de l’évènement et la date d’entrée dans l’étude

Si patient n’a pas présenté l’évènement binaire à la date de point = différence entre la date de point et la date d’entrée dans l’étude

-> schéma explicatif page 57

39
Q

Quels sont les 2 types d’études qui utilisent les courbes de survie ?

A
  • essais thérapeutiques
  • cohortes prospectives
40
Q

Interprétation graphique d’un Log-Rank comparant deux courbes de survie des deux groupes:

Comment interpréter si les deux courbes de survie sont décalées initialement puis restent écartées de manière parallèle comme sur la figure ?

A

Il y a eu une différence au tout début de l’étude entre les deux groupes = avantage probable en phase précoce/aigue

puis la différence entre les deux groupes est restée constanta au cours du temps, sgnifiant donc que le médicament testé n’a pas continué à faire une différence significative entre les groupes

conclusion: avantage initial du traitement mais plus aucun effet supplémentaire au traitement controle ensuite

41
Q

<u>Interprétation graphique d'un Log-Rank comparant deux courbes de survie des deux groupes:</u>

Comment interpréter si les deux courbes de survie sont décalées initialement puis que l’écart entre les courbes ne cesse d’augmenter comme sur la figure ?

A

Il y a eu une différence au tout début de l’étude entre les deux groupes

puis la différence a continué à exister entre les deux groupes tout au long de l’étude avec un écart entre les groupes qui n’a de cese de se creuser

Conclusion: différence significative entre les deux groupes avec un effet sur tout la durée de l’étude (situation idéale attendue par les auteurs !)

42
Q

Notions clés cochables en QCM traitant de l’interprétation d’une courbe de survie

A
  • Etude de données censurées
  • Date d’origine (ex: date de diagnostic)
  • Evènement BINAIRE attendu précis
  • probabilité de survenue de l’évènement binaire au cours du temps
  • Délai de survenue de l’évènement par rapport à la date d’origine
  • Date de point = date à laquelle il y a censure des sujets perdus de vue ou sans évènement
  • Médiane de survie: durée au bout de laquelle la moiti du groupe a présenté l’évènement binaire attendu (décès)
  • Test du Log-Rank significatif si p< 0,05
  • Effectifs de sujets à risque d’évènement en fonction du temps
43
Q

Définition de coefficient de corrélation ?

A

formule mathématique permettant la mesure de l‘intensité de la liaison entre deux variables

valeur comprise entre -1 et 1

44
Q

signification d’un coefficient de corrélation = 1; -1; 0; ≥ 0,7 ?

A

coefficient de corrélation = 1 : corrélation parfaite entre es 2 variables

coefficient de corrélation = -1: corrélation inverse parfaite entre es 2 variables

coefficient de corrélation = 0: absence totale de corrélation entre les 2 variables

coefficient de corrélation ≥ 0,7: corrélation correcte entre les 2 variables

45
Q

définition d’analyse de sensibilité (sensitivity analysis) ?

Quel est son intêret ?

A

analyse réalisée pour évaluer la sensibiltié des résultats d’une étude à des changements dans la façon dont cela a été fait (autrement dit, quels résultats aurait-on obtenu en refaisant l’étude de telle ou telle façon)

intêrets: évaluer la robustesse des résultats par raport à des décisions incertaines ou des hypothèses qui ont été faites sur les données et les méthodes utilisées

46
Q

Comment réaliser en pratique une analyse de sensibilité ?

A

analyses toujours faites après l’analyse principale

on refait tout ou partie de l’analyse statistique en modifiant certains points de la méthode (modifie définition du critère de jugement principal, on utilise un autre modèle statistique) et on évalue si les résultats sont modifiés ou non par cette manoeuvre

moins on arrive à faire varier les résultats et plus ces résultats sont dits robustes

47
Q

Définition de test de permutation ?

A

Test statistique que les auteurs utilisent lorsque les critères d’application des tests statistiques standard ne sont pas correctement remplis