Statistiques PPN Flashcards
Définition d’une variable quantitative discrète
Variable qui peut prendre uniquement certaines valeurs dans un intervalle
(ex : résultat d’un lancer de dé)
Définition d’une variable quantitative continue
Variable qui inclut toute valeur possible dans un intervalle (ex : âge, poids, taille, TA)
Définition d’une variable qualitative (catégorielle)
Nombre fini de catégories ou de groupes distincts (ex : sexe, couleur des yeux)
Définition d’une variable indépendante
Paramètre qui varie sans être influencé par les autres paramètres (ex : temps)
Définition d’une variable dépendante
Paramètre qui est influencé par la variation de la variable indépendante (ex : nombre de rechutes en fonction du temps)
Définition d’une moyenne
Mesure de tendance centrale
Somme des valeurs divisée par le nombre de valeurs
*Influence des valeurs extrêmes (atténuée par grand nombre d’observations)
Définition d’un mode
Mesure de tendance centrale
Correspond à la valeur la plus fréquente d’un échantillon
*Si un seul mode : distribution unimodale
Définition d’une médiane
Mesure de tendance centrale
Valeur centrale d’un échantillon ordonné de la plus petite à la plus grande valeur
*Pas influencé par les valeurs extrêmes, on la préfère lorsque la distribution des valeurs est fortement asymétrique
Quelle est la meilleure mesure de tendance centrale si une distribution n’est pas biaisée (skewed)?
Moyenne
Quelle est la meilleure mesure de tendance centrale si une distribution est biaisée (skewed)?
Médiane
Vrai ou faux
Dans une distribution normalisée, la moyenne, le mode et la médiane sont les mêmes
Vrai
Définition de l’étendue
Mesure de dispersion
Différence entre la valeur la plus grande et la plus petite
*Ne subit l’influence que des valeurs extrêmes
Définition de la variance
Mesure de dispersion
Moyenne des déviations individuelles de la moyenne au carré (= écart-type au carré)
Définition de l’écart-type
Mesure de dispersion correspondant à la racine carrée de la variance
*Pas influencée par la taille de l’échantillon
Est-ce que l’écart-type est influencé par la taille de l’échantillon?
Non
Vrai ou faux
La moyenne n’est pas influencée par les valeurs extrêmes
Faux
Moyenne = influencée par les valeurs extrêmes, mais atténuée par un grand nombre d’observations
Médiane = pas influencée par les valeurs extrêmes
Quelle mesure de tendance centrale préfère-t-on utiliser lorsque la distribution des valeurs est fortement asymétrique?
Médiane
Vrai ou faux
Le mode est la valeur centrale d’un échantillon ordonné de la plus petite à la plus grande valeur
Faux
Mode = valeur la plus fréquente d’un échantillon
Médiane = valeur centrale d’un échantillon ordonné de la plus petite à la plus grande valeur
Vrai ou faux
L’étendue ne subit l’influence que des valeurs extrêmes
Vrai
Vrai ou faux
L’écart-type est la moyenne des déviations individuelles de la moyenne au carré
Faux
Variance = moyenne des déviations individuelles de la moyenne au carré (écart-type au carré)
Écart-type : racine carrée de la variance
Vrai ou faux
L’écart-type est influencée par la taille de l’échantillon
Faux
Pas influencée par la taille de l’échantillon
Dans une distribution normalisée, quel pourcentage de la distribution est inclus dans +/- 1 écart-type?
68,2%
Dans une distribution normalisée, quel pourcentage de la distribution est inclus dans +/- 2 écart-types?
95,4%
Dans une distribution normalisée, quel pourcentage de la distribution est inclus dans +/- 3 écart-types?
99,7%
Quelles sont les données probantes requises pour une recommandation de niveau 1? (2)
Méta-analyse avec IC étroit
Au moins 2 ECR avec échantillon adéquat, idéalement contre placebo
Quelles sont les données probantes requises pour une recommandation de niveau 2? (2)
Méta-analyse avec intervalle de confiance large
ECR
Quelles sont les données probantes requises pour une recommandation de niveau 3? (4)
ECR avec petit échantillon
Étude prospective non randomisée
Série de cas
Étude rétrospective de bonne qualité
Quelles sont les données probantes requises pour une recommandation de niveau 4? (2)
Opinion d’expert
Consensus
Quel est le niveau requis pour une recommandation de 1re ligne?
Niveau 1 ou 2 + appui clinique
Quel est le niveau requis pour une recommandation de 2e ligne?
Niveau 3 (ou mieux) + appui clinique
Quel est le niveau requis pour une recommandation de 3e ligne?
Niveau 4 (ou mieux) + appui clinique
Quel est le niveau requis pour une non-recommandation?
Niveau 1 ou 2 d’inefficacité
Vrai ou faux
Une recommandation de niveau 1 nécessite plus de 4 essais randomisés contrôlés contre placebo
Faux
Nécessite au moins 2 ECR avec échantillon adéquat, si possible contre placebo
Vrai ou faux
Un niveau 2 d’évidence nécessite une méta-analyse avec un intervalle de confiance étroit
Faux
Niveau 1 = méta-analyse avec IC étroit
Niveau 2 = méta-analyse avec IC large
Vrai ou faux
Un niveau 3 d’évidence nécessite une méta-analyse avec IC large
Faux
Pas de méta-analyse nécessaire
Peut être :
- ECR avec petit échantillon
- Étude prospective non randomisée
- Série de cas
- Étude rétrospective de bonne qualité
Vrai ou faux
Une recommandation de niveau 4 ne nécessite qu’un consensus d’experts
Vrai
Opinion d’expert ou consensus
Vrai ou faux
Des recommandations de 1e à 3e ligne nécessitent toujours un appui clinique
Vrai
1e ligne : niveau 1/2 + appui clinique
2e ligne : niveau 3 + appui clinique
3e ligne : niveau 4 + appui clinique
Expliquez l’hypothèse nulle
On essaie de réfuter ce qu’on pense faux : hypothèse nulle = H0.
Par exemple : si on croit que deux populations sont différentes sur un certain paramètre (la moyenne), l’hypothèse nulle sera que les deux moyennes sont égales. L’hypothèse nulle sera testée de manière statistique afin de décider si on la rejette (réfutation). Hypothèse alternative = H1.
Que signifie une valeur P < 0,05?
Signifie que ce résultat aurait pu être obtenu par chance seulement moins de 5x/100
Seuil habituellement requis pour réfuter l’hypothèse nulle
Définition d’une erreur de type I (alpha)
Rejet de l’hypothèse nulle alors qu’elle est vraie
Définition d’une erreur de type II (bêta)
Accepter l’hypothèse nulle alors qu’elle est fausse
Une erreur de validité interne serait causée par quel type d’erreur?
Erreur de type I (alpha)
Un manque de puissance occasionnerait une erreur de type I ou II ?
Type II (bêta)
Définition de la valeur P
Probabilité de commettre une erreur de type I (alpha)
Qu’est-ce que la fiabilité?
Consistance et reproductibilité des résultats obtenus
Qu’est-ce que la validité?
“Est-ce que les résultats obtenus mesurent ce que l’on voulait mesurer?”
Définition de la validité interne
Capacité d’une étude d’estimer correctement les mesures ou associations recherchées
*Le résultat reflète la “vraie valeur” = bonne méthodologie et puissance statistique
Comment améliorer la validité externe d’une étude?
Utiliser un devis pragmatique
Définition de la validité externe (3)
Capacité de généraliser un résultat obtenu dans le cadre d’une étude à la population cible
Juger de l’intérêt clinique d’un résultat (considérer coût du traitement, disponibilité)
Limitée par l’échantillonnage et les critères de sélection
Vrai ou faux
Une erreur de type I (alpha) signifie que l’hypothèse nulle est acceptée alors qu’elle est fausse
Faux
Erreur type I alpha : hypothèse nulle rejetée alors qu’elle est vraie
Erreur de type II bêta : hypothèse nulle est acceptée alors qu’elle est fausse
Vrai ou faux
Une erreur de type II bêta signe un manque de validité interne
Faux
Manque de puissance
L’erreur de type I (alpha) signe une erreur de validité interne
Vrai ou faux
La fiabilité correspond à la capacité d’obtenir des résultats qui mesurent ce que l’on voulait mesurer
Faux
Fiabilité = consistance et reproductibilité des résultats obtenus
Validité = “est-ce que les résultats obtenus mesurent ce que l’on voulait mesurer?”
Vrai ou faux
Le résultat de la validité interne reflète une bonne méthodologie et puissance statistique
Vrai
Quel est le devis à utiliser pour améliorer la validité externe d’une étude?
Devis pragmatique
Vrai ou faux
La validité externe est limitée par l’échantillonnage et les critères de sélection
Vrai
Vrai ou faux
La valitidé externe est la capacité d’une étude d’estimer correctement les mesures ou les associations recherchées
Faux
Validité externe = capacité de généraliser un résultat obtenu dans le cadre d’une étude à une population cible
Validité interne = capacité d’une étude d’estimer correctement les mesures ou les associations recherchées
À quoi sert le test t de Student ?
Tester l’hypothèse nulle que les moyennes de deux échantillons (de N < 30) composés de variables continues ne diffèrent pas significativement.
Donc, compare deux moyennes
À quoi sert l’analyse de variance (ANOVA, “F” test) ?
Même chose que test “t” de Student mais pour > 2 échantillons
Donc, compare plus de 2 moyennes
Distinguez un “one-tailed test” d’un “two-tailed test”
One-tailed test : pour tenter de réfuter l’hypothèse nulle seulement dans une direction (ex : “le traitement actif est meilleur que le placebo”)
Two-tailed test : pour tenter de réfuter l’hypothèse nulle dans les deux directions (ex : “le traitement actif est différent du placebo, soit meilleur soit moins bon”)
À quoi sert un Z test ?
Pour tester l’hypothèse nulle que les moyennes de 2 échantillons de N >30 composés de variables continues ne diffèrent pas significativement
(même chose que Student mais N > 30)
À quoi sert un Chi-carré ?
Évaluer la possibilité d’une association entre des échantillons de variables discrètes (ex : proportions, pourcentages) pour voir si elles sont indépendantes ou non.
Permet de comparer 2 proportions. On peut faire un tableau de fréquence.
À quoi sert un test de Pearson ? (2)
Test de corrélation linéaire entre des variables continues
Établit un coefficient de corrélation entre -1 (association inverse parfaite) et 1 (association directe parfaite)
À quoi sert une régression linéaire ?
Prédiction de résultats alors que la corrélation est démontrée
Pour des variables continues
À quoi sert une régression logistique multiple ?
Prédiction de résultats alors que la corrélation est démontrée
Pour des variables discrètes
Vrai ou faux
Un test “t” de Student teste l’hypothèse nulle que les moyennes de deux échantillons de N > 30 composés de variables discrètes ne diffèrent pas significativement
Faux
N < 30
Variables continues
Vrai ou faux
Un test d’analyse de variance ANOVA teste l’hypothèse nulle que les moyennes de plus de deux échantillons de ne diffèrent pas significativement
Vrai
> 2 échantillons
Vrai ou faux
Le two-tailed test permet de tenter de réfuter l’hypothèse nulle seulement que dans une direction (ex : que le traitement actif est meilleur que le placebo)
Faux
Two-tailed = dans les 2 directions (ex : tx actif différent du placebo, soit meilleur ou moins bon)
One-tailed = dans 1 direction (ex : tx actif est meilleur que le placebo)
Vrai ou faux
Le test “Z” diffère du test “t” de Student selon le fait que le test “Z” teste des échantillons de < 30 variables continues alors que le test “t” > 30
Faux
Contraire
t < 30 variables continues
Z > 30 variables continues
Vrai ou faux
Le test de Chi-carré évalue la possibilité d’une association entre des échantillons de variables continues
Faux
Variables discrètes
Vrai ou faux
Dans le test de Pearson testant la corrélation linéaire, une valeur de 0 exprime une association directe parfaite entre des variables continues
Faux
-1 = association inverse parfaite
0 = pas d’association
1 = association directe parfaite
Vrai ou faux
Le coefficient de corrélation d’un test de Pearson peut être de 3
Faux
Doit toujours être entre -1 et 1
Vrai ou faux
Un test de régression linéaire permet de prédire des résultats pour des variables discrètes
Faux
Pour des variables continues
Vrai ou faux
Un test de régression logistique multiple permet de prédire des résultats pour des variables discrètes
Vrai
Comment établir une causalité ? (8)
Force de l’association démontrée (haut degré de corrélation)
Consistance de l’association dans différentes études
Association temporelle
Cohérence avec les connaissances scientifiques contemporaines
Relation dose-réponse
Réversibilité
Spécificité
Élimination des autres explications
Nommez 4 tests statistiques non paramétriques
Wilcoxon signed rank test
Sign test
Wilcoxon rank sum test (ou Mann-Whitney test)
Spearman’s rank correlation test
Définition de la prévalence
Nombre de cas identifiés au cours d’une période de temps choisie
Divisé par
Nombre de personnes dans cette population au cours de cette période
Vrai ou faux
La prévalence à vie est intéressante pour les études de facteurs de risque
Vrai
Sert à savoir qui a réellement eu la maladie et qui ne l’a pas eue, alors que les prévalences plus brèves (sur 1 mois ou 1 an) peuvent rater des troubles psychiatriques étant donné leurs fréquentes rémission/récidive
Quels sont les biais des mesures de prévalence à vie? (3)
Biais de rappel
Effet de l’âge (plus vieux = plus de risque de l’avoir eue)
Effet de fatalité (si on en meurt, réduit le nombre de sujets qui en sont atteints actuellement)
Quelle est l’utilité des prévalences mensuelle et annuelle?
Plus valable que prévalence à vie pour l’organisation des soins psychiatriques (ex : donne un aperçu du nombre de cas qui peuvent être attendus dans la prochaine année)
Définition de l’incidence
Nombre de nouveaux cas au cours d’une période de temps choisie
Divisé par
Individus à risque au cours de cette même période
Vrai ou faux
La prévalence est proportionnelle à l’incidence x la durée du trouble
Vrai
Ainsi, si la durée du trouble augmente (ex : nouveau traitement qui prolonge la vie), la prévalence du trouble va augmenter et vice-versa
Définition de la puissance
Probabilité de déceler une certaine différence lorsque cette différence existe vraiment
Puissance = 1 - erreur bêta
Quel est le facteur le plus important dont dépend la puissance?
La taille de l’échantillon
Quelle est la différence entre une étude primaire et une étude secondaire?
Une étude primaire génère ses propres données (ex : étude de cohorte) alors qu’une étude secondaire utilise les données d’études déjà publiées (ex : méta-analyse)
Quelles sont les études “d’observation”? (4)
Rapport de cas
Série de cas
Étude de cohorte
Étude cas-témoin
Définition de l’étude de cohorte
Deux groupes (exposé vs non exposé à un facteur de risque prédéfini) suivis de façon longitudinale pour déterminer et comparer la fréquence d’une maladie dans chaque groupe
Étude prospective (progression de la cause vers l’effet)
Définition de l’étude cas-témoin
Deux groupes (cas-malade ou témoin-sain) comparés quant à la fréquence pour chacun de l’exposition à un facteur de risque déterminé
Étude rétrospective (progression de l’effet vers la cause, on recherche s’il y a eu exposition)
Quel est le devis préférable si l’exposition à un facteur de risque est rare?
Étude de cohorte
Quel est le devis préférable si la maladie est rare?
Étude cas-témoin
Vrai ou faux
L’étude cas-témoin est plus longue et coûteuse qu’une étude de cohorte
Faux
Contraire
Entre l’étude de cohorte et l’étude cas-témoin, laquelle a le plus de biais en général?
Étude cas-témoin (ex : biais de rappel)
Sinon, l’étude de cohorte a moins de biais en général, mais risque de perte de sujets (biais d’attrition)
Quelle est la mesure utilisée dans l’étude cas-témoin?
Rapport de cote (odds ratio)
Mesure utilisée dans l’étude de cohorte
Risque relatif
Qu’est-ce qu’une étude randomisée?
Sujets attribués à un groupe ou un autre de façon aléatoire
Progression de la cause vers l’effet donc prospectif
Utilité de la randomisation
Éviter la sélection systématique et le biais d’attribution
Qu’est-ce qu’un biais de sélection?
Biais dans la méthode adoptée pour sélectionner les sujets (ex : volontariat, autosélection)
Qu’est-ce qu’un biais de confusion?
Variables confondantes insuffisamment contrôlées
Solution = essai randomisé contrôlé
Qu’est-ce qu’un biais de rappel?
Les personnes malades se rappellent de certaines expositions de manière différente aux personnes non malades
(dans les études cas-témoin)
Qu’est-ce qu’un biais d’attrition?
Perte de certains patients de l’analyse
Qu’est-ce qu’un biais d’évaluation?
Mesure de l’issue n’est pas évaluée de la même manière dans les deux groupes
Solution : balancer les évaluateurs dans les groupes et documenter l’accord interjuge
Qu’est-ce qu’un biais de publication?
Études réalisées sur un sujet ne sont pas toutes publiées. Tendance à publier les études positives seulement. Solution = enregistrement de l’étude dans une base de données avant le démarrage
Quelles sont les autres explications possibles d’une association observée dans une étude épidémiologique? (4)
Chance
Biais
Causalité inverse
Facteurs confondants
Comment effectuer un tableau de tests de dépistage?
Quelles sont les qualités d’un bon test de dépistage? (6)
Abordable
Facile d’administration
Peu d’inconfort
Fiable
Valide
Comparé à un gold standard
Qu’est-ce qu’un faux positif?
Test diagnostic positif en l’absence de la maladie
Qu’est-ce qu’un faux positif?
Test diagnostic positif en l’absence de la maladie
Comment calculer la prévalence?
(A+B)/total
Définition et calcul de la sensibilité
(vrais positifs) / (vrais positifs + faux négatifs)
Nombre de cas avec la maladie qui sont correctement identifiés par un test positif
(vrais positifs) / (tous les cas de maladie)
Définition et calcul de la spécificité
(vrais négatifs) / (vrais négatifs + faux positifs)
Nombre de cas sans la maladie correctement identifiés par un test négatif
(vrais négatifs) / (tous les cas sans maladie)
Définition et calcul de la valeur prédictive positive
Nombre de cas avec la maladie en présence d’un test positif A/(A+C)
Si mon test est positif, quelles sont les chances que j’aie la maladie?
(vrais positifs) / (vrais positifs + faux positifs)
Définition et calcul de la valeur prédictive négative
Nombre de cas sans la maladie en présence d’un test négatif D/(B+D)
(vrais négatifs) / (vrais négatifs + faux négatifs)
Vrai ou faux
La sensibilité et spécificité dépendent de la prévalence
Faux
VPP et VPN dépendent de la prévalence : permettent de répondre à la question du patient (il veut savoir ses chances d’avoir la maladie lorsque son test est positif)
Sensibilité et spécificité sont des caractéristiques propres au test (“est-il capable de”)
Vrai ou faux
Avec une sensibilité élevée, il est plus utile d’avoir un résultat négatif pour rule out
Vrai
Vrai ou faux
Avec une spécificité élevée, il est plus utile d’avoir un résultat négatif pour rule in
Faux
Plus utile d’avoir un résultat positif (rule in)
Quelle est la définition du NNT?
Nombre nécessaire pour traiter
Nombre de patients à traiter pendant une période donnée pour éviter l’apparition d’un événement défavorable. Défini par l’inverse de la réduction du risque absolu. Le NNT s’exprime en nombre de patients par unité de temps. En général, le NNT est calculé à partir de l’évolution de 2 populations sous un traitement A (molécule testée) et un traitement B (placebo)
Quelle est la valeur d’un NNT idéal?
1
Dans ce cas, chaque patient s’améliore avec le traitement étudié et aucun patient ne s’améliore spontanément dans le groupe placebo.
Vrai ou faux
Plus le NNT est grand, plus le traitement est efficace
Faux
Plus le NNT est grand, moins le traitement est efficace. La valeur idéale d’un NNT = 1
Qu’est-ce que le RAR (réduction absolue du risque)?
Différence entre les deux risques = risque chez les sujets exposés - risque chez sujets non exposés
RAR est aussi appelé risque attribuable
Calcul du NNT
Inverse de la réduction du risque absolu
Réduction du risque absolu = (risque chez sujets exposés) - (risque chez sujets non exposés)
NNT = 1 / RAR
Qu’est-ce que le NNH?
Nombre de cas traité qui cause un effet négatif
Calcul de la réduction relative du risque
Risque absolu / risque au départ
Calcul du risque relatif
Risque chez sujets exposés / risque chez sujets non exposés
Calcul du rapport de cotes (odds ratio)
(cas exposés X témoins non exposés)
_______________________________
(cas non exposés X témoins exposés)
Qu’est-ce qu’un intervalle de confiance?
Moyenne calculée d’échantillonnages répétés d’une population choisie
Si IC de 95%, donc 95 échantillonnages sur 100 contiendront la moyenne de la population choisie
L’IC est un intervalle de valeurs qui a une certaine probabilité de contenir la valeur du paramètre. Fixé par le chercheur, mais 95% est souvent recommandé.
Plus l’IC est large, plus la probabilité de recouper le paramètre est forte. Mais si trop large, estimation peu précise. Donc, il faut trouver le juste équilibre entre niveau de confiance désiré et précision de l’estimation.
Quel serait l’IC à 95% si la moyenne est 93 et que l’ET est de 9?
93 +/- (1,96 x 9)
(95% d’une distribution normale se retrouve à +/- 1,96 ET)
Quels sont les 2 types de revues?
Narrative
Systématique
Qu’est-ce qu’une revue narrative?
Auteurs révisent la littérature et tentent d’en ressortir les points positifs et négatifs. Non systématique et sujet aux biais
Quelles sont les étapes d’une revue systématique? (4)
1- Formuler une question
2- Trouver les études
3- Évaluer la qualité des études
4- Résumer les données
Quels sont les biais possibles d’une revue systématique? (3)
Biais de publication (études négatives pas publiées)
Délai de publication (résultats positifs publiés avant résultats négatifs)
Langue (souvent recherche en anglais seulement)
Vrai ou faux
Les méta-analyses permettent d’augmenter la puissance
Vrai
Quels sont les critères pour évaluer la qualité d’une méta-analyse? (7)
Critères d’inclusion et d’exclusion explicites et bien justifiés
N’est pas restreinte aux études publiées
Stratégie de recherche d’articles explicitement décrite
Recherche à partir de différentes sources
Protocole d’analyse et méthodologie détaillés
Évaluation de la fidélité interévaluateur des outils de mesure
Évaluation des biais possibles
Quelles sont les mesures de taille d’effet? (3)
Différence des moyennes standardisées
Coefficient de corrélation (Pearson)
Risque relatif
Quels sont les facteurs qui déterminent la qualité de l’acte médical? (6)
Accessibilité
Actualité
Efficacité
Continuité
Participation des patients
Sécurité
Qu’est-ce que le principe de Pareto?
80 % des effets sont le produit de 20 % des causes
Définition du diagramme de Pareto
Graphique qui représente l’importance de différentes causes à un phénomène