Statistik Flashcards
4 types de variables
Quantitatives (discrète, continue)
Qualitative (catégorielle)
Indépendante (x)
Dépendante (y)
3 mesures de variables centales
Moyenne (= somme des valeurs / # de valeurs)
Mode (valeur qui revient le + souvent dans échantillon)
Médiane (valeur centrale)
Valeur la + utile si distribution est non biaisée ?
Moyenne
Valeur la + utile si distribution est biaisée ?
Médiane
Dans distribution normalisée, comment sont la moyenne, le mode et la médiane ?
La même affaire
3 mesures de dispersions
Étendue (de la + petite à la + grande valeur)
Variance (moyenne des déviations individuelles de la moyenne au carré…. = écart-type au carré)
Écart type (racine carrée de la variance)
Comment on explique les 4 niveaux de qualité
N1: MA avec IC étroit OU > 2 ECR avec échantillon adéquat (idéalement contre placebo)
N2: MA avec IC large OU ECR
N3: ECR à petit échantillon OU étude prospective non randomisée OU série de cas OU étude rétrospective de bonne qualité
N4: opinion d’expert, consensus
Quel niveau d’évidence nécessaire pour des recommandations de 1er ou 2e ligne ou 3e ligne
1er ligne: N1 ou N2 + clinique
2e ligne: N3 (ou mieux) + clinique
3e ligne: N4 (ou mieux) + clinique
C’est quoi l’hypothèse nulle (H0)
souvent c’est l’inverse de ce qu’on pense trouver.
On tente de réfuter H0 en recherche.
Ex: si on pense que 2 pop sont différentes sur un paramètre (ex: une moyenne), H0 = les 2 moyennes sont égales
Hypothèse alternative à H0
H1
Valeur p ?
Utilisée pour déterminer si les résultats d’une étude sont significatifs ou non.
Aide à savoir si l’effet observé (ex: une différence entre 2 groupes) est dû au hasard ou si c’est un vrai effet.
Seuil requis généralement pour réfuter H0 ? (concernant la valeur P)
P < 0.05
ça veut dire que le résultat aurait pu être obtenu par hasard < 5x / 100
Qu’est-ce que l’erreur de type 1 (alpha)
H0 rejetée alors qu’elle tait vraie
= erreur de validité interne
** la probabilité de commettre l’erreur de type 1 = valeur P
Qu’est-ce que l’erreur de type 2 (bêta)
H0 acceptée alors que c’est faux
= manque de puissance
C’est quoi la validité interne ?
capacité de l’étude d’estimer correctement les mesures/associations qu’on cherche
C’est quoi la validité externe ?
Caapcité de généraliser un résultat à une pop cible (permet de juger de l’intérêt clinique d’un résultat)
- pour l’améliorer: devis pragmatique
C’est quoi la fiabilité ?
consistance/reproductibilité des résultats
C’est quoi test T de student
teste H0 comme quoi les moyennes de 2 échantillons (N< 30) faits de valeurs continues ne diffèrent pas
**compare 2 moyennes
C’est quoi analyse de variance ANOVA (F test)
comme test T de student mais pour > 2 échantillons
**compare > 2 moyennes
C’est quoi Z test
teste H0 comme quoi les moyennes de 2 échantillons (N > 30) faits de valeurs continues ne diffèrent pas
C’est quoi chie-carré
Pour comparer 2 proportions
Évalue association entre échantillons de variables discrètes
Tests pour prédire les résultats lors qu’une corrélation est démontrée (2)
Régression linéaire (variables continues)
Régression logistique multiple (variables discrètes)
C’est quoi test de Pearson
Test de corrélation linéraire entre variables continues
-1 = association inverse parfaite
0 = ø association
1 = association directe parfaite
Prévalence: kesse ça
% d’individus dans une pop qui ont une mx à un moment précis ou pendant une période
Prévalence = Nb de cas (vieux + nouveaux) / taille totale de la pop
Incidence : kesse ça
nouveaux cas qui apparaissent dans une pop pendant une période
Incidence cumulée : # nouveaux cas / pop à risque au début de la période
Taux incidence : # nouveaux cas / somme des (temps-personnes à risque)
En gros, la prévalence représente quoi ? et l’incidence ?
Prévalence: poids de la maladie
Incidence: risque de développer mx
Qu’est-ce que la puissance d’une étude ?
Capacité à déceler une différence quand elle existe vraiment.
Puissance = 1 - erreur bêta
Grader les types d’études selon leur niveau d’évidence (du pire au meilleur) (6)
Rapport de cas
Enquête
Série de cas
Étude de cohorte
Étude cas-témoins
ECR
c’est quoi une étude de cohorte (étude observationnelle)
2 groupes: exposés et non exposés
Suivi longitudinal
Compare fréquence de la mx dans les 2 groupes
Prospectif (de cause vers l’effet)
Utile si expo rare
RR
c’est quoi une étude cas-témoins (étude observationnelle)
2 groupes: cas (ms) et témoins (sains)
Compare fréquence de l’expo à un FR déterminé
Rétrospectif: de l’effet vers la cause
Utile si maladie rare
Moins cher que cohorte, mais + de biais
RC
C’est quoi un essai clinique (étude randomisée)
Gold standart
Moins de biais
Sujet attribués entre les groupes de façon aléatoire
Prospectif: de cause vers effet
Randomisation évite biais attribution
ça veut dire quoi double aveugle
Ni sujet ni chercheur ne savent si le sujet est dans le groupe expérimental ou contrôle
6 types de biais
Sélection
Confusion (variables confondantes non contrôlée)
Rappel
Attrition (perte au suivi)
Évaluation (mesure de l’outcome différente dans les 2 groupes)
Publication (tendance à publier les études +)
Qualité d’un bon test de dépistage (6)
Abordable
Facile à administrer
Peu d’inconfort
Fiable
Valide
Comparé à gold standart
Prévalence calcul
Prévalence = (A + B) / total
Sensibilité calcul
SE = A / (A + B)
** si tu as la mx, le test va-t-il le détecter ?
** nb de cas avec dx bien identifiés par test positif
Spécificité calcul
SP = D / (C+ D)
** nb de cas sans dx correctement identifié par un test négatif
Calcul VPP
A / (A+C)
*si mon test est positif, quelles sont les chances que j’aie la maladie ?
** nb de cas avec dx en présence d’un test +
Calcul VPN
D / (B + D)
- nb de cas sans dx en présence d’un test négatif
De quoi dépendent VPN et VPP ?
De la prévalence
Utilité d’une SE élevée ? vs une SP élevée ?
SE élevée: + utile d’avoir test négatif (r/o)
SP élevée: + utile d’avoir résultat + (rules in)
Calcul d’un RAR (réduction absolue du risque)
RAR = risque chez exposés - risques chez non exposés
ex: RAR = 70/100 - 30/100 =4/10 = 2/5
C’est quoi le NNT ?
Nb de patients à traiter pendant une période pour éviter 1 évènement défavorable
S’exprime en nb de patient par unité de temps
NNT idéal = 1
+ le NNT est grand, moins le tx est efficace
Calcul d’un NNT
NNT = 1 / RAR
Calcul du RR
RR = risque chez exposés / risque chez non exposés
Ex: (70/100) / (30/100) = 7/3 = 2,33
Calcul du RC (pour études cas-témoins)
RC = (A x D) / (B x C)
Ça veut dire quoi un Interval de confiance (IC) de 95%
95 échantillons sur 100 contiendront la moyenne de la pop choisie
IC = intervalle de valeurs qui ont une probabilité de contenir la valeur du paramètre. Fixé par le chercheur. Si trop large, peu précis.
** 95% d’une distribution normale se retrouvent à 1,96 écart-types
2 types de revues
Narrative (+ de biais)
Systématiques :
1. Question
2. Trouver les études
3. Évaluer leur qualité
4. Résumer les données
biais possibles avec revues systématiques
publication, délai de publication, langage
Principe de pareto ?
805 des effets sont le produit de 20% des causes