Stat examen Flashcards
Statistique descriptive permet quoi ?
De résumer un ens. de données, dans le but de présenter des faits saillants d’une population ou d’un échantillon.
Définition : population
Ensemble d’éléments ou de personnes qui partagent des caractéristiques communes
Définition échantillon représentatif
Échantillon qui présente des caractéristiques similaires à celles de la population (âge, sexe, etc.).
Qu’est-ce que la mesure de tendance centrale ?
Une façon de résumer des observations qui peuvent être faites dans un échantillon ou dans une population.
Différence impacts données aberrante entre la moyenne & la médiane ?
Les données aberrantes et/ou extrêmes (outliers) ont beaucoup plus d’impact sur la moyenne que sur la médiane.
Comment savoir si une distribution est normale ?
Tests statistiques (ex. Shapiro-Wilk)
Inspection visuelle des données
Comparaison moyenne vs médiane : Si la moyenne et la médiane sont très différentes, la distribution n’est pas normale.
Qu’est-ce qu’une distribution bimodale ?
Lorsque les données sont réparties en 2 groupes (ou plus)
Qu’est-ce que nous permet de savoir la mesure de dispersion ?
Permet de savoir comment les données se répartissent : est-ce qu’elles sont toutes regroupées près de la mesure centrale ou si elles varient beaucoup
Quel sont les 2 types de mesure de dispersion ?
Écart-type & variance
Étendue
Quand utilise-t-on l’écart-type et la variance ?
Utilisé avec la moyenne (pas la médiane), lorsque la distribution est normale
Quand utilise-t-on l’étendue ?
Généralement utilisé avec la médiane, généralement lorsque la distribution est asymétrique
Qu’est-ce que mesure l’écart-type & la variance ?
Mesure de l’écart des données par rapport à la moyenne
Est-ce que les données sont très proches une de l’autre ou très variées
Est-ce que la courbe est plate ou pointue
Quel est le calcul de la variance ?
∑(Xi - moyenne)^2/(n-1)
Qu’est-ce que mesure l’étendue ?
Différence entre valeur min et valeur max
Quels sont les échelles de mesure des variables quantitative (et leurs descriptions) ?
Continue (infinité de valeurs possibles)
Discrète (quantités isolées, dénombrement)
Quels sont les échelles de mesure des variables qualitative (et leurs descriptions) ?
Ordinaire (ordre naturel entre modalités)
Nominale (pas de rang possible)
Présentation numérique des données qualitatives
Tableau de fréquence relative et absolue
Présentation numérique pour les données quantitatives ?
Mesure de tendance centrale & mesure de dispersion
Présentation visuelle pour les qualitatives et quantitative discrète :
Diagramme en bâton
Présentation visuelle pour les données quantitatives continue
Histogramme
Représentation numérique et graphique d’une variable quantitative discrète
Mesure de tendance centrale & mesure de dispersion ?
Médian
Quartiles ou étendues
Diagramme en bâton
Représentation numérique et graphique d’une variable quantitative continue - non normale
Mesure de tendance centrale & mesure de dispersion ?
Médiane
Quartiles ou étendue
Histogramme
Représentation numérique et graphique d’une variable quantitative continue - normale
Mesure de tendance centrale & mesure de dispersion ?
Moyenne
Écart-type
Histogramme
Mesure de dispersion pour
68,3%
95,4%
99,7%
+/- 1 écart-type
+/- 2 écart-type
+/- 3 écart-type
Avec quoi on mesure les probabilités d’une courbe ?
Aire sous la courbe
Intervalle de confiance permet quoi ? dans quels % des valeurs observées
Décrire la répartition des données à l’intérieur de l’échantillon.
95%
Calcul de IC95%
Moyenne + ou - 2s
S = écart-type
Comment faire si on veut calculer la probabilité qui n’est pas dans les écart-types connues ?
Il faut faire une transformation de notre variable en score Z qui suivra une distribution centrée réduite, ce qui signifie que la moyenne sera alors de 0 avec un écart-type de 1.
Statistique inférentielle permet quoi ?
Généraliser un résultat d’un échantillon à une population
Énoncer une conclusion
Théorème central limite (TCL) permet quoi ?
Permet d’expliquer comment les paramètres mesurés dans un échantillon peuvent se rapporter à la population.
Comment on appel l’écart-type de la distribution des échantillons dans le TCL
Peut être estimé à partir de quoi ?
Erreur-type (𝝈∕√𝒏. )
Estimé à partir de 𝒔∕√𝒏
Dans le TCL, qu’est-ce qu’on peut assumer de l’intervalle de confiance ?
Auquel on a raisonnablement confiance de trouver la valeur de la vraie moyenne de la population
Calcul de l’intervalle dans lequel on a 95% de chances de retrouver la vraie moyenne de la population :
µ = moyenne ±𝟐𝐬∕√𝐧
But de l’IC en statistiques descriptives et celle en statistiques inférentielle ?
Permet de décrire un échantillon. Il sera beaucoup plus large pour englober 95% des observations.
Pour but de faire tirer des conclusions sur notre population à partir d’un échantillon, donc d’estimer la vrai moyenne de la population.
Il sera beaucoup plus petit puisque nous utilisons l’erreur-type pour le calculer (𝑠∕√𝑛).
Plus la taille de l’échantillon sera grande (n), plus l’intervalle obtenu sera petit.
IC de la moyenne de la population (inférence)
Applicable quand
Si les données sont distribuées normalement ou peut être acceptable si n > 30
Comment savoir si une différence observée (ex. perte de poids, augmentation de la vitesse de marche, etc.) démontre réellement l’effet d’une intervention/d’un phénomène ?
Il faut faire un test d’hypothèse
Quel est le résultat d’un test d’hypothèse ?
Est la valeur p, qui correspond à la probabilité que les données de recherche aient été obtenues par hasard (i.e., sans qu’ils soient dus à un effet spécifique).
Test d’hypothèse, décrire le principe
Un test d’hypothèse compare l’hypothèse nulle (H0, absence d’effet, statu quo) à une hypothèse alternative (H1, effet que l’on souhaite démontrer).
On considère qu’il n’y a pas d’effet, tant qu’un effet n’a pas été démontré. Autrement dit, on considère d’emblée que H0 est vrai, tant qu’on ne peut pas l’éliminer pour conclure qu’il y a vraiment un effet (donc retenir H1).
Le résultat du test d’hypothèse (valeur p) représente quoi ?
La probabilité que les données de recherche aient été obtenus par hasard, autrement dit c’est la probabilité que l’hypothèse nulle soit vraie.
Que pouvons nous affirmer si le p est assez petit
Qu’une différence existe, et donc rejeter H0 en faveur d’H1
Autre façon de concevoir p est que p =
probabilité d’avoir tort en affirmant qu’une différence existe (i.e. en rejetant H0).
Degré de signification (alpha)
Décrire
Il est primordial de fixer d’avance le seuil à partir duquel on rejettera H0. C’est ce qu’on appelle le seuil α, ou le degré de signification statistique.
Si valeur p est inférieure au niveau du test (p<α), on rejette H0 :
Résultat statistiquement significatif
Si valeur p n’est pas inférieure au niveau du test (p≥α), H0 n’est pas rejetée :
Résultat non-significatif
Généralement fixé à 5% (0,05)
Résultat statistiquement significatif =
Mesure du niveau de certitude avec lequel on peut affirmer que l’effet est réel (et non du au hasard)
Déterminé par la valeur p et le seuil alpha
Résultat cliniquement significatif =
Mesure l’importance de l’effet dans un contexte clinique
Déterminé par consensus scientifique et/ou par expertise clinique et/ou par gros bon sens
3 facteurs affectants le résultat du test statistique :
- % d’écart entre les données comparées
(Probable qu’une petite différence soit due au hasard, mais peu probable qu’une très large différence soit due au hasard) - Taille de l’échantillon
- L’écart-type
Que permet un échantillon de très grande taille ?
Il est possible de mettre en évidences des différences statistiques très minimes qui n’ont pas d’intérêt réel en clinique
Que signifie un très grand écart-type (par rapport au test hypothèse)
Un très grand écart-type indique une très grande variabilité (i.e. la variable à l’étude est influencée par plusieurs facteurs). Plus l’écart-type est large p/r à la différence observée, plus il y a de chances que la différence soit du au hasard ou aux autres facteurs influençant la variable.
Qu’est-ce que la puissance statistique :
Est la probabilité de ne pas commettre une erreur de type 2 (l’hypothèse nulle est acceptée par erreur) : Puissance = 1-β
En général, une puissance de 80% est considérée adéquate
Quand doit-on utilise la puissance statistique ?
Quand le résultat n’est pas statistiquement significatif, on doit évaluer la puissance avant de conclure que l’hypothèse nulle est vraie.
Technique pour tirer des conclusions statistiques
Intervalle de confiance
Test d’hypothèse
De quoi dépend le choix du test statistique ?
- Type de variable
- Nb de groupe
- Gr. dépendants/indépendants
- Type de distribution
Test paramétrique utilisé avec quel type de distribution ?
Distribution normale (et/ou n>30 par groupe)
Test non-paramétrique utilisé avec quel type de distribution ?
Distribution non-normale (et n<30 par groupe)
Normalité
il faut quoi
Pour assumer la normalité, il faut que ce soit mentionné ou qu’il y ait au moins 30 sujets par groupe.
Si le n < 30 par groupe, il ne faut pas assumer nécessairement que la distribution ne sera pas normale. Il est possible que les données soient normalement distribués avec un n < 30 par groupe.
Si le n < 30 par groupe et que la distribution n’est pas mentionnée, on va proposer les 2 tests possible, paramétrique et non-paramétrique.
Corrélation permet d’évaluer quoi ?
Permet d’évaluer l’association entre deux variables quantitatives
Un test statistique de corrélation nous donnera 3 résultats :
Coefficient de corrélation (r)
Équation prédictive
Valeur p
Coefficient de corrélation (r):
-1 < r < 1
Le signe indique la direction de l’association
r > 0 : association positive (les 2 variables augmentent/diminuent ensemble)
r < 0 : association négative (lorsqu’une variable augmente, l’autre diminue)
Valeur du r indique la force de l’association, plus le r est élevé, plus la corrélation est forte
Valeur de la corrélation et son interprétation
0 = aucune
1 ou -1 = parfaite
Entre 0 et 0,3 (0 et -0,3) = faible
Entre 0,3 et 0,7 (-0,3 et -0,7) = modérée
Entre 0,7 et 1 (-0,7 et -1) = forte
Équation prédictive
Possible d’obtenir une équation prédictive qui permet d’estimer quel sera le Y pour un X donné (ou vice-versa) : Y= a + bX
La pente de l’équation (b) a le même signe que r, mais pas la même valeur
NOTE: la force de l’association (r) entre la taille et le poids n’est pas affectée par le choix d’unité, mais l’équation de la droite sera différente si on utilise lbs vs kg.
Valeur p correspond à quoi ?
Valeur p : correspond à la probabilité que le résultat ait été obtenu par hasard
Valeur p : correspond à la probabilité d’avoir tort en rejetant H0.
Un résultat sera considéré statistiquement significatif si p<alpha, on rejette alors l’hypothèse nulle et on considère que l’hypothèse alternative est probablement vraie.
Attention à l’interprétation
p ≠ r
p : degré de certitude avec lequel on peut affirmer qu’il y a une association (peu importe si elle est forte ou non)
r : force (et direction) de l’association
Attention à l’interprétation
b ≠ r
b : pente de l’équation prédictive (même signe que r), qui permet seulement d’estimer un X pour un Y donné
r : (force) et direction de l’association
Est-ce que corrélation = causalité ?
Non
Qu’est-ce que signifie le fait que le paramètre de H0 est inclus dans l’intervalle de confiance ?
Que le résultat ne sera pas statistiquement significatif.
Définition de l’épidémiologie
Est l’étude de la fréquence et de la répartition d’états ou d’événements relatifs à la santé de populations spécifiques, incluant l’étude des déterminants influençant ces états, et l’application de ce savoir pour contrôler les problèmes de santé
Épidémiologie descriptive
Évalue quoi et permet quoi ?
Évaluer fréquence de la maladie ou des facteurs associés dans un temps et un lieu
Faire le portrait d’une maladie (ou d’un état/déterminant de santé)
Établir des hypothèses
Épidémiologie analytique
Permet quoi ?
Permet de vérifier des hypothèses
Type d’indicateur (épidémiologie)
Rapport (ratio) définition
Relation entre deux nombres alors que le numérateur n’est pas inclus dans le dénominateur (e.g. ratio homme/femme)
Type d’indicateur (épidémiologie)
Proportion définition
Relation entre deux nombres alors que le numérateur est inclus dans le dénominateur (e.g. 70 des étudiants de la classe sont des filles)
Type d’indicateur (épidémiologie)
Taux définition
Proportion qui mesure une vitesse d’apparition dans le temps (e.g. 40 nouveaux cas de cancer du poumon pour 1000 fumeurs par année)
Indicateur de fréquence :
Prévalence
Incidence cumulée
Calcul de la prévalence
(nb cas maladie à un moment)/(nb personne dans la population à ce moment)
Incidence cumulée
Calcul
(nb nouveau cas d′une maladie dans population pdt période donnée)/(population à risque de développer la maladie durant la période)
Quel est le problème de l’incidence cumulée ? Quel est la solution ?
Ne tient pas compte des pertes au suivi (i.e. prends pour acquis que les pertes au suivi n’ont pas développé la maladie), donc sous-estime l’incidence réelle
Solution : calculer la durée réelle des observations en personnes-temps
Taux d’incidence
Calcul
(nb nouveau cas d’une maladie dans population pendant période donnée)/(durée totale d’observation-personne-temps)
Tests clinique
Utilise pour quoi ?
Pour dépister la présence d’une condition, on doit généralement utiliser des tests.
4 possibilité de résultat des tests cliniques
Le test est positif
Vrai positif : Test positif, cdt présente
Faux positif : Test positif, cdt absente
Le test est négatif
Vrai négatif : Test négatif, cdt absente
Faux négatif : Test négatif, cdt présente
3 types d’indicateurs pour savoir si un test est « bon » :
- Sensibilité/spécificité
- Valeur prédictive positive ou négative (VPP/VPN)
- Likelihood ratio (LR+/LR-)
Sensibilité définition
La sensibilité d’un test est sa capacité à identifier correctement, dans une population ciblée, les personnes ayant vraiment la caractéristique recherchée
La sensibilité se rapporte à la capacité de détecter les malades
Spécificité définition
La spécificité d’un test est sa capacité à identifier, dans une population ciblée, les personnes n’ayant pas une caractéristique spécifique donnée.
La spécificité se rapporte à la capacité à discriminer ou éliminer les non malades
Calcul de la sensibilité
Parmi les malades, combien testent positif (i.e. proportion de malades qui testent +)
a/a+c
a = test + et malade
c = test négatif et malade
Calcul spécificité
Parmi les sains, combien testent négatif (i.e. proportion de non-malades qui testent -)
d/b+d
d = Test - et non malade
b = test + et non malade
Sensibilité élevée et faible permet :
Sensibilité élevée : permettra d’attraper presque tous les malades
Sensibilité faible : risque d’échapper beaucoup de malades
Spécificité élevée et faible permet quoi
Spécificité élevée : permettra d’éliminer presque tous les non-malades
Spécificité faible : risque d’attraper beaucoup de non-malades par erreur
Test très sensible mais peu spécifique =
Moins on est sévère, plus on a de chances que tous les malades testent (+), mais plus on a de chances d’attraper des non-malades aussi
Test très spécifique mais peu sensible =
Plus on est sévère, moins on a de chances d’échapper un malade, mais plus on a de chances qu’un patient malade teste (-)
On utilise un test très sensible (98%) et très spécifique (98%). Est-ce qu’on peut conclure que les patients qui testent négatif n’ont probablement pas la maladie ?
Non; La sensibilité/spécificité concerne les colonnes. Ne nous dit rien sur la probabilité qu’un + (ou -) soit malade (ou non-malade)
VPP (valeur prédictive positive) =
Calcul
Probabilité qu’un patient qui teste positif soit en effet malade (proportion de malades parmi les (+))
a / a + b
a = test + et malade
b = test + et NON malade
VPN valeur prédictive négative =
Calcul
Valeur prédictive négative.
Probabilité qu’un patient qui teste négatif soit en effet sain (proportion de sains parmi les (-))
d / c + d
d = test - et NON malade
c = test - et malade
VPP/VPN dépend de quoi p/r à la condition dans l’échantillon/population ?
Prévalence
À quoi il faut faire attention dans l’interprétation des VPP/VPN par rapport à la prévalence :
La prévalence dans la population générale n’est pas nécessairement la même que dans l’échantillon de l’étude, donc on ne peut pas conclure que n’importe quel patient qui teste (+) a 69% de chances d’avoir réellement la maladie.
Likelihood ratio (LR)
Définition
Est la vraisemblance qu’un résultat de test x soit obtenu chez un sujet qui a la maladie, comparativement à la vraisemblance que le même résultat soit obtenu chez un sujet n’ayant pas la maladie.
Tient compte de la sensibilité et de la spécificité du test
Le LR permet d’évaluer la qualité d’un test diagnostique
Interprétation
LR+
LR + : % (+) chez les malades / % (+) chez les non-malades
Si le test est bon, les malades devraient avoir plus de chances de tester (+) que les non-malades. Le LR+ devrait être >1 (numérateur > dénominateur)
Plus le LR+ est élevé, meilleur est le test pour confirmer un diagnostic
LR+ sera élevé si :
Le % de (+) chez les malades est élevé (numérateur) : donc la plupart des malades testent (+)
Le % de (+) chez les non-malades est faible (dénominateur) : donc peu de non-malades testent (+)
Interprétation
LR-
% (-) chez les malades / % (-) chez les non-malades
Si le test est bon, les malades devraient avoir moins de chances de tester (-) que les non-malades. Le LR- devrait être <1 (numérateur < dénominateur)
Plus le LR- est petit, meilleur est le test pour exclure une maladie
Le LR- sera petit si :
Le % de (-) chez les malades est petit (numérateur): donc peu de malades testent (-)
Le % de (-) chez les non-malades est élevé (dénominateur) : donc la plupart des non-malades testent (-)
On peut s’intéresser au LR d’un test dans 2 contextes :
1- Pr choisir un test/évaluer sa validité :
Si on a à choisir entre 2 tests, on prendra celui avec le plus grand LR+ et le plus petit LR-
Principe semblable à sensibilité/spécificité
2- Pr savoir comment interpréter le résultat d’un test
Si un patient teste (+) (ou (-)), on regardera le LR+ (ou LR-) pour connaitre les chances que le résultat soit juste
Principe semblable à VPP/VPN
Likelihood ratio
Interprétation
Avant le test, la probabilité qu’un patient ait la maladie est de X%
S’il test (+) :
Probabilité d’avoir la maladie = X% + M%
Plus le LR+ est grand, plus un test positif augmente la probabilité que la maladie soit présente.
Le LR+ nous permet de connaitre M
Likelihood ratio
Interprétation
Avant le test, la probabilité qu’un patient ait la maladie est de X%
S’il test (-) :
Probabilité d’avoir la maladie = X% - N%
Plus le LR- est petit, plus un test négatif diminue la probabilité que la maladie soit présente.
Le LR- nous permet de connaitre N
Valeur possible pour LR + et LR-
LR+ entre 1 et ∞
LR- entre 1 et 0
En connaissant la prévalence d’une condition dans notre échantillon (pré-test probability), on peut faire quoi ?
On peut alors prédire à l’aide de la table quelle est la probabilité d’avoir la maladie lorsqu’on a un test positif ou négatif (post-test probability)
Valeur du M ou N selon valeur du LR+ ou LR-
LR +: 1 = +0%; 2 = +15%; 5 = +30% ; 10 = +45%
LR- : 1 = -0& ; 0,5 = -15% ; 0,2 = -30% ; 0,1 = -45%
VPP
Concept et utilité
Probabilité qu’un (+) soit malade
Interprétation d’un résultat (+)
VPN
Concept & utilité
Probabilité qu’un (-) soit sain
Interprétation d’un résultat (-)
LR+
Concept & utilité
% malades qui testent (+) vs % sains qui testent (+)
Choix de test pour identifier les malades ET interprétation d’un résultat (+)
LR-
Concept & utilité
% malades qui testent (-) vs % sains qui testent (-)
Choix de test pour identifier les sains ET interprétation d’un résultat (-)
Devis d’épidémiologie analytique
Définition
Définition : L’épidémiologie analytique a pour but de formuler et vérifier des hypothèses sur l’étiologie et les facteurs de risque des maladies.
Transversale
Description
Recueille au même moment des informations sur les facteurs de risque et sur la maladie (e.g. enquête téléphonique, recensement)
Choix des sujets : Au hasard
Transversale
Permet
Permet de calculer la prévalence (mais pas incidence car aucun indice sur quand l’événement survient)
Étude cas-témoin
Description
Choisit les sujets selon la présence ou non de la maladie
Évalue l’exposition de façon RÉTROSPECTIVE
Étude cas-témoin
Utile pour quoi et permet quoi
Utile pour maladies rares ou lsq les ressources sont insuffisantes pour permettre une étude de cohorte sur un échantillon relativement grand.
Permet de calculer la prévalence de l’exposition selon la maladie
Ne permet pas le calcul d’une incidence
Étude de cohorte
Description
Choisir les sujets selon leur exposition et on évalue si le sujets développent la maladie dans le temps.
Étude de cohorte
Permet
Permet : d’étudier l’exposition et la maladie dans l’ordre chronologique. On peut donc calculer une INCIDENCE.
Avec ce genre d’étude de cohorte, on peut étudier +sieurs expositions & définir +sieurs maladies.
Essai clinique (étude expérimentale)
Description
Similaire aux études de cohorte, mais l’exposition nécessite une INTERVENTION PLANIFIÉE de l’équipe de recherche
Essai clinique (expérimental)
Mesure
L’incidence (apparition) de la maladie selon l’exposition
Étude de cohorte
Mesure
Incidence (apparition) de la maladie selon l’exposition
Cas-témoins
Mesure
Prévalence (présence) de l’exposition selon la maladie
Transversale
Mesure
Prévalence (présence) de la maladie et prévalence (présence) de l’exposition
Risque relatif (RR)
Description
Les « exposés » sont combien de fois plus à risque de développer une maladie p/r aux « non-exposés » ?
On cherche à savoir s’il y a plus de malades parmi ceux qui ont été exposés que parmi ceux qui n’ont pas été exposé
Risque relatifs se mesure à partir de quels études
Cohorte et expérimentale
Risque relatifs
Calcul
RR = [incidence exposés] / [incidence non-exposés]
a/a+b / c/c+d
Risques relatives
Interprétation
RR = 1 : Pas d’association entre exposition et incidence
RR > 1 : Association positive entre exposition et incidence
RR < 1 : Association négative entre exposition et incidence
Comment écrire l’interprétation du risque relatif
Le risque de maladie est [RR] x plus grand chez les exposés que chez les non-exposés.
Interprétation du risque relatif lorsque plus petit que 1
Option 1 : (1/RR) ex : les non-actifs sont 10.1x plus à risque d’HTA que les actifs.
Option 2 : (1-RR) ex : Les risques d’HTA chez les actifs est de 90.1% inférieur à celui chez les non-actifs.
Odds Ratio (OR)
Description
À quel point les malades ont été plus exposés que les non malades ?
On cherche à savoir s’il y a plus d’exposés parmi les malades que parmi les non-malades.
Odds Ratio (OR)
Se calcule à partir de chez études ?
Transversales et cas-témoins
Odds Ratio (OR)
Calcul
OR = [ratio exposés/non exposés chez les malades] / [ratio exposés/non exposés chez les non-malades]
ad/bc
Odds Ratio (OR)
Interprétation
OR = 1 : Pas d’association entre exposition et la maladie
OR > 1 : Association positive entre exposition et la maladie
OR < 1 : Association négative entre exposition et la maladie
Comment écrire l’interprétation de l’OR :
Le rapport exposé/non-exposé est [OR] x plus élevé chez les malades que chez les non-malades
Vrai ou faux
Est-ce que lorsque la maladie est rare (prévalence <5%), le OR est une bonne approximation du RR, et peut être interprété comme un RR.
Vrai
Risque attribuable (RA)
Description
Quelle partie de l’incidence chez les exposés est attribuable à l’exposition.
Risque attribuable (RA) se calcule dans quels types d’études :
Cohorte et expérimentales
Risque attribuable (RA)
calcul
[incidence exposés] – [incidence non-exposés]
a/a+b - c/c +d
Risque attribuable
Interprétation
RA = 0 : l’exposition n’affecte pas l’incidence
RA >0 : l’exposition augmente l’incidence (facteur de risque)
RA<0 : l’exposition diminue l’incidence (facteur protecteur)
Comment écrire l’interprétation du risque attribuable (RA) ?
L’exposition est associé à une augmentation de X à X, soit une augmentation absolue de RA.
Sur une incidence de X de la maladie, les exposés, RA est attribuable à l’exposition.
Le risque de maladie chez les exposés est égal au risque de maladie chez les non exposés + le risque attribuable à l’exposition.
Le RA quantifie l’augmentation « … » du risque
Le RR quantifie l’augmentation « … » du risque
absolue
relative
En épidémiologie, les mesures d’association en facteur de risque (une exposition) et la survenue d’une maladie sont..
le RR, OR et RA.
L’IC sur une mesure d’association permet…
D’établir entre quoi et quoi devrait se situer la vraie valeur d’association (OR, RR ou RA) dans notre population, avec un niveau de certitude de XX % (souvent 95%).
Hypothèse pour mesure d’associations
RA
Absence d’association RA = 0
Hypothèses :
H0 : RA = 0
H1: RA≠0
(ou RA<0 ou RA>0)
Hypothèse pour mesure d’associations
RR ou OR
Absence d’association : RR ou OR = 1
Hypothèse :
H0: RR=1
H1: RR≠1
(ou RR<1 ou RR>1)
- Même chose pour OR
Qu’est-ce qui nous permet de savoir que le résultat ne sera pas statistiquement significatif même sans connaître la valeur de p.
Lorsque le paramètre de H0 est inclus dans l’intervalle de confiance
ex :
H0: RR=1
H1: RR≠1
Si 1 est dans l’IC95% : p>0,05
(non significatif, pas d’association)
Si 1 n’est pas dans l’IC95% : p<0,05
(significatif, association)
Régression logistique
Utilisé pour quoi ?
Pour évaluer si un ou plusieurs facteurs peuvent prédire une issue dichotomique.
Qu’est-ce que l’erreur de type 2 en statistique ?
Risque d’accepter H0 alors qu’il y a une différence
Qu’est-ce qu’un erreur de type 1 en statistique?
lorsqu’une hypothèse nulle, qui est en réalité vraie, est rejetée par erreur
LR +
Calcul
a/(a+c) / b/(b+d)
LR-
Calcul
c/(a+c)/d/(b+d)
Sensibilité
Concept
Utilité
Probabilité qu’un malade teste positif
Choix de test pour identifier les malades
Spécificité
Concept et utilité
Probabilité qu’un sain test négatif
Choix de test pour identifier les sains