Lecture 4 Flashcards
the probability of a binary question depends on…
sensitivity
specificity
prevalence
base rate neglect =
the failure to take prevalence into account
-> type of fallacy in which people tend to ignore the base rate (e.g., general prevalence) in favor of the individuating information (i.e., information pertaining only to a specific case)
bij een lage prevalentie kan een mega goede test nog steeds valse resultaten genereren
bayes theorem =
states that the conditional probability of an event, based on the occurrence of another event, is equal to the likelihood of the second event given the first event multiplied by the probability of the first event.
bayesian inference =
hypotheses that predict the data relatively well receive a boost in credibility, whilst hypotheses that predict the data relatively poorly suffer a decline.
wat is het verschil tussen general model en bayesian inference
general model: met sensitivity and specificity. state of the world -> predictions -> data
bayesian inference: wishes to invert the generative model. data -> state of the world (given this data, what can we conclude about the state of the world)
wat zijn de belangrijkste factoren van bayesian
positive predictive value and negative predictive value
sensitivity=
if you have the disease, what is the probability of a positive test
= hit rate
specificity=
given you do not have the disease, what is the probability of a negative test
= correction rejection
ezelsbruggetje sensi en speci
sensitivity = v van vinkje, dus gaat over positieve testen
positive predictive value =
given that the test is positive, what is the probability of having the disease
negative predictive value =
given that the test is negative, what is the probability of not having the disease
dus wat is het verschil tussen sensitivity/specificity en positive/negative predictive values
sensi/speci = state of the world -> data
positive/neg predic values = data -> state of the world
dus wat is het verschil tussen sensitivity/specificity en positive/negative predictive values
sensi/speci = state of the world -> data
positive/neg predic values = data -> state of the world
welke formule hoort dan bij sensi/speci
P(A|B)
welke formule hoort bij predictive values
P(B|A)
hoe heet de error van p(a|b) en p(b|a)
transposing the conditional
hoe interpreteer je P(A|B)
kans dat je a krijgt als je b hebt
hoe interpreteer je P(B|A)
kans dat je b krijgt als je a hebt
welke is high probability
p(A|B)
en welke is low probability
P(B|A)
voorbeeld hiervan
blood loss en shark attack
kans bij blood loss als shark attack is hoog, dus P(blood loss | shark attack)
kans bij shark attack als blood loss is laag, dus P(shark attack | blood loss)
wat is lastig aan een lage prevalentie bij sensi en speci
een lage prevalentie van een ziekte kan er voor zorgen dat een test heel goed lijkt, maar dat eigenlijk niet is. nog steeds zijn er heeel veel mensen die vals positief worden verklaard
hoe kan je deze limitatie aanpassen
focus on the rows; predictive value
bayes rule =
start with prior, past knowledge about the world -> see data -> obtain present knowledge about the world
dus wat doe je basically bij bayes rules
learning occurs by seeing data, seen through the predictive updating factor
formule: present knowledge about the world =
past knowledge * predictive updating factor
2 key ideas
- hypotheses that predict the data well, are boosted in plausibility, others that dont suffer a decline
- extraordinary claims require extraordinary evidence, want your past knowledge telt ook heel erg mee! dus bij strong prior opinion heb je extraordinary
what is the probability of it being windy and roger winning
P(W, R) = P(W) x P(R|W)
bij welke vraag kijk je naar de rijen, en bij welke vraag kijk je naar de coloms?
colums = sensitivity (positive) or specificity (negative)
rows = predictive values
wat is ppv en npv
positive predictive value
negative predictive value
dus als je ppv wil waar kijk je naar
positief, rows
als je npv wil waar kijk je naar
negative, rows
wat betekent een komma bij P(A,W)
and
algemene formule om a en b te krijgen
P(A,B) = P(A) * P(B|A)
hoe kan je de algemene formule omzetten
P(B,A) = P(B) * P(A|B)
wat is er met de and operation
die maakt het niet uit welke eerst komt
present knowledge about the world =
past knowledge x predictive updating factor
formule =
p(d|t)/p(h|t) = p(d)/p(h) * p(t|D)/p(t|H)
P(d)/P(h) in het midden, moet goed verdeeld worden!
dtdtd
als je hele goede evidence hebt, wordt posterior knowledge dan gelijk aangepast?
nee, als de prior odds heel sterk is dan is het alsnog niet genoeg. gaat dus echt om wat het sterkste is
An excellent test (high sensitivity and specificity) can provide strong evidence. This evidence may still not be enough to overturn the impact of prevalence.
wat is de formule voor prevalentie
P(D)
P(H) is dan 1-P(D)
hoe ga je van odds naar probability
odds/odds+1
dus bijvoorbeeld ppv is probability!
wat is de posterior odds
P(D)/P(H), dus prevalenties
wat is de predictive updating factor
P(t|D) / P(t|H)
wat is de sensitivity formule met p
p(t=+|D)
wat is de specificity formule met p
p(t=-|D)
wat is de likelihood ratio
sensitivity/1-specificity
p(t=+|D) / p(t=-|D)
als je niks weet van de prevalentie, welke maat kun je dan nog wel voorspellen
de sensitivity, “given that you have the disease, how likely is the test going to give a positive result” -> dus dit gaat echt over de kwaliteit van de test. (kolommen!) dit geldt ook voor specificity