Lecture 18: Bayesian ANOVA Flashcards
hoe ziet de prior knowledge er uit bij bayesian
in de vorm van een probability distribution that characterizes our prior knowledge, tussen 0 and 1.
wat gebruik je voor een proportion als prior distribution
een beta distribution
wat is het lastige aan een prior distribution
heel subjective
BF =1 betekent
dat beiden modellen even goed kunnen predicten.
BF>1 betekent
more and more evidence for one of the models
BF kan nooit…
negatief zijn (want het is een ratio)
dus grootste verschil in doelen van frequentist en bayesian statistics (gaat over conditioning)
- frequentist: the probability of the data or more extreme, given the null hypothesis
- bayesian: the probability of different parameters given the data
statistical models van theta: wat is het doel?
we are trying to inference for the population value: what do we think are likely values for the parameter values?
hoe heet het als een prior distribution heel scherp is gericht op een value (= sarahs model in voorbeeld)
een spike prior
wat doen we vervolgens met deze prior distribution
we look at: what are likely values if this model were true? how likely are the data, given the model is true?
waar lijkt een distribution bij theta = 0.5 op?
op een sampling distribution if the null would be true. (=frequentist testing)
wat is het verschil tussen freq en bayesian wat betreft de probability waar je naar kijkt
freq= the probability of the data, or more extreme
bayes= the probability of the data specifically
wat is de formule van bayesian model=
n! / k!(n-k)! * theta(1-theta)^n-k
dus als je een spiked prior kiest, vul je dit getal in als theta. maar wat als je een hele range aan values kiest voor de theta?
dan moet je kijken naar elke postulated value van theta tussen … en … (dus alle values die de prior distribution verwacht) en dan vervolgens kijken naar de likelihood van deze date voor elke mogelijke value. dan kijken naar het gemiddelde van al deze likelihoods, weighted by the density at each point.
=marginalizing -> marginal likelihood (=average likelihood)
hoe kan het dat, als Betty bijv zegt dat theta <0.5, je in de marginal likelihood graph nog steeds values onder 0.5 ziet staan?
omdat theta = parameter, dus het gemiddelde van de populatie. in de marginal likelihood zie je alle mogelijke waardes. hoewel de probability van heads bijvoorbeeld 0.6 is, heb je nog steeds een kans om 3/10 keer heads te gooien in de gehele populatie.
statistical model =
A statistical model is a combination of a general statistical model (e.g., the binomial model) and a statement about a parameter value that describe a certain phenomenon. A statistical model can also be seen as a hypothesis: a specific statement about the value of the model parameters.
wanneer heb je een binominal model
als je een series of chance based events hebt, met een uitkomst met 2 mogelijkheden
wat is het uiteindelijke doel van een statistisch model, wat doen we hiermee?
We can use the accuracy of these predictions of the model to gauge the quality/plausibility of a model, relative to another model.
wat is k in de formule
k = data die je hebt gevonden (bv 8 keer heads gooien)
wat is n in de formule
n = de hoeveelheid data die je in totaal hebt verzamelt (bv 10 keer gooien)
difference in freq vs bayesian wat betreft de samples
freq = large samples usually needed
bayesian = not necessarily need large samples
difference in freq vs bayesian wat betreft de nature of the parameters in the model
freq = unknown nature, but fixed
bayesian = unknown and therefore random
difference in freq vs bayesian wat betreft de population parameter
freq = one true value
bayesian = a distribution of values, reflecting uncertainty
difference in freq vs bayesian wat betreft: uncertainty is defined by
freq: the sampling distribution based on the idea of infinite repeated sampling
bayesian: a probability distribution for the population parameter
difference in freq vs bayesian wat betreft de estimated intervals
freq: confidence interval
bayesian: credibility interval
confidence interval interpretatie
over an infinity of samples taken from the population, 95% of these contain the true population value
credibility interval interpretatie
a 95% probability dat de population value is within the limits of the interval
bayes factor =
how well did model 1 predict the data / how well did model 2 predict the data
= dus de likelihood van de gevonden data. (bv likelihood van 8 keer heads gooien)
wat is de interpretatie van BF10= 4
this means that the observed data are about 4 times more likely under model 1 than under model 0.
wat is de interpretatie van BF01=0.25
de data zijn 0.25 keer meer likely onder model 1, dan onder model 0.
hoe ga je van BF01 naar BF10
1 / Bayesfactor
wat als de modellen de data even goed voorspellen
BF=1
Generally, we want the Bayes factor to be as far away from 1 as possible, since this indicates more and more evidence in favor of one model over another.
strong evidence for H0=
BF10 = 1/30 tot 1/10
moderate evidence for H0 =
BF10= 1/10 tot 1/3
weak evidence voor H0 en H1
BF10= 1/3 tot BF10 = 3
moderate evidence for H1=
BF10 = 3 tot 10
strong evidence for H1=
BF10= 10 tot 30
maar wat is belangrijk bij de interpretatie van evidence voor H1 en H0
niet absolute regels, geen all or nothing conclusions.