Lecture 16: Chi-square t4est Flashcards
wanneer chi square test?
bij categorical independent and categorical dependent variables
één predictor variable!
Without other qualification, ‘chi-squared test’ often is used as short for Pearson’s chi-squared test.
oke
wat is een andere naam voor de chi square test
Lack-of-fit sum of squared errors
waarom heeft chi square ook die andere naam
Lack-of-fit sum of squared errors
omdat het gaat over wat het model predict (expectation) en hoeveel de data deviates hiervan (data)
formule x^2
x^2 = sum (observed - model)^2/model
waar gaat chi square om, wat meet het?
observed frequencies en frequencies expected by the model -> hoeveel variabelen uit de ene categorie horen bij de andere categorie?
df onder de x^2 distribution
df = (r-1)(c-1)
dus wat is de df als beiden variabelen binary zijn
df = 1
as the degree of freedom increases, the chi square distribution…
moves to the right
wat als degrees of freedom = infinity
normal distribution
waar kijk je naar bij een chi square test
wat is de probability van jouw gevonden chi square waarde of meer extreme, given that the H0 is true?
wanneer kijk je naar de alternatieve hypothese?
als we de power willen weten: de probability of rightfully rejecting the H0
welke sums van frequency zijn niet altijd gelijk?
de dependent variable, want daar heb je geen controle over
hoe bereken je Eij
Eij = (row total i x column total j)/n
dit gaat dus om de som van de rij * de som van de kolom! hier krijg je uit wat de tabel zou zijn volgens het model, als de events independent zouden zijn. dus dan krijg je de verwachte/predicted values.
wat is de probability of event A given B, if events A and B are independent of each other?
P(A|B) = P(A)
want ze zijn toch independent, dus dat maakt dan niet uit. gaat bijvoorbeeld om de probability dat iemand niest (A) gegeven dat Johnny nu een sprongetje maakt (B).
P(A and B)
P(A)*P(B)
maar alleen als deze events independent zijn!!!!!