Lecture 16: Chi-square t4est Flashcards

1
Q

wanneer chi square test?

A

bij categorical independent and categorical dependent variables

één predictor variable!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Without other qualification, ‘chi-squared test’ often is used as short for Pearson’s chi-squared test.

A

oke

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

wat is een andere naam voor de chi square test

A

Lack-of-fit sum of squared errors

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

waarom heeft chi square ook die andere naam

A

Lack-of-fit sum of squared errors

omdat het gaat over wat het model predict (expectation) en hoeveel de data deviates hiervan (data)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

formule x^2

A

x^2 = sum (observed - model)^2/model

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

waar gaat chi square om, wat meet het?

A

observed frequencies en frequencies expected by the model -> hoeveel variabelen uit de ene categorie horen bij de andere categorie?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

df onder de x^2 distribution

A

df = (r-1)(c-1)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

dus wat is de df als beiden variabelen binary zijn

A

df = 1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

as the degree of freedom increases, the chi square distribution…

A

moves to the right

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

wat als degrees of freedom = infinity

A

normal distribution

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

waar kijk je naar bij een chi square test

A

wat is de probability van jouw gevonden chi square waarde of meer extreme, given that the H0 is true?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

wanneer kijk je naar de alternatieve hypothese?

A

als we de power willen weten: de probability of rightfully rejecting the H0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

welke sums van frequency zijn niet altijd gelijk?

A

de dependent variable, want daar heb je geen controle over

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

hoe bereken je Eij

A

Eij = (row total i x column total j)/n

dit gaat dus om de som van de rij * de som van de kolom! hier krijg je uit wat de tabel zou zijn volgens het model, als de events independent zouden zijn. dus dan krijg je de verwachte/predicted values.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

wat is de probability of event A given B, if events A and B are independent of each other?

A

P(A|B) = P(A)

want ze zijn toch independent, dus dat maakt dan niet uit. gaat bijvoorbeeld om de probability dat iemand niest (A) gegeven dat Johnny nu een sprongetje maakt (B).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

P(A and B)

A

P(A)*P(B)

maar alleen als deze events independent zijn!!!!!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

wat krijg je uit de formule voor Eij?

A

de expected frequencies under the null model, if there is no association between the variables (= independent variables). dit vergelijk je dan met jouw gevonden data.

18
Q

wat bereken na het berekenen van Eij

A

observed data - model predctions

dan krijg je de discrepancy tussen expected and observed. dat square je, en deel je door model frequency.

x^2 = (observed-model)^2/observed

19
Q

hoe visualize je dit in r?

A

visualize.schiq(chi.squared,df,section=upper)

19
Q

the chi square statistic and the f statistic are always…..

A

two sided!!!

want de sampling distribution begint bij 0, en heeft alleen maar positieve nummers

20
Q

wat is het verschil tussen one sided en two sided

A

A one-tailed test looks for an “increase” or “decrease” in the parameter whereas a two-tailed test looks for a “change” (could be increase or decrease) in the parameter.

daarom is de f statistic en chi square two sided: je kijkt alleen maar of er een verandering is. daarna ga je met contrasts kijken waar die verandering is.

20
Q

wat impliceert het feit dat de chi square en f statistic altijd two sided zijn

A

dat een significante p value niks zegt over welke kant groter/meer effect heeft dan de ander!! het geeft alleen aan dat er ergens een verschil is.

dus in dit voorbeeld: we weten niet of odd/even numbers meer feminine of masculine zijn, we weten alleen dat er ergens een verschil zit.

20
Q

Fishers exact test: wanner gebruik je die?

A

bij small samples, when the x^2 distribution does not yet suffice.

want als je heel weinig observaties hebt, zijn er heel weinig mogelijke uitkomsten voor de F statistic. -> als je de sample size te klein hebt, heb je geen goede chi square distribution. daarom gebruik je dan fisher.

21
Q

wat doet fishers test?

A

calculates all the possible permutations, dus alle mogelijke uitkomsten, gebaseerd op de telling. dit geeft dan de p value.

22
Q

wat is de afkapwaarde voor fishers?

A

cell size < 5

23
Q

yates correction

A

hier gebruik je het absolute value of de model, en subtract 0.5. en dat square je dan.

24
Q

waarvoor gebruik je Yates correction

A

to prevent overestimation of statistical significance for small data.

25
Q

wanneer gebruik je Yates correction

A

at least one cell of hte table has an expected count smaller than 5.

26
Q

limitatie Yates corrections

A

may tend to overcorrect -> overly conservative results.
meer gebruiken om te kijken of jouw p value opeens enorm veranderd en niet meer significant is.

27
Q

likelihood ratio=

A

sum of natural logarithms of (observed/model)

28
Q

standardized residuals =

A

(observed-model) / sqrt(model)

29
Q

hoe bereken je de odds ratio

A

ad / bc

30
Q

wat laten standardized residuals zien

A

weg van de measurement scale, in which cells do we find the biggest deviation between models and data?

31
Q

wat is een andere manier om de odds ratio te berekenen:

A

category 1 dependent variable / category 2 dependent variable (dus de rijen!!)

dus in dit voorbeeld: feminine odds/masculine odds

32
Q

hoe interpreteer je deze odds ratios per categorie

A

In the feminine responses, there are +- 2.09 times as many even numbers than odd numbers. In the masculine responses, there are +- 0.4 times as many even numbers than odd numbers.

33
Q

je kan dit ook doen met de categorieen van de independent variable (odds ratio)

A

oke

34
Q

wat is de interpretatie van de gehele odds ratio

A

For this data, odd numbers received the feminine association +- 5.25 times more often than even numbers received the feminine association.

The odds ratio also accounts for the scores in the other condition: we do not only take into account the femininity of the odd numbers, but also the femininity of the even numbers.

35
Q

test statistic is influenced by … and effect size is influenced by…

A

magnitude + sample size (effect bij: big effect en small sample, or small effect and big sample size)

magnitude

dus effect size wordt alleen beinvloed door magnitude!!!

36
Q

hoe krijg je de odds ratio in jasp

A

onder statistics: odds ratio

dit kan alleen bij 2x2 design!

37
Q

highly significance in chi squared betekent niet groot effect!!! want het kan ook gewoon een grote sample zijn geweest. waar moeten we dan naar kijken?

A

naar de effect size: odds ratio.

38
Q
A