Lecture 10: ANOVA: F distribution and one way independent Flashcards

1
Q

wat is de algemene vraag bij een ANOVA

A

verschillen de populatiegemiddelden van meer dan 2 groepen significant van elkaar?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

wat is de gedetaileerde vraag bij ANOVA

A

krijg je meer predictive value als je kijkt naar het gemiddelde van de groepen, vergeleken met het grote gemiddelde van de hele steekproef? of maakt dat niet zoveel verschil?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

verschil ANOVA en independent t test

A

bij ANOVA kan je meer dan 2 groepen met elkaar vergelijken. bij independent t test niet

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

wat doet de standaard deviatie/variance, wat is hun doel

A

om het verschil tussen de observatie en de grant mean te kwantificeren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

total sum of squares algemene beschrijving =

A

sum all the distances between the observations and the grand means, and square them

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

wat betekent het dat de sum of squares minimized is

A

this will never get lower!! want de mean is de value die al het dichtste bij alle waarden zit. dus hij kan niet lager worden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

error sum of squares =

A

the difference between the observed value and the predicted value of the group mean. It is also called the sum of squares residual (SSR) as it is the sum of the squares of the residual, that is, the deviation of predicted values from the actual values.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

dus welke sum of squares kijkt naar wat

A

total sum of squares= grant mean
error sum of squares = group mean

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

wat is total sum of squares - error sum of squares

A

model sum of squares, dit laat dus zien hoeveel het model in te brengen heeft in het verhaal. als er niet zo’n groot verschil zit tussen de total en error sum of squares, heeft de model sum of squares dus niet zoveel toe te voegen, want dan is die waarde klein.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

adding an extra parameter to your model is ….

A

always going to lead to a etter approximation of the data!
but is it worth it????

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

als de TSS en ESS hetzelfde zijn…

A

dan is de MSS = 0, dus dan voegt het nieuwe model niks toe: de means of the groups are equal to the grant mean.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

welk model wil je altijd kiezen

A

het meest simpele model. dus als er geen groot verschil is, dan wil je gewoon gaan voor de grant mean omdat dat het makkelijkste is.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

one way independent ANOVA: wat meet je?

A

compare 2 or more independent groups.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

assumptions ANOVA

A
  • continous variable
  • random sample
  • normally distributed: shapiro wilk / Q Q plots
  • equal varaince within the groups: Levene’s test
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

andere benaming voor SSerror=

A

SSwithin

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

andere benaming voor SSmodel=

A

SSbetween

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

hoe bereken je SSmodel in R

A
  1. n berekenen: length(group1) (gaat om het aantal participanten in de groep!!)
  2. mean(group1)
  3. mean(group)

vervolgens alles in de formule zetten, en voor elke group de SS berekenen. daarna summen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

dus waar staat ng voor, of n1/n2 etc

A

aantal participanten per group!!!!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

hoe kan je F visualizen in R

A

visualize.f(F, df_model, df_error, section=’upper’)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

wat betekent een non significante Levene’s test

A

A non-significant p value of levene’s test show that the variences are indeed equal and there is no difference in variances of both groups

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

hoe worden de df van een ANOVA gerapporteerd

A

vanaf boven naar beneden: df model, daarna df error

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

hoe moet je de effecten van een ANOVA rapporteren

A

There was a/no significant effect of x level on the y level, with F(df model, df error)= … and p= …
According/Contrary to expectations, planned contrasts revealed that ____________

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

F= (2 formules)

A

MSmodel/MSerror, of SIGNAL / NOISE

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

waar staat MS voor

A

Mean Sum of Squares

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

dfmodel formule =

A

k-1

k= aantal condities

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

df error formule =

A

N - k

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

waar ligt de F distribution aan?

A

The F-distibution is different for different sample sizes and number of groups, because it depends on dfmodel (aantal condities) en dferror (aantal condities + sample size)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

SSmodel formule

A

som:

nk*(x̄k - x̄)^2

nk = aantal participanten bij elke conditie
x̄k = mean van bepaalde conditie
x̄ = grant mean

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

formule SSerror=

A

som:

sk^2 * (nk - 1)

sk^2 = variance per groep
nk = aantal participanten per groep

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

dus, bij normale one way anova, heb je alleen de N nodig bij….

A

berekenen df error! (N-k)
in de formules voor de SS gebruik je gewoon het aantal participanten per groep.

31
Q

hoe bereken je SS total =

A

SSmodel + SStotal

32
Q

mean squares van model =

A

SSmodel/dfmodel

33
Q

mean squares van error =

A

SSerror/dferror

34
Q

mean squares van total=

A

SStotal/dftotal

35
Q

wat is de interpretatie van de F value

A

hoeveel beter is jouw model in het voorspellen van de waardes, vergeleken met de grant mean?

36
Q

wat als F=1

A

dan is MSmodel=MSerror. dan predicten ze op dezelfde wijze, en is er dus geen verschil

37
Q

ANOVA is hetzelfde als….

A

een regression!

38
Q

the larger the F statistic, the …

A

greater the varaition between two sample means relative to the variation of the samples -> more evidence for a difference between the group means

39
Q

wat is de H0 bij een ANOVA

A

de grant mean is niet significantly different from the grant mean

40
Q

hoe ziet een F distribution er uit

A

alleen maar vanaf 0 (want squares), 0 betekent geen verschil. verder gaat hij vanaf 0 naar beneden

41
Q

wat is belangrijk bij contrasts

A

dat de values samen = 0

dus: 2, -1, -1 of 1, 0.5, 0.5 etc

42
Q

wat is de relatie tussen MS en variance?

A

MStotal = sx^2

43
Q

wat zijn contrasts

A

Planned comparisons of subgroups in the data (ook wel follow-up tests)

44
Q

3 functies van contrasts

A

Exploring differences of theoretical interest
Higher precision
Higher power

45
Q

wat is belangrijk bij contrasts

A

dat de values samen = 0

46
Q

wat zijn post hoc analyses

A

Unplanned comparisons

47
Q

2 doelen van post hoc analyses

A

Exploring all possible differences
Adjust T value for inflated type 1 error
Same procedure as contrasts, but: exploratory vs. exploratory research

48
Q

wat is zo bijzonder aan de F distribution

A

hij is niet skewed, want hij kan niet negatief zijn (squares!!)
dus daarom alleen positief, vanaf 0

49
Q

welke df does sample size affect

A
  • not df 1 (want model df = k-1)
  • wel df 2 (want error df = N - k)
50
Q

wat is de H0 van ANOVA

A

x̄1 = x̄2 = x̄3 etc

51
Q

is ANOVA robust?

A

no, kan nog steeds fout zijn als je de assumptions niet haalt.

52
Q

p value interpretation

A

measures the probability of obtaining the observed results, assuming that the null hypothesis is true

53
Q

an F test is always…

A

two sided!!!

54
Q

wat vonden simons et al over false negative vs correctly negative

A

vaker false negative dan correctly negative

55
Q

it is easy to accumulate statistically significant results for a false hypothesis

A

oke

56
Q

most costly error =

A

type 1 error.

57
Q

waarom is false positive error het meest kostbaar

A
  • false positives are persistent in literature (want failure to replicate kan komen door veel verschillende dingen)
  • null findings worden niet gepost
  • false positives waste resources
  • publishing false positives = losing credibility for journals
58
Q

hoezo verspillen false positives zoveel resources

A
  • investeren in meer onderzoek wat tot niks leidt
  • ineffectieve policy changes
59
Q

waardoor proberen scientists heel veel dingen en rapporteren ze alleen wat werkt

A
  1. ambiguity in how to make a decision (researchers degree of freedom)
  2. desire to find a statistically significant effect
60
Q

effect size n^2 =

A

The amount of explained variance as a general effect size measure:

R^2 = SSmodel/SStotal

square root hiervan = cohens d

want alleen SS error is influenced by sample!!! door df = N - k

61
Q

omega squared w^2 =

A

less biased towards sample than n^2!

62
Q

effect size r =

A

A more interpretable effect size measure, gives the effect size for a specific contrast

63
Q

if both the df would be infinite, F distribution would be…

A

normal distributed

64
Q

error variance houdt in…

A

hoeveel is het model nog steeds niet accounting for the data

65
Q

wat zijn mogelijke interpretaties van een hoge F

A
  • een group verschilt heeel veel van de rest
  • elke groep verschilt een beetje van elkaar

etc. dus je weet nog niet veel over de hypothesen met de F statistic, alleen of er wel of niet ergens een verschil is!!!

66
Q

dus waar zegt F wel wat over en waar niet

A

F zegt wel iets over de magnitude, niks over de direction

67
Q

Q-Q plot doel

A

compare the distribution to a normal distribution

68
Q

wat doe je bij post hoc tests

A

instead of asking specific questions (contrasts) you just do all the comparisons

69
Q

dus wat is meer exploratory: contrasts of post hoc

A

post hoc, want daar vraag je geen specifieke vragen bij. je checkt gewoon zo’n beetje alles

70
Q

wat moet je bij post hoc dus ook doen

A

adjust for the inflated type one error!! bv bonferroni

71
Q

large F ratio =/= large effect

A

want hangt van veel dingen af, bv ook sample size etc

72
Q

wat als de assumption of homogeneity wordt overschreden (levenes of sd’s vergelijken)

A

dan correction gebruiken: brown-forsythe of welch

73
Q
A