HC2 Basic and Advanced Statistical Testing Flashcards

You may prefer our related Brainscape-certified flashcards:
1
Q

Wat is statistisch significant?

A

Te onwaarschijnlijk om toeval te zijn. Meestal een alfa-waarde van 0.05. Let op dit is wel een arbitraire grens. En dus nergens op gebaseerd.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wat is een nul-hypothese?

A

Dit zegt iets als ‘er is geen verband of verschil tussen 2 gemeten waardes of groepen.’

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wat is de p-waarde

A

De waarschijnlijkheid dat we deze data of extremere data meten als de nul-hypothese klopt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wat is een normale distributie?

A

Verdeling van de data is ‘normaal’. Dit houd in dat de top ligt op het gemiddelde, en de vorm wordt bepaald door de standaarddeviatie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wat is een z-test?

A

Statistische methode die gebruikt wordt om te bepalen of er een significant verschil is tussen twee datasets. De uiteindelijke Z-waarde heeft een gemiddelde van 0 en een standaard deviatie van 1.

Bij een Z van 1.68 is de p = 0.047 bij een enkel zijdige test.

Bij de z-test moet de ware standaard deviatie bekend zijn.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hoe bereken je de Z test-statastic?

A

Z = (X - μ) / S = (obs. mean - model mean) / sd of the mean

Hierin is sd of the mean = sqrt (σ^2 / N)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wat is een t-test

A

Statistische methode die gebruikt wordt om te bepalen of er een significant verschil is tussen twee datasets. We gebruiken daarom de t-distributie, hierbij nemen we een grotere mate van onzekerheid.

Bij de t-test is de ware standaard deviatie niet bekend.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wat gebeurt er als er meer degrees of freedom zijn?

A

De t-distributie gaat meer op de z-distributie lijken.
Vanaf df = 30, wordt er gezegt dat de t-distributie gelijk is met de z-distributie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hoe bereken de degrees of freedom?

A

df = n -1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hoe bereken je de t-waarde anders dan de z-waarde?

A

Je moet nu een estimated sd berekenen, welke weer in de sd of the mean ingevuld moet worden.

Nu komt er dus bij: σ = sqrt(som van (xi - X)^2)/ df

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Welke t-waarde heb je nodig voor een tweezijdig significante t-test?

A

t = 2.86

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wat is continu?

A

Elke mogelijke reeële waarde die er is.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wat is nominaal?

A

Oftewel binair: wel of niet, 0 of 1 etc.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hoe bereken je de two-sampeld t-waarde?

A

t = obs.mean 1 - obs.mean 2 / sd of the difference in means = (X1 - X2) / S

Hierin is S= sqrt((N1-1)σ1^2 + (N2-1)σ2^2) / N1 + N2 -2) * (1/N1 + 1/N2))

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wat is Fisher’s exact test?

A

Test voor het zien van een relatie tussen twee nominale variabelen.
Dit is een exacte test, welke er op berust om te kijken op hoeveel mogelijke manier er zijn om de uitkomst te krijgen gedeeld door alle mogelijke uitkomsten. Dit kan heel lang duren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wat zijn contingency tables?

A

Een soort kruistabellen. Hierin staat bijvoorbeeld hoeveel studenten en staff aanwezig of afwezig waren.

17
Q

Wat is de Chi-squared test

A

Test voor het zien van een relatie tussen twee nominale variabelen. Welke sneller is dan de Fisher’s test. Deze test kan je gebuiken wanneer de steekproef groter is dan 20.

18
Q

Hoe bereken je de chi-squared waarde?

A

x^2 = som of ((obsered - expected)^2)/ expected)

19
Q

Wat is multiple testing correction

A

Wanneer je meerdere testen doet is de kans dat je een foute conclusie trekt groter.

Als je bijv. 1 miljoen testen doet met een alfa van 5%, dan verwacht je 50.000 fouten.

20
Q

Wat is een type 1 fout?

A

Fout positief, wordt vaak gezien als erger.

21
Q

Wat is een type 2 fout?

A

Fout negatief.

22
Q

Wat is de Benferroni correctie?

A

Deze correctie houdt rekenening met multiple testing correction door een nieuwe alfa waarde te kiezen. Dit doe je door de alfa waarde te delen door het aantal gedane testen. Als alternatief kan je de p-waarde keer het aantal testen doen.

Dit is een Family-Wise Error rate correctie

23
Q

Wat is de benjamini-Hochberg correctie?

A

Een manier om te corrigeren voor multiple testing, deze kijkt naar de false discovery rate. Hierbij maak je gebruik van een p-waarde die meegroeit met het aantal testen.