HC2 Basic and Advanced Statistical Testing Flashcards

Question 1

Q

Wat is statistisch significant?

Answer

A

Te onwaarschijnlijk om toeval te zijn. Meestal een alfa-waarde van 0.05. Let op dit is wel een arbitraire grens. En dus nergens op gebaseerd.

Question 2

Q

Wat is een nul-hypothese?

Answer

A

Dit zegt iets als ‘er is geen verband of verschil tussen 2 gemeten waardes of groepen.’

Question 3

Q

Wat is de p-waarde

Answer

A

De waarschijnlijkheid dat we deze data of extremere data meten als de nul-hypothese klopt.

Question 4

Q

Wat is een normale distributie?

Answer

A

Verdeling van de data is ‘normaal’. Dit houd in dat de top ligt op het gemiddelde, en de vorm wordt bepaald door de standaarddeviatie.

Question 5

Q

Wat is een z-test?

Answer

A

Statistische methode die gebruikt wordt om te bepalen of er een significant verschil is tussen twee datasets. De uiteindelijke Z-waarde heeft een gemiddelde van 0 en een standaard deviatie van 1.

Bij een Z van 1.68 is de p = 0.047 bij een enkel zijdige test.

Bij de z-test moet de ware standaard deviatie bekend zijn.

Question 6

Q

Hoe bereken je de Z test-statastic?

Answer

A

Z = (X - μ) / S = (obs. mean - model mean) / sd of the mean

Hierin is sd of the mean = sqrt (σ^2 / N)

Question 7

Q

Wat is een t-test

Answer

A

Statistische methode die gebruikt wordt om te bepalen of er een significant verschil is tussen twee datasets. We gebruiken daarom de t-distributie, hierbij nemen we een grotere mate van onzekerheid.

Bij de t-test is de ware standaard deviatie niet bekend.

Question 8

Q

Wat gebeurt er als er meer degrees of freedom zijn?

Answer

A

De t-distributie gaat meer op de z-distributie lijken.
Vanaf df = 30, wordt er gezegt dat de t-distributie gelijk is met de z-distributie.

Question 9

Q

Hoe bereken de degrees of freedom?

Answer

A

df = n -1

Question 10

Q

Hoe bereken je de t-waarde anders dan de z-waarde?

Answer

A

Je moet nu een estimated sd berekenen, welke weer in de sd of the mean ingevuld moet worden.

Nu komt er dus bij: σ = sqrt(som van (xi - X)^2)/ df

Question 11

Q

Welke t-waarde heb je nodig voor een tweezijdig significante t-test?

Question 12

Q

Wat is continu?

Answer

A

Elke mogelijke reeële waarde die er is.

Question 13

Q

Wat is nominaal?

Answer

A

Oftewel binair: wel of niet, 0 of 1 etc.

Question 14

Q

Hoe bereken je de two-sampeld t-waarde?

Answer

A

t = obs.mean 1 - obs.mean 2 / sd of the difference in means = (X1 - X2) / S

Hierin is S= sqrt((N1-1)σ1^2 + (N2-1)σ2^2) / N1 + N2 -2) * (1/N1 + 1/N2))

Question 15

Q

Wat is Fisher’s exact test?

Answer

A

Test voor het zien van een relatie tussen twee nominale variabelen.
Dit is een exacte test, welke er op berust om te kijken op hoeveel mogelijke manier er zijn om de uitkomst te krijgen gedeeld door alle mogelijke uitkomsten. Dit kan heel lang duren.

Question 16

Q

Wat zijn contingency tables?

Answer

Study These Flashcards

A

Een soort kruistabellen. Hierin staat bijvoorbeeld hoeveel studenten en staff aanwezig of afwezig waren.

Question 17

Q

Wat is de Chi-squared test

Answer

Study These Flashcards

A

Test voor het zien van een relatie tussen twee nominale variabelen. Welke sneller is dan de Fisher’s test. Deze test kan je gebuiken wanneer de steekproef groter is dan 20.

Question 18

Q

Hoe bereken je de chi-squared waarde?

Answer

Study These Flashcards

A

x^2 = som of ((obsered - expected)^2)/ expected)

Question 19

Q

Wat is multiple testing correction

Answer

Study These Flashcards

A

Wanneer je meerdere testen doet is de kans dat je een foute conclusie trekt groter.

Als je bijv. 1 miljoen testen doet met een alfa van 5%, dan verwacht je 50.000 fouten.

Question 20

Q

Wat is een type 1 fout?

Answer

Study These Flashcards

A

Fout positief, wordt vaak gezien als erger.

Question 21

Q

Wat is een type 2 fout?

Answer

Study These Flashcards

A

Fout negatief.

Question 22

Q

Wat is de Benferroni correctie?

Answer

Study These Flashcards

A

Deze correctie houdt rekenening met multiple testing correction door een nieuwe alfa waarde te kiezen. Dit doe je door de alfa waarde te delen door het aantal gedane testen. Als alternatief kan je de p-waarde keer het aantal testen doen.

Dit is een Family-Wise Error rate correctie

Question 23

Q

Wat is de benjamini-Hochberg correctie?

Answer

Study These Flashcards

A

Een manier om te corrigeren voor multiple testing, deze kijkt naar de false discovery rate. Hierbij maak je gebruik van een p-waarde die meegroeit met het aantal testen.

HC2 Basic and Advanced Statistical Testing Flashcards

(23 cards)