Week 3 Flashcards

1
Q

Wat zijn de 5 algemene stappen om significantie te testen?

A
  1. Aannames definiëren.
  2. Hypotheses opstellen
  3. Toetsingsgrootheid berekenen
  4. p-waarde berekenen
  5. Conclusie trekken
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wat is de toetsingsgrootheid bij gemiddeldes en proporties?

A

Bij gemiddelde is het de t-score en bij proporties is het de z-score

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wat is de type I en type II fout en wat is de kans hierop? Wat voor “false …” is dit

A
  1. Type I fout is de kans dat de nul hypothese waar is, maar je verwerpt hem. Deze kans staat gelijk aan ⍺.
    Dit is false positive
  2. Type II foutis de kans dat de nul hypothese wel waar is maar je verwerpt hem niet. De kans hierop is 1 - power/onderscheidend vermogen.
    Dit is false negative
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Welke 3 factoren horen bij een lage power/onderscheidingsvermogen?

A
  1. Een kleine steekproef
  2. Een klein werkelijk effect (kleine effect grootte)
  3. Grote spreding van observaties (s)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wat zijn 4 mogelijke assumpties van toetsingsgrootheden?

A
  • Type data: Kwalitatief of Kwantitatief.
  • Randomisatie: Gaat uit van een steekproef die op aselecte manier verkregen is
  • Populatie verdeling: Gaat uit van een bepaalde verdeling zoals een normaalverdeling
  • Steekproefgrootte: Soms klopt een assumptie alleen vanaf een bepaalde steekproefgrootte.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Welk symbool geeft de standaardfout weer, en welke de geschatte standaardfout? En hoe bereken je de geschatte standaardfout (gemiddelde)?

A
  • σȳ = echte standaardfout
  • se is geschatte standaardfout
  • se = s/√n
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hoe bereken je de t-score bij een nul hypothese (gemiddelde)?

A

t = ȳ - µ0 / se

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hoe bereken je de standaardfout en de z-score voor een enkele proportie bij nul hypothese?

A
  • se0= √𝜋0(1-𝜋0) / n
  • z= 𝜋ˆ-𝜋0 / se0
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wat is de formule van power? en de formule van de kans op een type II fout?

A
  • Power = 1 - P(type II error)
  • P(type II error) = 1 - Power
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Hoe bereken je de z-score als je twee steekproefproporties vergelijkt op basis van de nul hypothese? En hoe bereken je de standaardfout?

A

z = 𝜋dˆ- 𝜋0 / se0
se0 = √𝜋0(1 - 𝜋0) /n1 + 𝜋0(1-𝜋0)/n2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Waar op moet je letten als je de z- of t-score p-waarde afleest in de tabel?

A

Dit is de p-waarde voor een eenzijdige toets dus je moet hem verdubbelen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Waar staat β voor in de type twee fout.

A

β staat voor de kans op een type II fout.
Het staat gelijk aan 1 - power.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Waarom is statistische significantie niet altijd praktische significantie?

A
  • Omdat je met nieuwe Big Data eigenlijk bij elk verschil een statistisch verschil hebt.
    Hierdoor kan een verschil in de praktijk amper merkbaar zijn en toch significant.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wat is p-hacking

A

Je doet meerdere toetsen in 1 studie en rapporteert alleen degene die significant zijn, terwijl de meeste niet significant zijn. Dan is de kans op toeval groot.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Waar staat de p-waarde voor?

A

De kans op een bepaalde waarde OF EXTREMER, gegeven dat de nul hypothese waar is.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Waar staat robuustheid voor?

A

In hoeverre een statistische toets nog steeds werkt als een of meerdere aannames worden geschonden

17
Q

Wanneer is het niet erg als een variabele discreet gemeten is, en wanneer is het niet erg als de variabele niet normaal verdeeld is?

A
  • Het is niet erg als een variabele discreet gemeten is, zo lang je minimaal ongeveer 5-7 waardes hebt.
  • Het is niet erg als je minimaal 30 proefpersonen hebt, omdat dan de steekproevenverdeling, ongeacht populatieverdeling, normaal verdeeld is.
18
Q

ALs je de standaarderror berekent voor afhankelijke en onafhankelijke steekproeven, wat is dan het verschil?

A
  • Bij onafhankelijke steekproeven bereken je de se op basis van de twee verschillende StandaardAFWIJKINGEN. Dit staat op formule blad.
  • Bij afhankelijke steekproeven ga je er van uit dat er één groep is voor de standaardAFWIJKING, dus je maakt eerst de Sd score, en die vul je in op de SE formule voor individuele steekproeven: se = Sd/√n
19
Q

Hoe kan je Sd berekenen en waar staat Sd voor? En waar staat ȳd voor?

A
  • In afhankelijke steekproeven is Sd het gemiddelde verschil tussen twee steekproeven van de zelfde persoon van het gemiddelde verschil af
  • Dit staat gelijk aan ȳ2 - ȳ1.
  • ȳd staat voor het steekproefgemiddelde van het verschil tussen twee groepen: en staat ook gelijk aan ȳ2 - ȳ1.
20
Q

Wanneer gebruik je de McNemar-toets en Binomiale toets en Fisher’s exacte formule?

A
  • Mcnemar-toets kan je gebruiken om direct tot z-score te komen als je twee afhankelijke steekproefproporties vergelijkt. (Niet bij kleine n)
  • Binomiale toets gebruik je bij kleine samples als je twee afhankelijke steekproefproporties vergelijkt.
  • Fisher’s exacte toets gebruik je als je twee onafhankelijke steekproefproporties vergelijkt met een kleine n
21
Q

Wat is de formule voor de t-toets als je het verschil tussen y1 en y2 vergelijkt met de nul hypothese? En wat is de nul hypothese?

A

Dan krijg je ȳd - μ0 / se
Met H0: μ1 = μ2, dus μ2 - μ1 is nul

22
Q

Hoe bereken je de Formule voor de t-toets als je één observatie vergelijkt met de nul hypothese?

A

t = ȳ - μ0 /se

23
Q

Hoeveel vrijheidsgraden heb je als je twee onafhankelijke groepen met elkaar vergelijkt?

A
  • n1 + n2 - 2
  • En bij afhankelijke groepen is het gewoon n - 1