1: Eén groep, power & effectgrootte Flashcards

1
Q

p-waarde

A

Beschrijft hoe zeldzaam de geobserveerde steekproefproportie (of extremer) zou zijn als H0 waar is

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Samenvatting van data: (2)

A

1) Parameter
* Numerieke samenvatting van de populatie
* Vaak onbekend
* Meet je eigenlijk nooit, gebruik je statistic voor
* PP- parameter, populatie
* Gemiddelde (μ) en standaard deviatie (σ)

2) Statistic (steekproefwaarde)
* Numerieke samenvatting van een steekproef uit de populatie
* SS-Statistic, steekproef
* Gemiddelde (x ̅) en standaard deviatie (s)
* Hoe groter de steekproef, hoe beter de voorspelling
* Grote variatie in populatie zorgt voor minder precieze voorspelling

–> Samenvattende waarde, zoals gemiddelde, modus of mediaan

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Stappen:
Hypothesetoetsing 1 categorische variabele- z-toets voor 1 proportie

A

1) Assumpties checken
* De variabele is categorisch (bijv. wel of niet)
* De steekproef is willekeurig getrokken
* Normaal benaderd kan worden np ≥15 en n(1−p_0 )≥15 of tweezijdig

2) Hypothesen opstellen
Nulhypothese (H0)
□ H_0:p=p_0
Alternatieve hypothese (HA of H1)
□ Eenzijdig: H_A:p>p_0 of H_A:p<p_0
□ Tweezijdig: H_A:p≠p_0

3) Toetsingsgrootheid (tg) (Test Statisic) berekenen
* Hoe groter z-score, hoe verder er vanaf dat H0 waar is
* Als H0 waar is, dan is z-score 0
* z= (p ̂−p_0)/〖se〗_0
* 〖se〗_0=√((p_0 (1−p_0))/n)

4) P-waarde opzoeken
* Beschrijft hoe zeldzaam de geobserveerde steekproefproportie (of extremer) zou zijn als H0 waar is
* Hoe kleiner P-waarde, hoe sterker bewijs tegen nulhypothese
* Passend bij z-waarde in tabel
- Bij hypothese ‘<’ in tabel geïnteresseerd in linkerkant
- Bij hypothese ‘>’ in tabel geïnteresseerd in rechterkant, dus 1-p
- Bij hypothese ‘≠’ in tabel geïntresseerd in beide kanten dus 2p (p-waarde verdubbelen)

5) Conclusies trekken
* Rapporteer en interpreteer Interpreteren
* Beslisregels verwerpen is
a) p-waarde is kleiner dan vooraf gekozen significantieniveau (α) (meestal 0.05/5%)
b) Toetsingsgrootheid (tg) extremer is dan grenswaarde/kritieke waarde
* Anders verwerp je de nulhypothese niet (niet accepteren!)
* Bij verwerpen: Gevonden resultaat verschilt statisch significant van de waarde van de nulhypothese

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Stappen:
Hypothesetoetsing 1 kwantitatieve variabele- t-toets voor 1 gemiddelde

A

1) Assumpties checken
* De variabele is kwantitatief
* De steekproef is willekeurig getrokken
* De populatieverdeling is normaal
- Vooral belangrijk bij kleine steekproef en eenzijdig toetsen
- N>30, dan robuust
- Tweezijdig, dan robuust

2) Hypothesen opstellen
Nulhypothese (H0)
□ H_0:μ=μ_0

Alternatieve hypothese (HA of H1)
□ Eenzijdig: H_A:μ>μ_0 of H_A:μ<μ_0
□ Tweezijdig: H_A:μ≠μ_0

3) Toetsingsgrootheid (tg) (Test Statisic) berekenen
* Hoe groter t-score, hoe verder er vanaf dat H0 waar is
* t=(x ̅ −μ_0)/〖se〗_x ̅
* 〖se〗_x ̅ = (s )/√n

4) P-waarde opzoeken
* Beschrijft hoe zeldzaam de geobserveerde steekproefproportie (of extremer) zou zijn als H0 waar is
* Hoe kleiner P-waarde, hoe sterker bewijs tegen nulhypothese
* Passend bij t-waarde in tabel
- Bij hypothese ‘<’ in tabel geïnteresseerd in linkerkant
- Bij hypothese ‘>’ in tabel geïnteresseerd in rechterkant, dus 1-p
- Bij hypothese ‘≠’ in tabel geïntresseerd in beide kanten dus 2p (p-waarde verdubbelen)
* Df=N-1

5) Conclusies trekken
* Rapporteer en interpreteer Interpreteren
* Beslisregels verwerpen is
a) p-waarde is kleiner dan vooraf gekozen significantieniveau (α) (meestal 0.05/5%)
b) Toetsingsgrootheid (tg) extremer is dan grenswaarde/kritieke waarde

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Power

A

Kans op correct weerleggen van nulhypothese. Kans = 1−β

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Type 1 en 2 fout

A

Type 1 fout
(Vals positief)
Kans = α
wel verwerpen, H0 wel waar

Type 2 fout
(Vals negatief)
Kans = β
niet verwerpen, H0 niet waar

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Stappenplan Power uitrekenen (bij proportie) (7)

A

1) Bepaal kritieke z-waarde die hoort bij significantieniveau (α) (H0)
- p> rechteroverschrijdingskans van alfa (1- α)
- p< linker overschrijdingskans van alfa
- p ̂ moet minimaal z-score se0 boven/onder P0 liggen

2) Standaardfout berekenen (H0)
- SE=√((p_0 (1−p_0))/n)

3) Welke steekproefproportie (p ̂) hoort bij de kritieke z-waarde? Wanneer wordt p ̂ dus verworpen (H0)
- 〖p ̂=p〗_0+z−score ∗SE

4) Hoeveel standaardfouten p ̂ af van de werkelijke p? p wordt gegeven. (HA)
- Hoe groter p afligt van p0, hoe groter de power
- SE=√((p(1−p))/n)

5) Welke z-waarde hoort bij hoort bij de steekproefproportie (HA)
- z=(p ̂−p)/se
- P>P0= linkeroverschrijdingskans
- P<P0= rechteroverschrijdingskans

6) Kans op type 2 fout (β): (HA)
- P-waarde opzoeken bij z-score

7) Power= 1-Type 2 fout (β) (HA)
- Kans om een effect te vinden in de toets
- Al tevreden bij 0.80

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Onderscheidingsvermogen

A
  • Kans dat de nulhypothese terecht wordt verworpen. Zelfde als power
  • Bij klein onderscheidingsvermogen, zal een toets niet snel tot significante uitkomsten leiden, ook al is de nulhypothese onjuist
  • Kans = 1−β
  • De kans om nulhypothese te verwerpen wanneer deze daadwerkelijk onwaar is
  • De kans om een ´significant´ resultaat te vinden wanneer in populatie effect bestaat
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Soorten hypothesen (2)

A
  • Nulhypothese (H0)
    • Geeft 1 specifieke waarde voor parameter aan (proportie of gemiddelde) (=)
    • Representeert meestal de situatie als er geen effect/verschil is
    • Op basis van steekproefgegevens beslissen of deze moet worden verworpen
      § Wanneer overschreidingskans van gebruikte statistische toetsingsgrootheid kleiner is dan gekozen significantieniveau (alfa)
    • Nooit kunnen zeggen dat deze waar is, tenzij je gehele populatie meet
  • Alternatieve hypothese (HA of H1)
    • Geeft range van alternatieve waarden voor parameter aan (proportie of gemiddelde) (<, >, ≠)
    • Representeert meestal de situatie als er wel effect/verschil is
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Effectgroottes
W (Chi-kwadraat)
F (variantie-analyse)
Rxy (correlatie)
D (Cohen’s d)

A

W
□ Klein effect: 0.1
□ Middelmatig effect: 0.23
□ Groot effect: 0.5
F
□ Klein effect: 0.1
□ Middelmatig effect: 0.25
□ Groot effect: 0.4
Rxy
□ Klein effect: 0.1
□ Middelmatig effect: 0.3
□ Groot effect: 0.5
D (difference) (arbitrair)
□ Klein effect: 0.2
□ Middelmatig effect: 0.5
□ Groot effect: 0.8

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Onderscheidingsvermogen wordt beïnvloed door (5)

A

1) Steekproefgrootte
- Hoe groter steekproef, hoe kleiner standaardfout, hoe kleiner kans type 2 fout, dus kleiner onderscheidingsvermogen
- Groot effect in kleine sample kan door toeval zijn ontstaan
- Elk klein verschil kan statisch significant worden door grote steekproeven

2) Standaarddeviatie verkleinen
- Bijvoorbeeld gebruik betrouwbaardere instrumenten

3) Significantieniveau
- Grotere alfa gemakkelijker om significant resultaat vinden
- Grotere alfa, groter significantieniveau

4) Effectgrootte
- Hoe groter effect, hoe gemakkelijker effect te vinden, dus groter onderscheidingsvermogen
- Cohen’s d
- Correlatie
- Variantieanalyse (F)
- Chi-kwadraat (W)

5) Aard van toets
- Eenzijdig toetsen groter onderscheidingsvermogen dan tweezijdig
- Non-parametisch toetsen
§ Moeilijk om onderscheidingsvermogen te berekenen
§ Niet uitgaan van normaalverdeling
§ Afhankelijk van onbekende verdeling
§ Kleiner onderscheidingsvermogen dan parametrische toets

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Standaardfout

A
  • Afkorting: se (Standarderror)
  • Geschatte standaarddeviatie van een steekproevenverdeling
  • Afhankelijk van steekproefgrootte
  • Proportie: se=√(p ̂ (1−p ̂)/n)
  • Gemiddelde: se=s/√n
    s= standaarddeviatie steekproef
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Betrouwbaarheidsinterval voor categorische variabelen (Steekproevenverdeling van proportie/kansverdeling)

A

1) 90% betrouwbaarheidsinterval
○ p ̂±1.645(se)
○ Error probability (α) 0.10

2) 95% betrouwbaarheidssinterval
○ Proporties: p ̂±1.96(se)
§ np ̂≥15 & n(1−p ̂ )≥15
§ Minstens 15 ‘failures’ en 15 successen
○ Voor populatiegemiddelde (μ): § x ̅± t_0.025 (se)

3) 99% betrouwbaarheidsinterval
○ p ̂±2.58(se)
○ Error probability (α) 0.10

4) 100% betrouwbaarheidsinterval
* Betrouwbaarheidsinterval moet alle mogelijke waarden bevatten voor de parameter
* Breedst van allemaal; bevat meeste waarden

5) Betrouwbaarheidsinterval voor een proportie
* Foutenmarge: za/2 * SE
* p ̂±z−waarde∗se →se=(√(p ̂ (1−p ̂)/n))
* z−waarde=((α=100−confinceinterval))/2→opzoeken in tabel

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

De margin of error voor een betrouwbaarheidsinterval neemt toe/af: (2)

A
  • Neemt toe naarmate het betrouwbaarheidsniveau toeneemt.
  • Neemt af naarmate de steekproefomvang toeneemt
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Vereiste steekproefgrootte bepalen (4)

A

1) Gewenste foutmarge kiezen
- Hoe dicht steekproefproportie bij populatieproportie
- Hoe dichterbij, hoe kleiner foutenmarge nodig
- Hoe kleiner foutenmarge, hoe groter n

2) Betrouwbaarheidsniveau kiezen
- Vaak 95%
- Hoe groter gewenste betrouwbaarheidsniveau, hoe groter n

3) Afhankelijk van budget

4) Formule:
a. Bij proporties: (categorisch)
- m= foutenmarge
- z= z-score (passend bij betrouwbaarheidsniveau)
- p= Schatting uit eerder onderzoek, anders 0.50
□ Hoe dichter bij 0.50, hoe groter n
- Antwoord altijd naar boven afronden!
- n=(p ̂−(1−p ̂ ) z^2)/m^2

b. Bij gemiddelde (kwantitatieve variabele)
	- m= foutenmarge
	- z= z-score (passend bij betrouwbaarheidsniveau)
	- σ= Schatting uit eerder onderzoek, anders:  range/6
		□ Hoe meer spreiding, hoe groter σ, hoe groter n
	- Antwoord altijd naar boven afronden!
	- n=(σ^2 z^2)/m^2
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Inferentiële statistiek

A

Op basis van steekproeven uitspraken doen over de populatie

17
Q

Significantieniveau

A

Getal zodanig dat we H0 verwerpen als de P-waarde kleiner is dan of gelijk is aan dat getal (vaak 0,05). Kans op type 1 fout

18
Q

Beperkingen hypothesetoets: (6)

A

1) H0 niet verwerpen, betekent niet H0 klopt/accepteren
- Het geeft 1 waarde aan en 1 waarde kunnen we nooit accepteren
- Het is niet onwaarschijnlijk

2) H0 wordt verworpen, dan is HA geaccepteerd
- HA geeft namelijk wel een range van mogelijkheden aan

3) Statistische significantie impliceert geen (praktische) relevantie
- Grote steekproef kan een klein verschil al kleine P-waarde geven (en daardoor H0 verwerpen)
- Goed kijken of het verschil praktisch kan kloppen

4) P-waarde is de kans op gevonden toetsingsgrootheid of een extremere waarde als H0 waar is
- Bij kleine kans, hoe sterker bewijs tegen 0-hypothese
- Een nulhypothese is niet waar of onwaar, want dit kan je niet met zekerheid zeggen (zie punt 1)

5) Rapporteer niet alleen statistische significante resultaten
- Ook geven van resultaten waar je geen significante resultaten hebt gevonden

6) Een toets kan toevallig significant zijn
- Als α= 0.05, dan is ongeveer 5% 1 toets significant (H0 verwerpen) als in werkelijkheid H0 waar is
- Het effect kan in populatie kleiner zijn dan aanvankelijk gerapporteerd