HC.3 - Het toetsen van hypothesen / meta-analyse Flashcards
Waarover zeggen hypothesen iets?
Over de populație (gebruiken steekproef hiervoor)
Wat bekijken we bij een statistische toets?
We gaan uit van de nulhypothese = er is geen verschil of verandering = conservatief
Deze kunnen we verwerpen en een alternatieve hypothese vinden (waarbij de delta (verschil) is geen 0)
Wat kunnen we gebruiken om met het resultaat van een steekproef iets te zeggen over de populatie?
Met statische toetsing
Wat is de P-waarde?
Als de nulhypothese WAAR is (dus er is geen verschil) wat is dan de kans op het vinden van de waarde die we in de steekproef gevonden hebben (= gevonden resultaat) of een gemiddelde waarde die nog verder van 0 afligt
Afgesproken dat als < 0,05 is dat we dan de nulhypothese verwerpen omdat het niet aannemelijk is dat dit waar is
Hoe interpreteren we de P-waarde?
Als de kans heel klein is –> dan is de nulhypothese toch niet zo aannemelijk
-> verwerpen
CONCLUSIE: gemiddelde daling in de populatie = NIET 0
Als de kans groter
–> dan is de nulhypothese wel aannemelijk genoeg
–> niet verwerpen
CONCLUSIE: de gemiddelde daling in de populatie = 0
Kan een niveau toevoegen wanneer de kans klein of groot is = significantie niveau = p-waarde
Vaak is dit 0,05
Wat kunnen we met de steekproef grootte en de SD van de individuele scores?
Verdeling van de steekproef gemiddelden bekijken
Via standaard error of the mean = SEM
SEM = s / wortel n
S = sigma = SD individuen (omdat van populatie vaak niet bekend is)
n = steekproef grootte
Hierbij wordt aangenomen dat het gemiddelde van de steekproef gelijk is aan het populatie gemiddelde
Wat kunnen we zeggen over de verdeling van steekproefgemiddelden?
Centrale limiet stelling
- Als individuele scores in de populatie normaal verdeeld zijn –> geldt dit ook voor de steekproef gemiddelden
(ook bij een kleine n) - Als de individuele scores in de populatie NIET normaal verdeeld zijn, maar er wel een redelijk grote steekproef grootte is (n ≥ 30) dan zijn de steekproef gemiddelden WEL bij benadering normaal verdeeld (met een kleinere spreiding)
Noem de vijf stappen van de toetsing
- Formuleer de H0
- Verzamel gegevens
- Bereken toetsingsgrootheid
- Beoordeel de waarde van de toetsingsgrootheid
- Is deze waarde “aannemelijk” als H0 waar is?
- Hoe “aannemelijk” is dat H0 waar is? P-waarde - Als P-waarde > 0,05: H0 behouden
Als P-waarde < 0,05: H0 verwerpen
Stel er wordt een verschil gevonden van 0,2. Waarvan hangt het af of dit wel of geen groot verschil is? Hoe beoordelen we het?
- spreiding
- steekproefgrootte want als deze heel groot is, dan heb je een smallere verdeling en is de kans groter dat de 0,2 in de uiterste gebieden ligt
Moet hiervoor een toetsingsgrootheid berekenen
Welke toetsingsgrootheden zijn er?
F: als ≥3 groepen vergelijken
Z: gemiddelden
T: hele kleine aantallen
U: niet normaal verdeeld of kleinere aantallen in groep
R: correlatie kijken naar verbanden tussen variabelen
X^2 (chi-kwadraat): nominale variabelen (wel/niet ziek worden)
Hoe kunnen we adhv het 95% BI zien of de nulhypothese wel of niet aannemelijk is?
Als de 0 in het BI zit betekent dit dat 0 (geen verschil) helemaal geen gekke waarde is en dat het best aannemelijk is –> kunnen dan niet verwerpen
Als het gaat om een ratio geldt dit voor 1. Het gaat om een deling dus als er geen verschil is zal 1 de uitkomst zijn.
Wat is de toetsingsgrootheid?
een maat voor de afwijking van de steekproefuitkomsten van de onder de nulhypothese te verwachten uitkomsten (wordt berekend uit de uitkomsten van de steekproef)
Maat voor de afwijking van de gegevens uit de steekproef tov de verwachte waarde (onder de nulhypothese)
Wat kunnen we zien aan de toetsingsgrootheid?
1,96 is 2x spreiding ervan af
Als de t-waarde hieronder ligt is het ook aannemelijk dat de nulhypothese niet verworpen kan worden
Waarom geeft de toets niet altijd het juiste antwoord?
Stel de H0 is waar
Dan 95% kans om met de waarde in het interval te liggen
Maar ook 5% kans om wel een extremere waarde te vinden (waarvan we dus zeggen dat deze waarde zo afwijkend is dat de H0 niet waar kan zijn) –> Hierdoor KAN onterecht de H0 verworpen worden
Gaat om de uiterste 2,5% aan beide zijden
Wat is de type I fout?
= H0 wordt verworpen terwijl hij in werkelijkheid correct is
alfa = de kans op het maken van een type I fout
= P (H0 verwerpen | H0 waar)
Kunnen we vooraf bepalen hoe hoog we deze willen
Welke fout willen we graag zo klein mogelijk hebben bij het toetsen?
Alfa dus type I fout
Omdat de wereld al werkt zonder een dieet bvb dus niet zo maar dit veranderen
Type II fout vinden we minder erg
Wat is de type II fout?
= H0 NIET verwerpen terwijl deze in werkelijkheid NIET correct is
(eigenlijk zou de H0 wel verworpen moeten worden)
beta = kans op het maken van type II fout
= P (H0 behouden | H0 niet waar)
Dus bvb het dieet werkt eigenlijk wel maar ligt in het niet te verwerpen gebied
Welke is vaak groter type I of II fout?
Type II is vaak groter dan type I fout