Lecture 4 (Reliability, Testing pt. 1) Flashcards
Als de centrale limietstelling niet op gaat, kun je de standaard normale verdeling niet gebruiken. Welke verdelingen kun je wel gebruiken wegens hun robuustheid?
De (Student’s) T distributie, de Chi-kwadraat distributie, de binominale (B) distributie
De hypothesetoets voor steekproefgemiddelden en regressiecoefficienten
De t-toets
De hypothesetoets (significantietoets)
Deze gebruik je om te testen of er voldoende bewijs is tegen de nul hypothese
Kenmerken van de Student’s T distributie
- Laat de steekproevenverdeling van het steekproefgemiddelde zien
- Verschilt per steekproefgrootte (df, familie van distributies)
- Dikkere staarten en meer spreiding dan de standaard normale verdeling (daarom sd >1)
- Populatie standaarddeviatie is onbekend
- Hoe groter het aantal vrijheidsgraden (df), hoe meer de t-distributie op de standaard normale distributie zal lijken
- Gebruikt voor de t-toets en testen van regressiecoefficienten
De hypothesetoets voor steekproefproporties
De Z-toets
Binominale toets
Hypothesetoets voor het testen van proporties met kleine steekproefgrootte (gezien de z-toets daarvoor niet geschikt is als de CLT niet op gaat)
Binominale distributie
Wanneer elk resultaat succes of mislukking is (binary/binominaal), met steeds dezelfde kans op succes (bijvoorbeeld kop of munt gooien, of wel of niet winnen)
2 Factoren waar de breedte van een intervalschatting vanaf hangt:
- De standaarddeviatie van de steekproef
- De steekproefomvang
4 Stappen om een betrouwbaarheidsinterval te berekenen voor de populatieproportie
- Bereken de puntschatter (deel/geheel)
- Bepaal de Z-score bij het betrouwbaarheidsniveau
- Bereken de standaardfout (se)
- Vul de formule voor het BI in
Significantieniveau (α)
Geeft de kans aan (vaak 5%) die je bereid bent om te nemen waarin je de nul hypothese onterecht verwerpt (Type-I fout)
Betrouwbaarheidsniveau
De waarschijnlijkheid (meestal 95%) dat de steekproef een juiste afspiegeling is van de populatie.
Interpretatie van het betrouwbaarheidsinterval (BI)
Bij een betrouwbaarheidsniveau van 95%, zou ongeveer 95% van de berekende intervallen de werkelijke populatieparameter bevatten
Z-score 95% BI
1.96
Z-score 99% BI
2.58
Z-score 90% BI
1.65