Thema 3 .4 - steekproefverdelingen Flashcards
wat is een steekproef?
= een willekeurig gekozen subset van de populatie
–> toeval speelt een rol, meestal in de vorm van steekproeffout (het kiezen van deelnemers) en meetfout (het afnemen van metingen).
Het gemiddelde in de steekproef kan dus nooit precies hetzelfde zijn als het ‘ware’ gemiddelde van de populatie. Om die reden zijn puntschattingen (zoals het gemiddelde uit de steekproef) niet informatief als je niet weet hoe groot de rol van toeval is.
wat is een betrouwbaarheidsinterval?
Het betrouwbaarheidsinterval (‘confidence interval’) geeft een indicatie van de accuraatheid van een maat uit een steekproef. Op basis hiervan kunnen we dus uitspraken doen over de populatie.
wat is een steekproefverdeling?
De steekproevenverdeling, oftewel de sampling distribution, is de theoretische verdeling van een bepaalde maat (bijvoorbeeld het gemiddelde) die je krijgt als je een oneindig aantal steekproeven uit een populatie zou trekken.
- de theoretische verdeling van alle mogelijke gemiddelden in een populatie wordt de steekproefverdeling van het gemiddelde genoemd (= alle mogelijke gemiddelden die met een steekproef van een bepaalde omvang gevonden kunnen worden)
Elke maat die uitgerekend kan worden op basis van de datareeks die met een steekproef is verkregen, heeft zo’n theoretische steekproevenverdeling. Dit geldt dus niet alleen voor het gemiddelde, de standaarddeviatie en de spitsheid, maar ook voor de scheefheid, de mediaan, de modus, de variantie en variatie, de diptest, en de interkwartielafstand.
wat is de centrale limietstelling?
De centrale limietstelling stelt dat naarmate we meer steekproeven trekken, de steekproevenverdeling van het gemiddelde steeds meer op de normaalverdeling zal lijken.
–> Dit is ongeacht de vorm van de populatieverdeling, hoewel er grotere steekproeven nodig zijn om een normale steekproevenverdeling te krijgen naarmate de populatieverdeling zelf meer afwijkt van normaliteit.
Hieruit volgt dat de theoretische steekproevenverdeling van het gemiddelde altijd normaal verdeeld is, behalve voor hele kleine steekproeven
wat is een standaardfout?
standaardfout = De standaarddeviatie van een steekproevenverdeling
De standaardfout hangt af van de grootte van de steekproef die oneindig vaak werd getrokken.
Hoe groter de steekproef, hoe smaller (spitser) de steekproevenverdeling en dus hoe kleiner de standaardfout.
Formeel is de standaardfout gelijk aan de standaarddeviatie van de populatie gedeeld door de wortel van de steekproefgrootte.
hoe berekenen we de standaarfout als we de standaardeviatie van de populatie niet kennen?
- Formeel is de standaardfout gelijk aan de standaarddeviatie van de populatie gedeeld door de wortel van de steekproefgrootte.
- De standaarddeviatie van de populatie weten we echter nooit. Om de standaardfout te benaderen maken we daarom gebruik van de standaarddeviatie van de steekproef.
- De standaarddeviatie van de steekproevenverdeling -> op basis van de informatie die we uit onze steekproef kunnen halen: de standaarddeviatie en de steekproefgrootte.
wat is een betrouwbaarheidsinterval?
= Het betrouwbaarheidsinterval is een interval om het steekproefgemiddelde heen dat in 95% van de steekproeven het populatiegemiddelde bevat.
–> Dit interval komt overeen met een afwijking van ongeveer twee standaardfouten van het gemiddelde ==> en geeft een goede schatting van wat waarschijnlijk het gemiddeld is in de populatie.
welke informatie geeft het betrouwbaarheidsinterval?
Het betrouwbaarheidsinterval geeft dus informatie over hoe accuraat het gemiddelde is dat we in de steekproef hebben gevonden.
Die accuraatheid van het gemiddelde van de steekproef zit in de breedte van het interval: smalle intervallen zijn meer accuraat, brede intervallen minder.