Thema 3 .4 - steekproefverdelingen Flashcards

Question 1

Q

wat is een steekproef? wat is er dan met het gemiddelde van de steekproef?

Answer

A

= een willekeurig gekozen subset van de populatie

–> toeval speelt een rol, meestal in de vorm van steekproeffout (het kiezen van deelnemers) en meetfout (het afnemen van metingen).

Het gemiddelde in de steekproef kan dus nooit precies hetzelfde zijn als het ‘ware’ gemiddelde van de populatie. Om die reden zijn puntschattingen (zoals het gemiddelde uit de steekproef) niet informatief als je niet weet hoe groot de rol van toeval is.

Question 2

Q

wat is een betrouwbaarheidsinterval?

Answer

A

Het betrouwbaarheidsinterval (‘confidence interval’) geeft een indicatie van de accuraatheid van een maat uit een steekproef. Op basis hiervan kunnen we dus uitspraken doen over de populatie.

Question 3

Q

wat is een steekproevenverdeling?

Answer

A

De steekproevenverdeling, oftewel de sampling distribution, is de theoretische verdeling van een bepaalde maat (bijvoorbeeld het gemiddelde) die je krijgt als je een oneindig aantal steekproeven uit een populatie zou trekken.

de theoretische verdeling van alle mogelijke gemiddelden in een populatie wordt de steekproevenverdeling van het gemiddelde genoemd (= alle mogelijke gemiddelden die met een steekproef van een bepaalde omvang gevonden kunnen worden)

Elke maat die uitgerekend kan worden op basis van de datareeks die met een steekproef is verkregen, heeft zo’n theoretische steekproevenverdeling. Dit geldt dus niet alleen voor het gemiddelde, de standaarddeviatie en de spitsheid, maar ook voor de scheefheid, de mediaan, de modus, de variantie en variatie, de diptest, en de interkwartielafstand.

Question 4

Q

wat is de centrale limietstelling?

Answer

A

De centrale limietstelling stelt dat naarmate we meer steekproeven trekken, de steekproevenverdeling van het gemiddelde steeds meer op de normaalverdeling zal lijken.

–> Dit is ongeacht de vorm van de populatieverdeling, hoewel er grotere steekproeven nodig zijn om een normale steekproevenverdeling te krijgen naarmate de populatieverdeling zelf meer afwijkt van normaliteit.

Hieruit volgt dat de theoretische steekproevenverdeling van het gemiddelde altijd normaal verdeeld is, behalve voor hele kleine steekproeven

Question 5

Q

wat is een
standaardfout?

Answer

A

standaardfout (se) = De standaarddeviatie van een steekproevenverdeling

De standaardfout hangt af van de grootte van de steekproef die oneindig vaak werd getrokken.

Hoe groter de steekproef, hoe smaller (spitser) de steekproevenverdeling en dus hoe kleiner de standaardfout.

Formeel is de standaardfout gelijk aan de standaarddeviatie van de populatie gedeeld door de wortel van de steekproefgrootte.

Question 6

Q

hoe berekenen we de standaardfout als we de standaardeviatie van de populatie niet kennen?

Answer

A

Formeel is de standaardfout gelijk aan de standaarddeviatie van de populatie gedeeld door de wortel van de steekproefgrootte.
De standaarddeviatie van de populatie weten we echter nooit. Om de standaardfout te benaderen maken we daarom gebruik van de standaarddeviatie van de steekproef.
De standaarddeviatie van de steekproevenverdeling -> op basis van de informatie die we uit onze steekproef kunnen halen: de standaarddeviatie en de steekproefgrootte.

Question 7

Q

wat is een betrouwbaarheidsinterval?

Answer

A

= Het betrouwbaarheidsinterval is een interval om het steekproefgemiddelde heen dat in 95% van de steekproeven het populatiegemiddelde bevat.

–> Dit interval komt overeen met een afwijking van ongeveer twee standaardfouten van het gemiddelde ==> en geeft een goede schatting van wat waarschijnlijk het gemiddeld is in de populatie.

–> de accuraatheid van het gemiddelde van de steekproef zit in de breedte van het interval: smalle intervallen zijn meer accuraat , brede intervallen minder

Question 8

Q

welke informatie geeft het betrouwbaarheidsinterval?

Answer

A

Het betrouwbaarheidsinterval geeft dus informatie over hoe accuraat het gemiddelde is dat we in de steekproef hebben gevonden.

Die accuraatheid van het gemiddelde van de steekproef zit in de breedte van het interval: smalle intervallen zijn meer accuraat, brede intervallen minder.

Question 9

Q

wat is de algemene formule van betrouwbaarheidsintervallen voor verschillende maten?

Answer

A

betrouwbaarheidsinterval = steekproefwaarde + en - breedteindex x standaardfout

steekproefwaarde = bijv. het gemiddelde of de standaardeviatie die bij een bepaalde steekproef hoort

breedte-index hangt af van
- de vorm vd steekproevenverdeling vd betreffende waarde
- de betrouwbaarheid vh interval (getal wordt dus groter naarmate meer betrouwbaarheid wordt vereist)

–> 0,67 voor een 50% betrouwbaarheidsinterval
–> 1,96 voor een 95% betrouwbaarheidsinterval
–> 2,58 voor een 99% betrouwbaarheidsinterval

! voor het berekenen van de betrouwbaarheidsinterval is het belangrijk om de exacte breedte-index te gebruiken !

Question 10

Q

wat is een veelgemaakte fout bij het interpreteren van het betrouwbaarheidsinterval?

Answer

A

het betrouwbaarheidsinterval interpreteren als een interval waarbij de kans 95% is dat het populatiegemiddelde binnen dat interval ligt
! het populatiegemiddelde is een bestaande waarde die feitelijk wel of niet in het betrouwbaarheidsinterval van een steekproef ligt

==> stel dat je een steekproef oneindig zou herhalen, dan zou in 95% van de gevallen het populatiegemiddelde in het betrouwbaarheidsinterval vallen

het betrouwbaarheidsinterval is het dichtste dat we kunnen komen bij een antwoord op de vraag: “wat kan ik op basis van mijn steekproef over de populatie concluderen?”