H9 Flashcards
Central limit theorem (CLT)
De steekproefverdeling van het steekproefgemiddelde x heeft vaak een ongeveer normale verdeling, ongeacht de vorm van de populatieverdeling. Voor relatief grote steekproeven is steekproefverdeling vaak klokvorming, ook als het sterk skewed is.
Sampling distribution (steekproevenverdeling)
Specificeert de mogelijke waarden die een statistic kan aannemen en de bijbehorende kansen
Margin of error (foutenmarge)
Meet hoe (on)nauwkeurig de puntschatting zal zijn bij het schatten van een parameter (1,96xSD) bij normaalverdeling
Puntschatter (point estimate)
1 getal dat aangeeft wat de beste schatting is voor de waarde van de parameter
Intervalschatting (interval estimate/ interval of numbers)
Een interval van getallen waarbinnen wordt aangenomen dat de waarde van de parameter zich bevindt
Betrouwbaarheidsniveau
Kans dat de methode een interval schat dat de waarde van de parameter bevat (vaak 95%)
Steekproeffluctatie
Elke steekproef verschilt iets in uitkomst
Steekproefverdeling van steekproefgemiddelde bij normaalverdeling
- Willekeurige steekproef met grootte n
- Steekproefgemiddelde (x ̅) gelijk aan populatiegemiddelde (μ)
- Standaardfout: Standaarddeviatie van de steekproevenverdeling is gelijk aan σ/√n (onderdeel foutenmarge)
- Als steekproefgrootte vergroot, de steekproefverdeling lijkt meer klokvormig (bij 30 of meer), ook al is de populatie dat niet
- Met grotere steekproef, het steekproefgemiddelde ligt dichter bij het populatiegemiddelde, dus hoe smaller de verdeling
- Hierbij geldt empirische regel dus ook
Hoe schever de populatieverdeling, hoe groter n moet zijn voor een normale verdeling
Typen statistische inferentiemethoden (2)
1) Schatting van de populatie parameters
a. Gebruik maken van confidence interval
2) Testen van hypothesen over parameterwaarden (hypothesetoetsing)
Schattingen populatie parameters: (2)
1) Point estimate (puntschatter)
* 1 getal
* Enkel getal dat beste schatting is voor de parameter
* Vertelt ons niet hoe dichtbij de schatting is
* Meest gebruikt
* Eigenschappen
a) Gecentreerd rond de parameter (populatiewaarde) die geschat wordt –> zuivere schatter
- De schatting is unbiased
- Center/gemiddelde van steekproefverdeling
- Steekproevenverdeling een stuk smaller dan populatieverdeling
b) Een goede schatter heeft een zo’n klein mogelijke standaarddeviatie
- Geschatte waarden dichter in buurt van parameter (populatiewaarde)
–> Gemiddelde in grafiek hieronder is dus beter
2) Interval estimate (intervalschatting)
* Interval tussen 2 getallen rond de puntschatting
* Interval van getallen waarvan wordt aangenomen dat deze de werkelijke waarde bevat van de parameter
* Meer bruikbaar; geeft margin of error aan
* Mate van onzekerheid
* Confidence intervals (betrouwheidsinterval)
Eigenschappen puntschatter (2)
1) Gecentreerd rond de parameter (populatiewaarde) die geschat wordt –> zuivere schatter
- De schatting is unbiased
- Center/gemiddelde van steekproefverdeling
- Steekproevenverdeling een stuk smaller dan populatieverdeling
2) Een goede schatter heeft een zo’n klein mogelijke standaarddeviatie
- Geschatte waarden dichter in buurt van parameter (populatiewaarde)
–> Gemiddelde in grafiek hieronder is dus beter
Confidence intervals (betrouwheidsinterval):
- Interval dat de vermoedelijke waarden voor de parameter bevat
- Bevat de meest geloofwaardige waarden voor een parameter
- Methode die puntschatting combineert met foutmarge
- Meestal 0,95 (95% confidence interval)
- Betrouwbaarheidsinterval voor proportie in populatie gebaseerd op steekproevenverdeling van proportie
§ Steekproefproporties normaal verdeeld bij np en n(1-p) ≥ 15
§ Gemiddelde steekpoevenverdeling = proportie in populatie - steekproevenverdeling ±1,96 (standaard deviatie)