H10 Flashcards
p ̂
Steekproefproportie
P
(Onbekende) proportie populatie
df
Degrees of freedom (N-1)
Robuust
Ondanks niet een normale verdeling, is de t-verdeling robuust en kun je hem gewoon gebruiken
Standaardfout
- Afkorting: se (Standarderror)
- Geschatte standaarddeviatie van een steekproevenverdeling
- Afhankelijk van steekproefgrootte
- Proportie: se=√(p ̂ (1−p ̂)/n)
- Gemiddelde: se=s/√n
○ s= standaarddeviatie steekproef
Betrouwbaarheidsinterval voor categorische variabelen (Steekproevenverdeling van proportie/kansverdeling)
1) 90% betrouwbaarheidsinterval
○ p ̂±1.645(se)
○ Error probability (α) 0.10
2) 95% betrouwbaarheidssinterval
○ p ̂±1.96(se)
§ se=√(p ̂ (1−p ̂)/n)
§ Gebruik bij df boven 100
§ Error probability (α) 0.05
○ Meest gebruikt
○ Grote steekproef nodig
§ np ̂≥15 & n(1−p ̂ )≥15
§ Minstens 15 ‘failures’ en 15 successen
○ Voor populatiegemiddelde (μ)
§ x ̅± t_0.025 (se)
§ se=s/√n
3) 99% betrouwbaarheidsinterval
○ p ̂±2.58(se)
○ Error probability (α) 0.10
4) 100% betrouwbaarheidsinterval
* Betrouwbaarheidsinterval moet alle mogelijke waarden bevatten voor de parameter
5) Betrouwbaarheidsinterval voor een proportie
* Foutenmarge: z * SE
* p ̂±z−waarde∗se →se=(√(p ̂ (1−p ̂)/n))
* z−waarde=((α=100−confinceinterval))/2→opzoeken in tabel
* Z-score van tabel
§ Kansen in de tabel
§ Z-waarden erboven
§ Linkeroverschrijdingskansen
Wanneer neemt margin of error voor een betrouwbaarheidsinterval toe/af?
- Neemt toe naarmate het betrouwbaarheidsniveau toeneemt.
-Neemt af naarmate de steekproefomvang toeneemt
Betrouwbaarheidsinterval voor kwantitatieve variabelen (Steekproevenverdeling van het gemiddelde)
- Betrouwbaarheidsinterval= x ̅± t(s/√n)
- Puntschatter = x ̅
- Standaardfout s/√n
- Omdat populatiegegevens onbekend zijn, meer onzekerheid. Daarom breder interval (t-score i.p.v. z-score)
- t-verdeling
- Gebruiken bij gemiddelde
§ Behalve als populatiewaarden (gemiddelde (𝜇) en standaarddeviatie (𝜎)) bekend zijn –> Dan z-score - Klokvormig en symmetrisch op punt 0
- Afhankelijk van aantal vrijheidsgraden (df)
§ Hoe groter de df-waarde, hoe dichter bij de standaard normaalverdeling
§ Bij normaalverdeling Df= ∞
§ Vanaf df=30 lijkt al erg op normaalverdeling - Df (vrijheidsgraden)= n−1
- Dikkere trails in vergelijking standaardnormaalverdeling (dus meer spreiding)
- Robuust
§ Kan je dus altijd gebruiken, ook bij niet normale verdeling
§ Wel oppassen bij extreme outliers (vanwege gemiddelde) - T-score in tabel
§ In tabel kansen erboven
§ t-waarden in tabel
§ df aan zijkant
§ Rechteroverschrijdingskansen