HC2 Flashcards
Waarden verdeeld over histogram.
Frequentieverdeling
Afwijking van de frequentieverdeling, kan positief of negatief zijn.
Skew
Afwijking van de frequentieverdeling, heel plat (platykurtic) of heel hoog (leptokurtic).
Kurtosis
Waarom vraag je de frequentieverdeling op?
Om afwijkende data op te sporen.
Bell-curve gebruiken om aan te duiden hoe uitzonderlijk een bepaalde score is.
Normaalverdeling
Welke waarden heeft een standaard normaalverdeling?
Het gemiddelde is 0 en de standaarddeviatie is 1.
Wat is de voorwaarde voor standaardisering van normaalverdeling?
Frequentieverdeling is normaal verdeeld.
Hoe standaardiseer je een normaalverdeling?
Doormiddel van Z-scores.
Wat is een Z-score?
Waarde van een observatie uitgedrukt in eenheden standaarddeviatie.
Wat kan je aflezen in een Z-score tabel?
Hierin krijgt elke Z-score een waarde, dit is de kans op een waarde die lager is dan een bepaalde Z-waarde. Dus de proportie onder en boven die score (kan je omrekenen in percentages).
Overschrijdingskans van Z-score kleiner dan 5%?
Versimpelde versie van significantie.
Waar kan je een Z-score (en bijbehorende percentages boven/onder) voor gebruiken?
Achterhalen hoe uitzonderlijk de kans is op een bepaalde waarde, originele waarden van variabelen zijn namelijk gestandaardiseerd.
Wat betekent significantie?
Als de kans om een bepaalde waarde te vinden kleiner is dan 5%, terwijl het effect in de populatie eigenlijk 0 is.
Wat is de populatie?
Het geheel van de units waarover we ons model willen generaliseren.
Wat is een steekproef?
Een kleine (representatieve) groep units die we gebruiken om iets te kunnen zeggen over de populatie.
Wat is een steekproevenverdeling?
Deze krijg je door een oneindig aantal steekproeven te trekken, hierbij vindt je steeds een net andere gemiddelden. De steekproevenverdeling heeft een eigen gemiddelde en standaardddeviatie.
Wat is de standard error?
De standaarddeviatie van de imaginaire steekproevenverdeling.
Wat stelt de Central Limit Theorem?
Dat de steekproevenverdeling normaal verdeeld is als (1) de populatie normaal verdeeld is en (2) de getrokken (random) steekproef groter is dan 30 casussen.
Wat bewijst de Central Limit Theorem?
Als aan de voorwaarden voldaan is, kunnen we de eigenschappen van de normaalverdeling gebruiken om adhv de steekproef schattingen te maken over de populatie.