HC4 + H1, H2, H4, H5 SPSS Flashcards
Wat is een histogram/frequentie distributie?
Het is een grafiek die aangeeft hoe vaak een bepaalde optie voorkomt.
Hoe ziet een normaal verdeling eruit?
Dat is een soort parabool, die aan beide kanten er precies hetzelfde uitziet. Het is symmetrisch
De normaalverdeling wordt veel gebruikt bij een veelgebruikte variabele. Welke?
Lengte
Er zijn twee veel voorkomende manier waarbij een verdeling afwijkt van normaal. Welke
- Gebrek aan symmetrie (skew, ookwel scheefheid)
- Puntigheid (kurtosis)
Scheve verdelingen zijn niet symmetrisch en in plaats daarvan zijn de meest voorkomende scores geclusterd aan het uiteinde van de schaal. Hoe ziet de positieve scheve verdeling eruit?
De frequente scores zitten vooral aan het begin en loopt daarna af en de staart/punt is richting de meer hogere scores
Hoe ziet de negatieve scheve verdeling eruit?
Dit is het spiegelbeeld van de positieve verdeling. De frequente scores zitten vooral aan het einde en de staart/punt is richting de meer lagere scores
Wat is kurtosis?
Kurtosis verwijst naar de mate waarin scores clusteren aan het einde van de verdeling (ookwel staarten genoemd) en dit heeft de neiging zich uit te drukken in hoe puntig een verdeling is.
Wat is een positieve kurtosis?
Een verdeling met positieve kurtosis heeft veel scores in de staart (zwaarstaart distributie) en is puntig. Dit wordt leptokurtisch genoemd.
Wat is een negatieve kurtosis?
Een verdeling met negatieve kurtosis is relatief dun in de staart en is platter dan normaal. Dit wordt platikurtisch genoemd.
Wat is de centrale tendentie en welke drie metingen worden daar voor gebruikt?
De centrale tendentie is om uit te rekenen waar het centrum van een frequentieverdeling ligt. Hiervoor worden de modus, de mediaan en het gemiddelde gebruikt.
Wat is de modus? Hoe wordt het genoemd als er twee modi zijn en hoe wordt het genoemd als het er meer dan 2 zijn?
Dit is het getal/de waarde die het meeste voorkomt in een dataset. Als het er twee zijn wordt het bimodaal genoemd. Bij meer dan twee wordt het multimodaal genoemd.
Wat zijn de nadelen van de modus?
- Het is mogelijk dat er meer dan één modus is
- Bij lage kurtosis/puntigheid kunnen een paar waarnemingen de waarde van de modus al beïnvloeden.
- Het zegt weinig over de hele scoreverdeling
Wat zijn de voordelen van de modus?
- Makkelijk te bepalen
- Kan ook voor elke variabele gebruikt worden: ook nominaal meetniveau
Wat is de mediaan? Met welke formule wordt het uitgerekend?
Dit is de waarde die als de data opeenvolgend van laag naar hoog wordt gezet, de waarde die op de middelste plek staat. Als de dataset even is, dan wordt het gemiddelde genomen tussen de twee middelste waarden. Het kan worden uitgerekend door (n+1)/2 = mediaan
Wat zijn de voordelen van de mediaan?
- Wordt niet sterk beïnvloed door: extreme waarden en scheefheid van de verdeling
- Het kan gebruikt worden voor ordinale, interval en ratio data.
Wat zijn de nadelen van de mediaan?
- Kleine steekproefstabiliteit
- Weinig rekenkundige mogelijkheden
- Het meetniveau van de variabele moet minimaal ordinaal zijn
Wat is het gemiddelde, hoe wordt het berekend?
Je telt alle waarden bij elkaar op en deelt het dan door het aantal waarden