Thema 2 Univariate analyse Flashcards

1
Q

Centrummaat

A

aangeeft rondom welke waarde de datapunten in deze datareeks zich bevinden; wat het ‘centrum’ van de datareeks is,

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Outlier (uitschieter)

A

een datapunt dat zo extreem is, dat het waarschijnlijk een artefact is van de dataverzameling

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Modus

A

De meest voorkomende waarde

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Mediaan

A

Middelste datapunt in de reeks

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Range

A

Het verschil tussen minimum en maximum (volstaat niet omdat gevoelig is voor outliers)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Interkwartielafstand

A

Afstand tussen 2 kwartielen (eerst mediaan, dan nieuwe medianen van de 2 kanten. Daar de afstand van) Geeft informatie hoe ver de datapunten van het gemiddelde afliggen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

sum of squares (variatie)

A

Verschil van het gemiddelde. Deze afwijkingen kwadrateren, Je krijgt positief getal dit tel je bij elkaar op.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Variantie oftewel Mean Squares

A

Variatie delen door het aantal datapunten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Standaarddeviatie (standaardafwijking)

A

De wortel van de variantie. Zo komt de waarde op dezelfde schaal als de datapunten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Verdelingsvorm

A

Hoe de datapunten verdeeld zijn

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

modaliteit of toppigheid

A

beschrijft het aantal toppen van de verdeling

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

unimodaal of eentoppig

A

verdeling met 1 top

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

multimodaal of meertoppig

A

Verdeling met meerdere toppen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

bimodale of tweetoppige

A

verdeling met twee toppen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

scheefheid

A

Een scheve verdeling is een asymmetrische verdeling.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Links scheve verdeling

A

De top van de verdeling ligt dus aan de rechterkant, en de staart aan de linkerkant

17
Q

Rechts scheve verdeling

A

In die verdeling liggen de meeste datapunten juist links van het gemiddelde. Er liggen nu wat minder datapunten vrij ver rechts van het gemiddelde

18
Q

leptokurte verdeling

A

bijzonder spitse verdeling

19
Q

platykurte

A

Een verdeling die bijzonder plat is

20
Q

Ander woord voor spitsheid

A

Kurtosis

21
Q

kenmerken van een normaalverdeling

A

De normaalverdeling is unimodaal.
De normaalverdeling is niet scheef (en dus perfect symmetrisch).
De normaalverdeling is niet bijzonder spits of plat.
68% van de datapunten ligt binnen één standaarddeviatie van het gemiddelde (ongeveer tweederde dus).
95% van de datapunten ligt binnen twee standaarddeviaties van het gemiddelde.
99.7% van de datapunten ligt binnen drie standaarddeviaties van het gemiddelde (bijna allemaal dus).

22
Q

standaardisering

A

Deze omrekening naar z-scores,

23
Q

Density plot

A

Lijn in plaats van histogram. Oppervlakte altijd 1

24
Q

Q-Q-plot

A

In deze grafiek worden kwantielen geplot. Kwantielen zijn een soort ‘breekpunten’ om een datareeks in gelijke delen te splitsen. De mediaan is dus een voorbeeld van een kwantiel:

25
Q

Diptest

A

wordt steeds groter naarmate een verdeling minder unimodaal is.

26
Q

Skewness

A

Naarmate een verdeling meer linksscheef is, is de skewness steeds kleiner (dat wil zeggen: ligt hij verder van 0 af en is hij negatief), en naarmate een verdeling meer rechtsscheef is, is de skewness steeds groter.

27
Q

kurtosis

A

geldt dat naarmate een verdeling platter is, de kurtosis steeds kleiner is (dat wil zeggen: ligt hij steeds verder van 0 af en is hij negatief), en naarmate een verdeling spitser is, de kurtosis steeds groter is.

28
Q

steekproevenverdelingen

A

Deze theoretische verdelingen van gemiddelden, standaarddeviaties, en spitsheden over een ontelbaar aantal steekproeven

29
Q

De standaardfout

A

naarmate een steekproef groter is, is de bijbehorende steekproevenverdeling smaller. Dit wordt uitgedrukt in de spreiding van die steekproevenverdeling, oftewel, in de standaarddeviatie. Deze standaarddeviatie van de steekproevenverdeling heet de standaardfout,

30
Q

betrouwbaarheidsinterval

A

interval berekend waarvan we zeker weten dat het in 95% van de steekproeven het populatiegemiddelde zal bevatten

31
Q

dichotome variabele/binaire variabele.

A

kan maar twee waarde aannemen

32
Q

nominaal

A

deze categorieën zijn alleen te benoemen, maar niet te ordenen

33
Q

ordinale variabele

A

De afstand tussen de geordende categorieën is dus onbekend: we kunnen de categorieën alleen maar ordenen

34
Q

categorische of discrete variabelen

A

Samen heten nominale en ordinale variabelen . dit omdat de verschillende meetwaarden die deze variabelen aan kunnen nemen altijd categorieën zijn

35
Q

continue variabelen

A

Deze variabelen kunnen in theorie allerlei meetwaarden aannemen, meestal op een schaal van ‘min oneindig’ tot ‘oneindig’, waarbij waarden steeds onwaarschijnlijker worden naarmate ze verder van het gemiddelde af liggen