Hoofdstuk 3 Flashcards

1
Q

datapunt

A

Een representatie van de uitkomst van een meting.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

continue variabelen

A

Ze zijn meetbaar op een ononderbroken schaal en kunnen in de populatie oneindig veel waarden aannemen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

datareeks

A

Een reeks van meerdere datapunten die hetzelfde representeren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

nominale variabele/ meetniveau

A

Een variabele van het laagste meetniveau. De categorieën zijn alleen te benoemen, maar niet te ordenen. (bv geslacht, haarkleur)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

dichotome variabele

A

Een nominale variabele die maar twee waarden kan aannemen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Ordinaal meetniveau

A

De afstand tussen de geordende categorieën is onbekend: we kunnen de categorieën alleen maar ordenen. We noemen dit daarom een ordinale variabele. Omdat ordinale variabelen wel van hoog naar laag te ordenen zijn, hebben ze een hoger meetniveau dan nominale variabelen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

categorische of discrete variabelen

A

Samen heten nominale en ordinale variabelen. De verschillende meetwaarden die deze variabelen kunnen aannemen zijn altijd categorieën, zoals ‘vrouw’, ‘MBO’, ‘minderjarig’ of ‘40-50 jaar’.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

continue variabelen

A

Deze variabelen kunnen in theorie alle denkbare meetwaarden aannemen, meestal op een schaal van ‘min oneindig’ tot ‘plus oneindig’, waarbij waarden steeds onwaarschijnlijker worden naarmate ze verder van het gemiddelde af liggen. Twee continue variabelen kunnen, als ze op dezelfde schaal gemeten zijn, worden opgeteld of gemiddeld om een betekenisvol resultaat te verkrijgen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wat is het verschil tussen interval en ratio niveau binnen de continue variabelen?

A

Het verschil tussen deze twee meetniveaus is het al dan niet bestaan van een zogenaamd ‘absoluut nulpunt’, waardoor er wel of niet een verhouding tussen twee getallen uitgedrukt kan worden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Ratio niveau/ variabele

A

Numerieke waarden met een betekenisvolle rangorde, gelijke intervallen, en een
waar nulpunt.
Bijvoorbeeld: leeftijd in jaren, inkomen in euro’s.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

interval niveau/ variabele

A

Numerieke waarden met een betekenisvolle rangorde en gelijke intervallen
tussen de waarden, maar er is geen waar nulpunt.
Bijvoorbeeld: temperatuur in graden Celsius (waar 0 niet de afwezigheid van
temperatuur aangeeft).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

dataset

A

Een verzameling datareeksen die zo zijn georganiseerd dat duidelijk is welke data bij elkaar horen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Variabelenamen

A

Spreken zoveel mogelijk voor zichzelf: vermijd dus cryptische termen en afkortingen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

gemiddelde

A

Wordt berekend door alle getallen op te tellen en te delen door het aantal bij elkaar opgetelde getallen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

outlier

A

Een extreem datapunt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Modus

A

De meest voorkomende waarde in de datareeks.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Mediaan

A

Het middelste datapunt in de datareeks.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Range, ook wel het bereik

A

Het verschil tussen het minimum en het maximum.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Interkwartielafstand (IQR)

A

Om de IQR te berekenen, worden de data weer geordend van laag naar hoog en vervolgens opgesplitst in vier kwartielen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

variatie oftewel sum of squares (SS)

A

De sum of squares is de som van de gekwadrateerde afwijkingen van het gemiddelde.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

mean squares (MS)

A

Houdt rekening met het aantal datapunten en is daarom informatiever dan de Sum of Squares. Voor de mean squares bereken je het gemiddelde van de kwadraten, dat wil zeggen de som gedeeld door het aantal observaties.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

vrijheidsgraden

A

Drukken uit hoeveel datapunten in een datareeks vrij kunnen variëren zonder dat de berekende statistiek verandert.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Standaardafwijking oftewel de standaarddeviatie (SD).

A

De standaardafwijking is de wortel van de variantie (mean squares) en geeft de gemiddelde afwijking van het gemiddelde weer (‘the mean distance to the mean’). Door de wortel te trekken van de mean squares is de standaarddeviatie op dezelfde schaal als het gemiddelde en daardoor makkelijker te interpreteren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

frequentieverdeling

A

Bestaat uit de frequenties, oftewel de aantallen, voor elke mogelijke meetwaarde. Dit is een overzicht van hoe vaak elke categorie of
waarde voorkomt in de dataset.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

cumulatief percentage

A

Het percentage van een bepaalde meetwaarde (of categorie) samen met de percentages van alle lagere (of, van de andere kant bekeken, hogere) meetwaarden (of categorieën).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Over het algemeen zijn er drie termen die gebruikt worden om een verdelingsvorm te beschrijven

A

De modaliteit (‘toppigheid’), de scheefheid (‘skewness’) en de spitsheid (‘kurtosis’) van een verdeling-> De mate van aanwezigheid van deze vormen kunnen getoetst worden met de volgende verdelingsmaten: de Hartigans’ dip test (unimodaliteit), skewness (scheefheid) en kurtosis (spitsheid).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Modaliteit of toppigheid

A

Beschrijft het aantal toppen van een verdeling.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Scheefheid, oftewel ‘skewness’

A

Beschrijft of een verdeling symmetrisch of asymmetrisch is.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Spitsheid oftewel ‘kurtosis’

A

Beschrijft hoe spits of plat een verdeling is

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

uniforme verdeling

A

De ‘platste’ verdeling de verdeling waarbij alle waarden even vaak voorkomen.

30
Q

leptokurte verdeling

A

Een verdeling die erg spits is.

31
Q

platykurte verdeling

A

Een verdeling die erg plat is.

32
Q

kurtosis

A

De verdelingsmaat die bij spitsheid hoort, heet ook kurtosis. De kurtosis is 0 bij een perfect normale verdeling. Naarmate een verdeling platter is, wordt de kurtosis steeds kleiner (dat is, meer negatief) en naarmate een verdeling spitser is, wordt de kurtosis steeds groter (dat is, meer positief).

33
Q

normaalverdeling

A

Een unimodale, symmetrische verdeling, die niet bijzonder plat of spits is. Kenmerken:
* De normaalverdeling is unimodaal.
* De normaalverdeling is niet scheef (en dus perfect symmetrisch).
* De normaalverdeling is niet bijzonder spits of plat.
* 68% van de datapunten (ongeveer twee derde) ligt binnen ongeveer één standaarddeviatie van het gemiddelde.
* 95% van de datapunten ligt binnen ongeveer twee standaarddeviaties van het gemiddelde.
* 99,7% van de datapunten (dus bijna allemaal) ligt binnen ongeveer drie standaarddeviaties van het gemiddelde.

34
Q

standaardnormale verdeling of z-verdeling

A

Een speciale vorm van de normale verdeling is een normaalverdeling met een gemiddelde van 0 en een standaarddeviatie van 1.

35
Q

standaardisering

A

Datapunten omrekenen in z-scores, je kunt een waarde standaardiseren door het gemiddelde van deze waarde af te trekken en dat te delen door de standaarddeviatie.

36
Q

‘dichtheid’/ density

A

Hoeveel datapunten er voor een gegeven meetwaarde zijn, en wordt daarom ook wel een density plot genoemd.

37
Q

Q-Q-plot

A

Splitst de data in zogenoemde kwantielen (‘quantiles’, daarom ‘Q’). Kwantielen zijn de breekpunten tussen even grote delen van de data.

38
Q

Kwantielen

A

Zijn de breekpunten tussen even grote delen van de data.

39
Q

boxplot

A

Drie kwartielen worden geplot, dat wil zeggen de breekpunten die de data in vier even grote delen splitsen.

40
Q

betrouwbaarheidsinterval (‘confidence interval’)

A

Geeft een indicatie van de accuraatheid van een maat uit een steekproef.

41
Q

steekproevenverdeling, oftewel de sampling distribution

A

De theoretische verdeling van een bepaalde maat (bijvoorbeeld het gemiddelde) die je krijgt als je een oneindig aantal steekproeven uit een populatie zou trekken.

41
Q

steekproevenverdeling van het gemiddelde

A

Deze theoretische verdeling van alle mogelijke gemiddelden in een populatie.

42
Q

centrale limietstelling

A

Stelt dat naarmate we meer steekproeven trekken, de steekproevenverdeling van het gemiddelde steeds meer op de normaalverdeling zal lijken.

43
Q

standaardfout (‘standard error’)

A

De standaarddeviatie van een steekproevenverdeling wordt de standaardfout (‘standard error’) genoemd. De standaardfout hangt af van de grootte van de steekproef, die in de uitleg hierboven oneindig vaak werd getrokken. Hoe groter de steekproef, hoe smaller (spitser) de steekproevenverdeling en dus hoe kleiner de standaardfout.

44
Q

betrouwbaarheidsinterval

A

Het interval om het steekproefgemiddelde heen dat in 95% van de steekproeven het populatiegemiddelde bevat.

45
Q

Reflectief meetmodel

A

Wordt verondersteld dat de latente variabele de oorzaak
is van de waarnemingen op de indicatoren. In het geval van intelligentie zou dit
betekenen dat iemands niveau van intelligentie de scores beïnvloedt die ze
behalen op de verschillende indicatoren (zoals IQ-tests). De waarnemingen (of
scores) op deze indicatoren “reflecteren” dus de onderliggende latente
variabele, in dit geval, intelligentie.
De antwoorden van deelnemers op vragen in een vragenlijst zijn bijvoorbeeld
indicatoren.

46
Q

Observationeel onderzoek

A

Onderzoek waarbij alle operationalisaties
meetinstrumenten zijn. Hier wordt dus geen variabele gemanipuleerd en er kunnen
dus geen conclusies getrokken worden over causaliteit. Ook wel correlationele
designs genoemd.

47
Q

Cross-sectioneel design

A

Er is maar één meetmoment. Alle data worden dus min
of meer gelijktijdig verzameld.

48
Q

longitudinaal design

A

Er zijn meerdere meetmomenten. Er zijn dus meerdere
sessies waarin operationalisaties van constructen gemeten worden Het kan ook
zijn dat er maar één sessie is met daarin meerdere meetmomenten.

49
Q

Attritie

A

Attritie verwijst naar de uitval van deelnemers in longitudinale studies,
wat een bron van bias kan zijn als de uitval niet willekeurig is.

50
Q

Randomisatie

A

Dit is het proces van het willekeurig toewijzen van deelnemers
aan verschillende groepen in een experiment om te zorgen voor equivalentie
tussen de groepen en om de invloed van confounders te verminderen.

51
Q

matching van condities

A

Dit verwijst naar het proces van het creëren van
groepen die gelijk zijn op alle bekende confounders.

51
Q

Confounder

A

Een derde variabele die het waargenomen verband tussen
twee andere variabelen verstoort of verandert.

52
Q

Quasi-Experimenteel Design

A

Mist de willekeurige toewijzing. In een quasi-
experiment zijn de condities al aanwezig en de onderzoeker heeft geen controle over wie in welke conditie terechtkomt.
Het gebrek aan willekeurige toewijzing maakt het moeilijker om causale verbanden te trekken omdat er een groter risico is op confounding.
(Dus minder power)

53
Q

Onafhankelijke Variabele

A

Stel, een onderzoeker wil het effect van slaap op
de concentratie van studenten onderzoeken. In dit geval is de hoeveelheid slaap
die de studenten krijgen de onafhankelijke variabele, omdat de onderzoeker
denkt dat dit de concentratie kan beïnvloeden. Het is het element dat kan
worden gemanipuleerd (bijvoorbeeld, studenten vragen om meer of minder te
slapen) of gemeten (hoeveel ze normaal slapen).

54
Q

Covarianten

A

Covarianten zijn typisch onafhankelijke variabelen in de zin dat ze niet worden
beïnvloed door de variabelen die je in je studie onderzoekt.

55
Q

univariate analyses

A

Brengen individuele variabelen in kaart,

56
Q

bivariate analyses

A

Ondezoeken het verband tussen twee variabelen.

57
Q

Centrum maten

A

Maten die het centrum van de datareeks aangeven (bijv.
gemiddelde, mediaan, modus).

58
Q

Verdelingsvormen

A

Verdelingsvormen verwijzen naar de manier waarop datapunten zijn verdeeld in
een dataset (mediaan,modus en gemiddelde). Ze kunnen worden gevisualiseerd
met behulp van grafieken zoals histogrammen en density plots.

59
Q

Unimodale verdeling

A

Een verdeling met een piek.

60
Q

Verdelingsmaten

A

Verdelingsmaten helpen bij het kwantificeren (het meetbaar maken) van de vorm van de verdeling.

60
Q

Binominale verdeling

A

Een verdeling met twee pieken, wat vaak wijst op de
aanwezigheid van twee subpopulaties binnen de data.

61
Q

Leptokurtische distributie

A

Een scherpere piek dan een normale distributie.
(Dus dicht bij het gemiddelde met dikke staarten en meer uitschieters)
Positieve kurtosis.

62
Q

Platykurtische distributie

A

Een plattere piek (rond het gemiddelde) dan een
normale distributie. (Minder geconcentreerd rond het gemiddelde, met dunne staarten, wat wijst op minder uitschieters.
Negatieve kurtosis.

63
Q

Z-scores

A

Zijn gestandaardiseerde waarden die aangeven hoeveel
standaarddeviaties een bepaald datapunt verwijderd is van het gemiddelde van
een verdeling. Ze zijn nuttig om te begrijpen hoe extreem een bepaalde waarde
is binnen een dataset.

63
Q

Verdeling

A

Een verdeling is het geheel van datapunten in een datareeks,
samengevat door de centrummaten, spreidingsmaten en verdelingsvorm. De
verdeling van steekproefscores is indicatief voor de verdeling in een populatie.
De centrale limietstelling beschrijft het fenomeen dat steekproevenverdelingen
van gemiddelden altijd normaal verdeeld zijn, behalve bij steekproeven die
uitzonderlijk klein zijn.

63
Q

Standaardiseren

A

Een manier om
getallen zo aan te passen dat je ze met elkaar kunt vergelijken, zelfs als ze
oorspronkelijk met verschillende schalen of maatstaven werden gemeten. Stel je
voor dat je gewichten meet in kilogrammen en iemand anders meet in ponden.
Om deze gewichten te vergelijken, zou je ze omzetten naar een
gemeenschappelijke maatstaf. Standaardiseren doet iets soortgelijks met
statistische gegevens.

64
Q

Normaalverdeling

A

Een symmetrische, eentoppige verdeling, waarbij het
gemiddelde, de mediaan en de modus allemaal gelijk zijn, en waarvoor geldt dat
twee derde van de datapunten binnen één standaarddeviatie van het
gemiddelde ligt en 95% binnen twee standaarddeviaties. Voor alle, behalve
uitzonderlijk kleine, steekproeven geldt dat de steekproevenverdeling van het
gemiddelde normaal verdeeld is. Dit fenomeen heet de centrale limietstelling.

65
Q
A
66
Q
A
67
Q
A