Hoofdstuk 3 Flashcards

Question 1

Q

datapunt

Answer

A

Een representatie van de uitkomst van een meting.

Question 2

Q

continue variabelen

Answer

A

Ze zijn meetbaar op een ononderbroken schaal en kunnen in de populatie oneindig veel waarden aannemen.

Question 3

Q

datareeks

Answer

A

Een reeks van meerdere datapunten die hetzelfde representeren.

Question 4

Q

nominale variabele/ meetniveau

Answer

A

Een variabele van het laagste meetniveau. De categorieën zijn alleen te benoemen, maar niet te ordenen. (bv geslacht, haarkleur)

Question 5

Q

dichotome variabele

Answer

A

Een nominale variabele die maar twee waarden kan aannemen.

Question 6

Q

Ordinaal meetniveau

Answer

A

De afstand tussen de geordende categorieën is onbekend: we kunnen de categorieën alleen maar ordenen. We noemen dit daarom een ordinale variabele. Omdat ordinale variabelen wel van hoog naar laag te ordenen zijn, hebben ze een hoger meetniveau dan nominale variabelen

Question 7

Q

categorische of discrete variabelen

Answer

A

Samen heten nominale en ordinale variabelen. De verschillende meetwaarden die deze variabelen kunnen aannemen zijn altijd categorieën, zoals ‘vrouw’, ‘MBO’, ‘minderjarig’ of ‘40-50 jaar’.

Question 8

Q

continue variabelen

Answer

A

Deze variabelen kunnen in theorie alle denkbare meetwaarden aannemen, meestal op een schaal van ‘min oneindig’ tot ‘plus oneindig’, waarbij waarden steeds onwaarschijnlijker worden naarmate ze verder van het gemiddelde af liggen. Twee continue variabelen kunnen, als ze op dezelfde schaal gemeten zijn, worden opgeteld of gemiddeld om een betekenisvol resultaat te verkrijgen.

Question 9

Q

Wat is het verschil tussen interval en ratio niveau binnen de continue variabelen?

Answer

A

Het verschil tussen deze twee meetniveaus is het al dan niet bestaan van een zogenaamd ‘absoluut nulpunt’, waardoor er wel of niet een verhouding tussen twee getallen uitgedrukt kan worden.

Question 10

Q

Ratio niveau/ variabele

Answer

A

Numerieke waarden met een betekenisvolle rangorde, gelijke intervallen, en een
waar nulpunt.
Bijvoorbeeld: leeftijd in jaren, inkomen in euro’s.

Question 11

Q

interval niveau/ variabele

Answer

A

Numerieke waarden met een betekenisvolle rangorde en gelijke intervallen
tussen de waarden, maar er is geen waar nulpunt.
Bijvoorbeeld: temperatuur in graden Celsius (waar 0 niet de afwezigheid van
temperatuur aangeeft).

Question 12

Q

dataset

Answer

A

Een verzameling datareeksen die zo zijn georganiseerd dat duidelijk is welke data bij elkaar horen.

Question 13

Q

Variabelenamen

Answer

A

Spreken zoveel mogelijk voor zichzelf: vermijd dus cryptische termen en afkortingen.

Question 14

Q

gemiddelde

Answer

A

Wordt berekend door alle getallen op te tellen en te delen door het aantal bij elkaar opgetelde getallen.

Question 15

Q

outlier

Answer

A

Een extreem datapunt.

Question 16

Q

Modus

Answer

A

De meest voorkomende waarde in de datareeks.

Question 17

Q

Mediaan

Answer

A

Het middelste datapunt in de datareeks.

Question 18

Q

Range, ook wel het bereik

Answer

A

Het verschil tussen het minimum en het maximum.

Question 19

Q

Interkwartielafstand (IQR)

Answer

A

Om de IQR te berekenen, worden de data weer geordend van laag naar hoog en vervolgens opgesplitst in vier kwartielen.

Question 20

Q

variatie oftewel sum of squares (SS)

Answer

A

De sum of squares is de som van de gekwadrateerde afwijkingen van het gemiddelde.

Question 21

Q

mean squares (MS)

Answer

A

Houdt rekening met het aantal datapunten en is daarom informatiever dan de Sum of Squares. Voor de mean squares bereken je het gemiddelde van de kwadraten, dat wil zeggen de som gedeeld door het aantal observaties.

Question 22

Q

vrijheidsgraden

Answer

A

Drukken uit hoeveel datapunten in een datareeks vrij kunnen variëren zonder dat de berekende statistiek verandert.

Question 23

Q

Standaardafwijking oftewel de standaarddeviatie (SD).

Answer

A

De standaardafwijking is de wortel van de variantie (mean squares) en geeft de gemiddelde afwijking van het gemiddelde weer (‘the mean distance to the mean’). Door de wortel te trekken van de mean squares is de standaarddeviatie op dezelfde schaal als het gemiddelde en daardoor makkelijker te interpreteren.

Question 24

Q

frequentieverdeling

Answer

A

Bestaat uit de frequenties, oftewel de aantallen, voor elke mogelijke meetwaarde. Dit is een overzicht van hoe vaak elke categorie of
waarde voorkomt in de dataset.

Question 25

Q

cumulatief percentage

Answer

A

Het percentage van een bepaalde meetwaarde (of categorie) samen met de percentages van alle lagere (of, van de andere kant bekeken, hogere) meetwaarden (of categorieën).

Question 26

Q

Over het algemeen zijn er drie termen die gebruikt worden om een verdelingsvorm te beschrijven

Answer

A

De modaliteit (‘toppigheid’), de scheefheid (‘skewness’) en de spitsheid (‘kurtosis’) van een verdeling-> De mate van aanwezigheid van deze vormen kunnen getoetst worden met de volgende verdelingsmaten: de Hartigans’ dip test (unimodaliteit), skewness (scheefheid) en kurtosis (spitsheid).

Question 27

Q

Modaliteit of toppigheid

Answer

A

Beschrijft het aantal toppen van een verdeling.

Question 28

Q

Scheefheid, oftewel ‘skewness’

Answer

A

Beschrijft of een verdeling symmetrisch of asymmetrisch is.

Question 29

Q

Spitsheid oftewel ‘kurtosis’

Answer

A

Beschrijft hoe spits of plat een verdeling is

Question 30

Q

uniforme verdeling

Answer

A

De ‘platste’ verdeling de verdeling waarbij alle waarden even vaak voorkomen.

Question 31

Q

leptokurte verdeling

Answer

A

Een verdeling die erg spits is.

Question 32

Q

platykurte verdeling

Answer

A

Een verdeling die erg plat is.

Question 33

Q

kurtosis

Answer

A

De verdelingsmaat die bij spitsheid hoort, heet ook kurtosis. De kurtosis is 0 bij een perfect normale verdeling. Naarmate een verdeling platter is, wordt de kurtosis steeds kleiner (dat is, meer negatief) en naarmate een verdeling spitser is, wordt de kurtosis steeds groter (dat is, meer positief).

Question 34

Q

normaalverdeling

Answer

A

Een unimodale, symmetrische verdeling, die niet bijzonder plat of spits is. Kenmerken:
* De normaalverdeling is unimodaal.
* De normaalverdeling is niet scheef (en dus perfect symmetrisch).
* De normaalverdeling is niet bijzonder spits of plat.
* 68% van de datapunten (ongeveer twee derde) ligt binnen ongeveer één standaarddeviatie van het gemiddelde.
* 95% van de datapunten ligt binnen ongeveer twee standaarddeviaties van het gemiddelde.
* 99,7% van de datapunten (dus bijna allemaal) ligt binnen ongeveer drie standaarddeviaties van het gemiddelde.

Question 35

Q

standaardnormale verdeling of z-verdeling

Answer

A

Een speciale vorm van de normale verdeling is een normaalverdeling met een gemiddelde van 0 en een standaarddeviatie van 1.

Question 36

Q

standaardisering

Answer

A

Datapunten omrekenen in z-scores, je kunt een waarde standaardiseren door het gemiddelde van deze waarde af te trekken en dat te delen door de standaarddeviatie.

Question 37

Q

‘dichtheid’/ density

Answer

A

Hoeveel datapunten er voor een gegeven meetwaarde zijn, en wordt daarom ook wel een density plot genoemd.

Question 38

Q

Q-Q-plot

Answer

A

Splitst de data in zogenoemde kwantielen (‘quantiles’, daarom ‘Q’). Kwantielen zijn de breekpunten tussen even grote delen van de data.

Question 39

Q

Kwantielen

Answer

A

Zijn de breekpunten tussen even grote delen van de data.

Question 40

Q

boxplot

Answer

A

Drie kwartielen worden geplot, dat wil zeggen de breekpunten die de data in vier even grote delen splitsen.

Question 41

Q

betrouwbaarheidsinterval (‘confidence interval’)

Answer

A

Geeft een indicatie van de accuraatheid van een maat uit een steekproef.

Question 42

Q

steekproevenverdeling, oftewel de sampling distribution

Answer

A

De theoretische verdeling van een bepaalde maat (bijvoorbeeld het gemiddelde) die je krijgt als je een oneindig aantal steekproeven uit een populatie zou trekken.

Question 43

Q

steekproevenverdeling van het gemiddelde

Answer

A

Deze theoretische verdeling van alle mogelijke gemiddelden in een populatie.

Question 44

Q

centrale limietstelling

Answer

A

Stelt dat naarmate we meer steekproeven trekken, de steekproevenverdeling van het gemiddelde steeds meer op de normaalverdeling zal lijken.

Question 45

Q

standaardfout (‘standard error’)

Answer

A

De standaarddeviatie van een steekproevenverdeling wordt de standaardfout (‘standard error’) genoemd. De standaardfout hangt af van de grootte van de steekproef, die in de uitleg hierboven oneindig vaak werd getrokken. Hoe groter de steekproef, hoe smaller (spitser) de steekproevenverdeling en dus hoe kleiner de standaardfout.

Question 46

Q

betrouwbaarheidsinterval

Answer

A

Het interval om het steekproefgemiddelde heen dat in 95% van de steekproeven het populatiegemiddelde bevat.

Question 47

Q

Reflectief meetmodel

Answer

A

Wordt verondersteld dat de latente variabele de oorzaak
is van de waarnemingen op de indicatoren. In het geval van intelligentie zou dit
betekenen dat iemands niveau van intelligentie de scores beïnvloedt die ze
behalen op de verschillende indicatoren (zoals IQ-tests). De waarnemingen (of
scores) op deze indicatoren “reflecteren” dus de onderliggende latente
variabele, in dit geval, intelligentie.
De antwoorden van deelnemers op vragen in een vragenlijst zijn bijvoorbeeld
indicatoren.

Question 48

Q

Observationeel onderzoek

Answer

A

Onderzoek waarbij alle operationalisaties
meetinstrumenten zijn. Hier wordt dus geen variabele gemanipuleerd en er kunnen
dus geen conclusies getrokken worden over causaliteit. Ook wel correlationele
designs genoemd.

Question 49

Q

Cross-sectioneel design

Answer

A

Er is maar één meetmoment. Alle data worden dus min
of meer gelijktijdig verzameld.

Question 50

Q

longitudinaal design

Answer

A

Er zijn meerdere meetmomenten. Er zijn dus meerdere
sessies waarin operationalisaties van constructen gemeten worden Het kan ook
zijn dat er maar één sessie is met daarin meerdere meetmomenten.

Question 51

Q

Attritie

Answer

A

Attritie verwijst naar de uitval van deelnemers in longitudinale studies,
wat een bron van bias kan zijn als de uitval niet willekeurig is.

Question 52

Q

Randomisatie

Answer

A

Dit is het proces van het willekeurig toewijzen van deelnemers
aan verschillende groepen in een experiment om te zorgen voor equivalentie
tussen de groepen en om de invloed van confounders te verminderen.

Question 53

Q

matching van condities

Answer

A

Dit verwijst naar het proces van het creëren van
groepen die gelijk zijn op alle bekende confounders.

Question 54

Q

Confounder

Answer

A

Een derde variabele die het waargenomen verband tussen
twee andere variabelen verstoort of verandert.

Question 55

Q

Quasi-Experimenteel Design

Answer

A

Mist de willekeurige toewijzing. In een quasi-
experiment zijn de condities al aanwezig en de onderzoeker heeft geen controle over wie in welke conditie terechtkomt.
Het gebrek aan willekeurige toewijzing maakt het moeilijker om causale verbanden te trekken omdat er een groter risico is op confounding.
(Dus minder power)

Question 56

Q

Onafhankelijke Variabele

Answer

A

Stel, een onderzoeker wil het effect van slaap op
de concentratie van studenten onderzoeken. In dit geval is de hoeveelheid slaap
die de studenten krijgen de onafhankelijke variabele, omdat de onderzoeker
denkt dat dit de concentratie kan beïnvloeden. Het is het element dat kan
worden gemanipuleerd (bijvoorbeeld, studenten vragen om meer of minder te
slapen) of gemeten (hoeveel ze normaal slapen).

Question 57

Q

Covarianten

Answer

A

Covarianten zijn typisch onafhankelijke variabelen in de zin dat ze niet worden
beïnvloed door de variabelen die je in je studie onderzoekt.

Question 58

Q

univariate analyses

Answer

A

Brengen individuele variabelen in kaart,

Question 59

Q

bivariate analyses

Answer

A

Ondezoeken het verband tussen twee variabelen.

Question 60

Q

Centrum maten

Answer

A

Maten die het centrum van de datareeks aangeven (bijv.
gemiddelde, mediaan, modus).

Question 61

Q

Verdelingsvormen

Answer

A

Verdelingsvormen verwijzen naar de manier waarop datapunten zijn verdeeld in
een dataset (mediaan,modus en gemiddelde). Ze kunnen worden gevisualiseerd
met behulp van grafieken zoals histogrammen en density plots.

Question 62

Q

Unimodale verdeling

Answer

A

Een verdeling met een piek.

Question 63

Q

Verdelingsmaten

Answer

A

Verdelingsmaten helpen bij het kwantificeren (het meetbaar maken) van de vorm van de verdeling.

Question 64

Q

Binominale verdeling

Answer

A

Een verdeling met twee pieken, wat vaak wijst op de
aanwezigheid van twee subpopulaties binnen de data.

Answer 65

A

Een scherpere piek dan een normale distributie.
(Dus dicht bij het gemiddelde met dikke staarten en meer uitschieters)
Positieve kurtosis.

Answer 66

A

Een plattere piek (rond het gemiddelde) dan een
normale distributie. (Minder geconcentreerd rond het gemiddelde, met dunne staarten, wat wijst op minder uitschieters.
Negatieve kurtosis.

Answer 67

A

Zijn gestandaardiseerde waarden die aangeven hoeveel
standaarddeviaties een bepaald datapunt verwijderd is van het gemiddelde van
een verdeling. Ze zijn nuttig om te begrijpen hoe extreem een bepaalde waarde
is binnen een dataset.

Answer 68

A

Een verdeling is het geheel van datapunten in een datareeks,
samengevat door de centrummaten, spreidingsmaten en verdelingsvorm. De
verdeling van steekproefscores is indicatief voor de verdeling in een populatie.
De centrale limietstelling beschrijft het fenomeen dat steekproevenverdelingen
van gemiddelden altijd normaal verdeeld zijn, behalve bij steekproeven die
uitzonderlijk klein zijn.

Answer 69

A

Een manier om
getallen zo aan te passen dat je ze met elkaar kunt vergelijken, zelfs als ze
oorspronkelijk met verschillende schalen of maatstaven werden gemeten. Stel je
voor dat je gewichten meet in kilogrammen en iemand anders meet in ponden.
Om deze gewichten te vergelijken, zou je ze omzetten naar een
gemeenschappelijke maatstaf. Standaardiseren doet iets soortgelijks met
statistische gegevens.

Answer 70

A

Een symmetrische, eentoppige verdeling, waarbij het
gemiddelde, de mediaan en de modus allemaal gelijk zijn, en waarvoor geldt dat
twee derde van de datapunten binnen één standaarddeviatie van het
gemiddelde ligt en 95% binnen twee standaarddeviaties. Voor alle, behalve
uitzonderlijk kleine, steekproeven geldt dat de steekproevenverdeling van het
gemiddelde normaal verdeeld is. Dit fenomeen heet de centrale limietstelling.