College 1: Passer H4 en McCabe H1 Flashcards

1
Q

Case/unit

A

subjecten/objecten in een dataset

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Variabel

A

kenmerk van een case (geslacht, leeftijd etc.)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Categorische variabele

A

geen getallen (bijv. woonplaats, studie)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Kwantitatieve variabelen

A

in getallen (bijv. leeftijd, citoscore)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Score

A

waarde van een case/unit op een variabele (toets cijfer van bepaald persoon)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Label

A

speciale variabele gebruikt in sommige datasets om verschillende cases uniek te identificeren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Discrete variabelen

A

1,2,3,4 – er zitten geen punten tussen de hele getallen. 1,23 kan niet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Discrete data

A

binaire data (enkel 2 opties, bijv. M/V), nominale data, ordinale data, tellingen met hele getallen en kleine uitkomsten (bijv. aantal tablets/huishouden).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Continue variabelen

A

hierbij zijn punten tussen de hele getallen wel mogelijk

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Continue data

A

tellingen met grote uitkomsten (bijv. totaal aantal werknemers in de stad Utrecht), getallen waar alles achter de komma ook betekenis heeft (temperatuur, tijd, lengte etc.)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Independent/zelfstandige variabelen

A

de oorzaak in een oorzaak-gevolg relatie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Dependent/afhankelijke variabelen

A

het gevolg in een oorzaak-gevolg relatie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Mediator variable

A

een variabele die een link vormt in de reeks tussen een onafhankelijke variabele en een afhankelijke variabele.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Moderator variable

A

een factor die de kracht of richting verandert tussen een onafhankelijke en een afhankelijke variabele.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Nominaal

A

geen volgorde, geen meeteenheid, geen nulpunt (geslacht). Vertegenwoordigen alleen kwalitatieve verschillen (verschillen in type in plaats van hoeveelheid).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Ordinaal

A

wel volgorde, geen meeteenheid, geen nulpunt (sociaaleconomische status, kinderen in een klas op volgorde zetten van meest naar minst populair). Vertegenwoordigen relatieve verschillen in de hoeveelheid van een attribuut.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Bar graphs/staafdiagrammen en pie charts

A

helpen ons bij categorische variabelen weer te geven welk deel van het geheel elke groep vormt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Interval

A

wel volgorde, wel meeteenheid, geen nulpunt. Gelijke afstanden tussen waarden op de schaal weerspiegelen gelijke verschillen in de hoeveelheid van het variabel dat wordt gemeten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Ratio

A

wel volgorde, wel meeteenheid, wel nulpunt. Gelijke afstanden tussen waarden op de schaal weerspiegelen gelijke verschillen in de hoeveelheid van de variabele die wordt gemeten en de schaal ook een echt nulpunt heeft. Een waar nulpunt betekent dat het cijfer 0 ook echt de absentie van een variabel betekent. Bij een gewicht van 0, is er niks. Bij een afstand van 0, is er niks. Dat is het verschil met interval.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Stemplot/stam-bladgrafiek, histogrammen, frequentietabellen

A

zijn handig bij kwantitatieve variabelen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Hypothetical constructs

A

onderliggende kenmerken of processen die niet direct worden waargenomen, maar in plaats daarvan worden afgeleid uit meetbaar gedrag of resultaten. (als iemand bijvoorbeeld tegen jou heeft gezegd dat hij/zij honger heeft, dan weet je dat diegene honger heeft, maar je kan de honger niet letterlijk “zien”).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Accuracy/nauwkeurigheid van een meting

A

vertegenwoordigt de mate waarin de resultaten van de meting gelijk zijn aan een gegeven standaard.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Systematic error (bias)

A

een consistente fout die optreedt bij elke meting.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Random measurement error

A

willekeurige schommeling die tijdens de meting optreden en ervoor zorgen dat de verkregen scores afwijken van een echte score

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

unimodal

A

Als een distrubitie 1 piek heeft

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

bimodal

A

Als een distrubitie 2 pieken heeft

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

trimodal

A

Als een distrubitie 3 pieken heeft

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

skewed naar links

A

staart is links. De staart is langer aan de linkerkant, omdat er meer kleine waarden zijn. Het gemiddelde is lager dan de mediaan

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

skewed naar rechts

A

Staart is rechts. De staart is langer aan de rechterkant, omdat er meer grote waarden zijn. Het gemiddelde is groter dan de mediaan. Dit komt bij allebei de vormen, omdat de outliers meer invloed hebben op de gemiddelde.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Time plot

A

geeft elke meting van een variabel weer naast de tijd waarop hij werd gemeten. Plaats hierbij de tijd altijd op de horizontale schaal en de variabele op de verticale schaal.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

five number summary

A

geeft ons een snelle samenvatting van de waarden. Hierin zitten het minimum, Q1, Mediaan (M), Q3 en maximum. Deze five number summary kunnen we weergeven in een boxplot. De lijnen aan de uiteinden van de lijn tussen minimum en maximum noemen we whiskers.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

Interquartile Range (IQR)

A

afstand tussen Q1 en Q3. Berekenen: Q3 – Q1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

Modified boxplot

A

gebruikt de 1.5 x IQR regel. De whiskers zitten hierbij op de 1.5 x IQR uiteinden en de waarden die daarbuiten vallen worden los aangeduid

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

Side-by-side boxplot

A

twee of meer boxplots in dezelfde grafiek

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

Variantie

A

zegt iets over de spreiding in een dataset

36
Q

Standaarddeviatie (Sd)

A

De standaarddeviatie of standaardafwijking wordt afgeleid van de variantie en vertelt je hoe ver iedere waarde gemiddeld genomen van het gemiddelde verwijderd is. Hij meet dus de gemiddelde afstand van het gemiddelde.

37
Q

Joint distribution

A

hierbij zijn alle cellen samen 100%

38
Q

Marginal distribution

A

hierbij zijn de marginalen per categorie/rij

39
Q

Conditional distribution

A

hierbij zijn cellen per rij/kolom 100%

40
Q

Correlatie

A

een statistische associatie tussen variabelen. Er bestaat een correlatie tussen twee variabelen (X en Y) wanneer de scores of waarden van x op een niet-willekeurige manier worden geassocieerd met de scores of waarden van Y.

41
Q

Correlationele (of relationele) research (onderzoek)

A

omvat het onderzoeken van mogelijke associaties tussen natuurlijk voorkomende variabelen, door die variabelen te meten en te bepalen of ze statistisch gerelateerd zijn.

42
Q

Confounding variables

A

externe factoren die systematisch variëren met X en Y. Zijn ongewenst in zowel correlationeel als in experimenteel onderzoek omdat ze mogelijk de gewenste conclusie beïnvloeden (namelijk dat X invloed heeft op Y).

43
Q

Positieve correlatie

A

betekent dat hogere scores of niveaus van de ene variabele vaak geassocieerd zijn met hogere scores van een andere variabele. Als X groter wordt, wordt Y ook groter en als X kleiner wordt, wordt Y ook kleiner.

44
Q

Negatieve correlatie

A

betekent dat hogere scores of niveaus van de ene variabele vaak geassocieerd zijn met lage scores of niveaus van een andere variabele. Scores op X en Y hebben de neiging om in tegengestelde richting te bewegen: naarmate X toeneemt, neigt Y te dalen en andersom geldt hetzelfde.

45
Q

Third-variable-problem

A

is het mogelijk dat X en Y op geen enkele causale manier zijn gelinkt; X veroorzaakt Y niet en Y veroorzaakt X niet. Er is dan wellicht een derde variabele; een confounding variabele die achter de schermen voorkomt maar de echte reden is voor de veranderingen in X of Y.

46
Q

Anekdotische data

A

vertegenwoordigen losse cases die via een niet-systematische manier verkregen zijn, maar vaak onder onze aandacht komen omdat ze op de een of andere manier opvallend zijn. Deze zaken zijn niet per sé representatief voor een grotere groep zaken.
- Weinig zeggingskracht
- Kunnen gebruikt worden als basis waar later onderzoek naar gedaan kan worden.

47
Q

Beschikbare data

A

je maakt gebruik van data die al voor jou verzameld zijn. Ze zijn dus voor een ander doel geproduceerd/beschikbaar gesteld, maar kunnen wel bruikbaar zijn voor jouw onderzoek/het beantwoorden van jouw vraag (bijv. bibliotheek, internet).

48
Q

Observationele studie

A

we observeren individuen/onderzoekseenheden en meten variabelen die ons interesseren. Je zoekt verbanden maar met de individuen/onderzoekseenheden gebeurt niks (ze worden niet beïnvloed/gemanipuleerd)

49
Q

Experiment

A

we proberen invloed uit te voeren op het proces (op de uitkomstmaten). We leggen opzettelijk een bepaalde voorwaarde/conditie op aan individuen, en we observeren hun reacties. De opgelegde voorwaarde wordt een treatment/intervention genoemd.

50
Q

Experimentele units

A

bij wie het onderzoek wordt uitgevoerd

51
Q

Uitkomsten (outcomes)

A

gemeten variabelen om de condities te vergelijken (afhankelijke variabelen)

52
Q

Interventie (treatment)

A

resulteert in experimentele condities. De opgelegde voorwaarde/conditie aan de experimentele units.

53
Q

Treatment group

A

groep die de conditie wordt opgelegd

54
Q

Controlegroep

A

groep die de conditie niet wordt opgelegd, om te kijken of de conditie daadwerkelijk wat doet

55
Q

Vergelijkend onderzoek (comparative experiment)

A

met een controle en behandelingsgroep. Zonder vergelijkend onderzoek treedt er mogelijk bias op

56
Q

Aanpak in een experiment

A
  1. Manipuleer een onafhankelijke variabele (x) (compare)
  2. Controleer voor alle andere variabelen; om storende effecten te voorkomen (randomize)
  3. Meet een afhankelijke variabele/uitkomst (y) meerdere keren (repeat)
57
Q

Sampling

A

het doel ervan is om een deel van de populatie te bestuderen om een beeld te krijgen van de gehele populatie

58
Q

Between-subject design

A

verschillende mensen testen elke conditie (toewijzing via random toewijzing). Van iedere deelnemer heb je een meting op de uitkomstmaat.

59
Q

Within-subject design

A

alle participanten worden blootgesteld aan dezelfde condities. Dezelfde groep mensen test iedere keer dezelfde condities.

60
Q

Potentiele problemen die kunnen ontstaan bij within-subject designs

A
  • verschillen zouden veroorzaakt kunnen worden door oefening uit eerdere testen.
  • ## mensen zouden verveeld/vermoeid kunnen zijn geraakt bij de derde test.
61
Q

Oplossing voor potentiele problemen bij within-subject designs

A

counterbalancing. Deelnemers worden in verschillende volgorden blootgesteld aan verschillende condities. De een test bijvoorbeeld in volgorde 123, de ander in 132 en de ander in 312 (etc.)

62
Q

Simple random sample

A

voor alle mensen in de populatie willekeurig (random) een groep mensen kiezen (invloeden van buitenaf vallen tegenover elkaar weg). Iedere persoon in de populatie heeft evenveel kans om in de steekproef terecht te komen.

63
Q

Stratified random sampling

A

populatie in gelijke groepen verdelen en uit elke groep een random groep mensen kiezen (matching)

64
Q

Multistage random sampling

A

bijv. Nederland -> steden -> wijken -> uit elke wijk een random groep mensen kiezen.

65
Q

Betrouwbaarheid

A

gaat over de stabiliteit van metingen. Metingen moeten onder gelijkblijvende omstandigheden dezelfde resultaten opleveren.

66
Q

Test-hertestbetrouwbaarheid (equivalentie)

A

de mate van samenhang tussen twee paralleltests. Twee of meer keren dezelfde meting toedienen aan dezelfde deelnemers, onder gelijkwaardige testomstandigheden. Hoe hoger de positieve correlatie, hoe hoger de equivalentie.

67
Q

Interne consistentie betrouwbaarheid

A

je meet de betrouwbaarheid door te kijken naar de samenhang tussen onderdelen van een meetinstrument met elkaar die gemeten zijn op één afname.

68
Q

Validiteit

A

in hoeverre meet het instrument dat wat het verondersteld wordt te meten?

69
Q

Indruksvaliditeit/face validity

A

lijkt de test wel te meten wat hij pretendeert te meten? op het eerste gezicht

70
Q

Content validity

A

is het begrip zoals gemeten gelijk aan het begrip zoals bedoeld?

71
Q

Criteriumvaliditeit/criterion validity

A

in hoeverre kan een meetinstrument een bepaald gedrag, buiten het meetinstrument, voorspellen? Richt zich op de relatie tussen de scores op een meting en de uitkomst. Bijvoorbeeld wanneer we iemands IQ meten en diegene scoort hoog, doet diegene dingen (criterium) in het dagelijks leven ook op een bepaalde manier waaruit die intelligentie blijkt?

72
Q

Constructvaliditeit

A

bekijkt de constructen (conceptuele variabelen) die onderzoekers beweren te bestuderen, in feite de constructen zijn die ze manipuleren en meten (meten ze daadwerkelijk wat ze zeggen dat ze meten)

73
Q

Externe validiteit

A

generaliseerbaarheid van de resultaten over situaties, methoden, perioden, populaties.

74
Q

Interne validiteit

A

de mate waarin men juist oorzaak-gevolg conclusies trekt. De mate waarin een onderzoek ontwerp ons in staat stelt causale conclusies te trekken over het effect van een specifieke onafhankelijke variabele op een afhankelijke variabele.

75
Q

Verband tussen betrouwbaarheid en validiteit

A

betrouwbaarheid is een noodzakelijke maar niet voldoende voorwaarde voor validiteit.
- Een test met een lage betrouwbaarheid kan nooit valide zijn
- Een test met hoge betrouwbaarheid hoeft niet per se valide te zijn.
- Een test met een lage validiteit kan heel betrouwbaar zijn.

76
Q

Kans

A

maat voor de onzekerheid over het optreden van een gebeurtenis. Dit is belangrijk voor inferentie (het afleiden van conclusies over de populatie vanuit data van geselecteerde individuen (steekproef)

77
Q

Random phenomenon

A

een fenomeen waarvan we de uitkomst niet exact kunnen voorspellen maar waarvan de uitkomsten een regelmatige verdeling volgen bij een groot aantal herhalingen. (gooien van kop/munt)

78
Q

Sample space (uitkomstruimte) S

A

alle mogelijke uitkomsten van een random phenomenon, bijvoorbeeld S = (K, M).

79
Q

Event (uitkomst)

A

is een uitkomst of een reeks uitkomsten van een random phenomenon. Dat is dus een subset van de sample space S.

80
Q

Probability

A

de kans op een uitkomst van een random phenomenon wordt uitgedrukt in de proportie dat de gebeurtenis voorkomt bij een groot aantal herhalingen.

81
Q

Independent trials

A

de uitkomst op het ene moment heeft geen invloed op het volgende moment.

82
Q

Disjoint

A

uitkomsten hebben niets gemeenschappelijks met elkaar. Kunnen niet tegelijkertijd voorkomen

83
Q

Kansregels I

A

De kans op een uitkomst ligt altijd tussen 0 en 1.
- Dit noteren we als 0 ≤ P ≤ 1.
- De kansen op alle mogelijke uitkomsten tellen altijd op tot 1, oftewel: P(S) = 1
- Het complement van gebeurtenis A (dus wanneer A NIET gebeurt), is altijd 1 - kans op A

84
Q

Kansregels II: Addition rule (algemene somregel)

A

bij elkaar uitsluitende gebeurtenissen (niet tegelijk). Dit moet samen altijd uitkomen op 1.
- P(A of B) = P(A) + P(B) – P(A en B (beiden)

85
Q

Kansregels III

A

als 2 gebeurtenissen geen uitkomsten gemeen hebben en dus niet samen kunnen voorkomen (disjoint), dan is de kans op de een OF de ander de som van beide kansen.
- P (A of B) = P(A) + P(B). Want P(A en B) is in deze gevallen gelijk aan 0.

86
Q

Kansregels IV: Productregel

A
  • Productregel voor onafhankelijke kansexperimenten. Event A heeft geen invloed op de uitkomst van event B.
    P(A en B) = P(A) x P(B)