College 1: Passer H4 en McCabe H1 Flashcards

Question 1

Q

Case/unit

Answer

A

subjecten/objecten in een dataset

Question 2

Q

Variabel

Answer

A

kenmerk van een case (geslacht, leeftijd etc.)

Question 3

Q

Categorische variabele

Answer

A

geen getallen (bijv. woonplaats, studie)

Question 4

Q

Kwantitatieve variabelen

Answer

A

in getallen (bijv. leeftijd, citoscore)

Question 5

Q

Score

Answer

A

waarde van een case/unit op een variabele (toets cijfer van bepaald persoon)

Question 6

Q

Label

Answer

A

speciale variabele gebruikt in sommige datasets om verschillende cases uniek te identificeren.

Question 7

Q

Discrete variabelen

Answer

A

1,2,3,4 – er zitten geen punten tussen de hele getallen. 1,23 kan niet.

Question 8

Q

Discrete data

Answer

A

binaire data (enkel 2 opties, bijv. M/V), nominale data, ordinale data, tellingen met hele getallen en kleine uitkomsten (bijv. aantal tablets/huishouden).

Question 9

Q

Continue variabelen

Answer

A

hierbij zijn punten tussen de hele getallen wel mogelijk

Question 10

Q

Continue data

Answer

A

tellingen met grote uitkomsten (bijv. totaal aantal werknemers in de stad Utrecht), getallen waar alles achter de komma ook betekenis heeft (temperatuur, tijd, lengte etc.)

Question 11

Q

Independent/zelfstandige variabelen

Answer

A

de oorzaak in een oorzaak-gevolg relatie

Question 12

Q

Dependent/afhankelijke variabelen

Answer

A

het gevolg in een oorzaak-gevolg relatie

Question 13

Q

Mediator variable

Answer

A

een variabele die een link vormt in de reeks tussen een onafhankelijke variabele en een afhankelijke variabele.

Question 14

Q

Moderator variable

Answer

A

een factor die de kracht of richting verandert tussen een onafhankelijke en een afhankelijke variabele.

Question 15

Q

Nominaal

Answer

A

geen volgorde, geen meeteenheid, geen nulpunt (geslacht). Vertegenwoordigen alleen kwalitatieve verschillen (verschillen in type in plaats van hoeveelheid).

Question 16

Q

Ordinaal

Answer

A

wel volgorde, geen meeteenheid, geen nulpunt (sociaaleconomische status, kinderen in een klas op volgorde zetten van meest naar minst populair). Vertegenwoordigen relatieve verschillen in de hoeveelheid van een attribuut.

Question 17

Q

Bar graphs/staafdiagrammen en pie charts

Answer

A

helpen ons bij categorische variabelen weer te geven welk deel van het geheel elke groep vormt

Question 18

Q

Interval

Answer

A

wel volgorde, wel meeteenheid, geen nulpunt. Gelijke afstanden tussen waarden op de schaal weerspiegelen gelijke verschillen in de hoeveelheid van het variabel dat wordt gemeten.

Question 19

Q

Ratio

Answer

A

wel volgorde, wel meeteenheid, wel nulpunt. Gelijke afstanden tussen waarden op de schaal weerspiegelen gelijke verschillen in de hoeveelheid van de variabele die wordt gemeten en de schaal ook een echt nulpunt heeft. Een waar nulpunt betekent dat het cijfer 0 ook echt de absentie van een variabel betekent. Bij een gewicht van 0, is er niks. Bij een afstand van 0, is er niks. Dat is het verschil met interval.

Question 20

Q

Stemplot/stam-bladgrafiek, histogrammen, frequentietabellen

Answer

A

zijn handig bij kwantitatieve variabelen

Question 21

Q

Hypothetical constructs

Answer

A

onderliggende kenmerken of processen die niet direct worden waargenomen, maar in plaats daarvan worden afgeleid uit meetbaar gedrag of resultaten. (als iemand bijvoorbeeld tegen jou heeft gezegd dat hij/zij honger heeft, dan weet je dat diegene honger heeft, maar je kan de honger niet letterlijk “zien”).

Question 22

Q

Accuracy/nauwkeurigheid van een meting

Answer

A

vertegenwoordigt de mate waarin de resultaten van de meting gelijk zijn aan een gegeven standaard.

Question 23

Q

Systematic error (bias)

Answer

A

een consistente fout die optreedt bij elke meting.

Question 24

Q

Random measurement error

Answer

A

willekeurige schommeling die tijdens de meting optreden en ervoor zorgen dat de verkregen scores afwijken van een echte score

Question 25

Q

unimodal

Answer

A

Als een distrubitie 1 piek heeft

Question 26

Q

bimodal

Answer

A

Als een distrubitie 2 pieken heeft

Question 27

Q

trimodal

Answer

A

Als een distrubitie 3 pieken heeft

Question 28

Q

skewed naar links

Answer

A

staart is links. De staart is langer aan de linkerkant, omdat er meer kleine waarden zijn. Het gemiddelde is lager dan de mediaan

Question 29

Q

skewed naar rechts

Answer

A

Staart is rechts. De staart is langer aan de rechterkant, omdat er meer grote waarden zijn. Het gemiddelde is groter dan de mediaan. Dit komt bij allebei de vormen, omdat de outliers meer invloed hebben op de gemiddelde.

Question 30

Q

Time plot

Answer

A

geeft elke meting van een variabel weer naast de tijd waarop hij werd gemeten. Plaats hierbij de tijd altijd op de horizontale schaal en de variabele op de verticale schaal.

Question 31

Q

five number summary

Answer

A

geeft ons een snelle samenvatting van de waarden. Hierin zitten het minimum, Q1, Mediaan (M), Q3 en maximum. Deze five number summary kunnen we weergeven in een boxplot. De lijnen aan de uiteinden van de lijn tussen minimum en maximum noemen we whiskers.

Question 32

Q

Interquartile Range (IQR)

Answer

A

afstand tussen Q1 en Q3. Berekenen: Q3 – Q1

Question 33

Q

Modified boxplot

Answer

A

gebruikt de 1.5 x IQR regel. De whiskers zitten hierbij op de 1.5 x IQR uiteinden en de waarden die daarbuiten vallen worden los aangeduid

Question 34

Q

Side-by-side boxplot

Answer

A

twee of meer boxplots in dezelfde grafiek

Question 35

Q

Variantie

Answer

A

zegt iets over de spreiding in een dataset

Question 36

Q

Standaarddeviatie (Sd)

Answer

A

De standaarddeviatie of standaardafwijking wordt afgeleid van de variantie en vertelt je hoe ver iedere waarde gemiddeld genomen van het gemiddelde verwijderd is. Hij meet dus de gemiddelde afstand van het gemiddelde.

Question 37

Q

Joint distribution

Answer

A

hierbij zijn alle cellen samen 100%

Question 38

Q

Marginal distribution

Answer

A

hierbij zijn de marginalen per categorie/rij

Question 39

Q

Conditional distribution

Answer

A

hierbij zijn cellen per rij/kolom 100%

Question 40

Q

Correlatie

Answer

A

een statistische associatie tussen variabelen. Er bestaat een correlatie tussen twee variabelen (X en Y) wanneer de scores of waarden van x op een niet-willekeurige manier worden geassocieerd met de scores of waarden van Y.

Question 41

Q

Correlationele (of relationele) research (onderzoek)

Answer

A

omvat het onderzoeken van mogelijke associaties tussen natuurlijk voorkomende variabelen, door die variabelen te meten en te bepalen of ze statistisch gerelateerd zijn.

Question 42

Q

Confounding variables

Answer

A

externe factoren die systematisch variëren met X en Y. Zijn ongewenst in zowel correlationeel als in experimenteel onderzoek omdat ze mogelijk de gewenste conclusie beïnvloeden (namelijk dat X invloed heeft op Y).

Question 43

Q

Positieve correlatie

Answer

A

betekent dat hogere scores of niveaus van de ene variabele vaak geassocieerd zijn met hogere scores van een andere variabele. Als X groter wordt, wordt Y ook groter en als X kleiner wordt, wordt Y ook kleiner.

Question 44

Q

Negatieve correlatie

Answer

A

betekent dat hogere scores of niveaus van de ene variabele vaak geassocieerd zijn met lage scores of niveaus van een andere variabele. Scores op X en Y hebben de neiging om in tegengestelde richting te bewegen: naarmate X toeneemt, neigt Y te dalen en andersom geldt hetzelfde.

Question 45

Q

Third-variable-problem

Answer

A

is het mogelijk dat X en Y op geen enkele causale manier zijn gelinkt; X veroorzaakt Y niet en Y veroorzaakt X niet. Er is dan wellicht een derde variabele; een confounding variabele die achter de schermen voorkomt maar de echte reden is voor de veranderingen in X of Y.

Question 46

Q

Anekdotische data

Answer

A

vertegenwoordigen losse cases die via een niet-systematische manier verkregen zijn, maar vaak onder onze aandacht komen omdat ze op de een of andere manier opvallend zijn. Deze zaken zijn niet per sé representatief voor een grotere groep zaken.
- Weinig zeggingskracht
- Kunnen gebruikt worden als basis waar later onderzoek naar gedaan kan worden.

Question 47

Q

Beschikbare data

Answer

A

je maakt gebruik van data die al voor jou verzameld zijn. Ze zijn dus voor een ander doel geproduceerd/beschikbaar gesteld, maar kunnen wel bruikbaar zijn voor jouw onderzoek/het beantwoorden van jouw vraag (bijv. bibliotheek, internet).

Question 48

Q

Observationele studie

Answer

A

we observeren individuen/onderzoekseenheden en meten variabelen die ons interesseren. Je zoekt verbanden maar met de individuen/onderzoekseenheden gebeurt niks (ze worden niet beïnvloed/gemanipuleerd)

Question 49

Q

Experiment

Answer

A

we proberen invloed uit te voeren op het proces (op de uitkomstmaten). We leggen opzettelijk een bepaalde voorwaarde/conditie op aan individuen, en we observeren hun reacties. De opgelegde voorwaarde wordt een treatment/intervention genoemd.

Question 50

Q

Experimentele units

Answer

A

bij wie het onderzoek wordt uitgevoerd

Question 51

Q

Uitkomsten (outcomes)

Answer

A

gemeten variabelen om de condities te vergelijken (afhankelijke variabelen)

Question 52

Q

Interventie (treatment)

Answer

A

resulteert in experimentele condities. De opgelegde voorwaarde/conditie aan de experimentele units.

Question 53

Q

Treatment group

Answer

A

groep die de conditie wordt opgelegd

Question 54

Q

Controlegroep

Answer

A

groep die de conditie niet wordt opgelegd, om te kijken of de conditie daadwerkelijk wat doet

Question 55

Q

Vergelijkend onderzoek (comparative experiment)

Answer

A

met een controle en behandelingsgroep. Zonder vergelijkend onderzoek treedt er mogelijk bias op

Question 56

Q

Aanpak in een experiment

Answer

A

Manipuleer een onafhankelijke variabele (x) (compare)
Controleer voor alle andere variabelen; om storende effecten te voorkomen (randomize)
Meet een afhankelijke variabele/uitkomst (y) meerdere keren (repeat)

Question 57

Q

Sampling

Answer

A

het doel ervan is om een deel van de populatie te bestuderen om een beeld te krijgen van de gehele populatie

Question 58

Q

Between-subject design

Answer

A

verschillende mensen testen elke conditie (toewijzing via random toewijzing). Van iedere deelnemer heb je een meting op de uitkomstmaat.

Question 59

Q

Within-subject design

Answer

A

alle participanten worden blootgesteld aan dezelfde condities. Dezelfde groep mensen test iedere keer dezelfde condities.

Question 60

Q

Potentiele problemen die kunnen ontstaan bij within-subject designs

Answer

A

verschillen zouden veroorzaakt kunnen worden door oefening uit eerdere testen.
## mensen zouden verveeld/vermoeid kunnen zijn geraakt bij de derde test.

Question 61

Q

Oplossing voor potentiele problemen bij within-subject designs

Answer

A

counterbalancing. Deelnemers worden in verschillende volgorden blootgesteld aan verschillende condities. De een test bijvoorbeeld in volgorde 123, de ander in 132 en de ander in 312 (etc.)

Question 62

Q

Simple random sample

Answer

A

voor alle mensen in de populatie willekeurig (random) een groep mensen kiezen (invloeden van buitenaf vallen tegenover elkaar weg). Iedere persoon in de populatie heeft evenveel kans om in de steekproef terecht te komen.

Question 63

Q

Stratified random sampling

Answer

A

populatie in gelijke groepen verdelen en uit elke groep een random groep mensen kiezen (matching)

Question 64

Q

Multistage random sampling

Answer

A

bijv. Nederland -> steden -> wijken -> uit elke wijk een random groep mensen kiezen.

Answer 65

A

gaat over de stabiliteit van metingen. Metingen moeten onder gelijkblijvende omstandigheden dezelfde resultaten opleveren.

Answer 66

A

de mate van samenhang tussen twee paralleltests. Twee of meer keren dezelfde meting toedienen aan dezelfde deelnemers, onder gelijkwaardige testomstandigheden. Hoe hoger de positieve correlatie, hoe hoger de equivalentie.

Answer 67

A

je meet de betrouwbaarheid door te kijken naar de samenhang tussen onderdelen van een meetinstrument met elkaar die gemeten zijn op één afname.

Answer 68

A

in hoeverre meet het instrument dat wat het verondersteld wordt te meten?

Answer 69

A

lijkt de test wel te meten wat hij pretendeert te meten? op het eerste gezicht

Answer 70

A

is het begrip zoals gemeten gelijk aan het begrip zoals bedoeld?

Answer 71

A

in hoeverre kan een meetinstrument een bepaald gedrag, buiten het meetinstrument, voorspellen? Richt zich op de relatie tussen de scores op een meting en de uitkomst. Bijvoorbeeld wanneer we iemands IQ meten en diegene scoort hoog, doet diegene dingen (criterium) in het dagelijks leven ook op een bepaalde manier waaruit die intelligentie blijkt?

Answer 72

A

bekijkt de constructen (conceptuele variabelen) die onderzoekers beweren te bestuderen, in feite de constructen zijn die ze manipuleren en meten (meten ze daadwerkelijk wat ze zeggen dat ze meten)

Answer 73

A

generaliseerbaarheid van de resultaten over situaties, methoden, perioden, populaties.

Answer 74

A

de mate waarin men juist oorzaak-gevolg conclusies trekt. De mate waarin een onderzoek ontwerp ons in staat stelt causale conclusies te trekken over het effect van een specifieke onafhankelijke variabele op een afhankelijke variabele.

Answer 75

A

betrouwbaarheid is een noodzakelijke maar niet voldoende voorwaarde voor validiteit.
- Een test met een lage betrouwbaarheid kan nooit valide zijn
- Een test met hoge betrouwbaarheid hoeft niet per se valide te zijn.
- Een test met een lage validiteit kan heel betrouwbaar zijn.

Answer 76

A

maat voor de onzekerheid over het optreden van een gebeurtenis. Dit is belangrijk voor inferentie (het afleiden van conclusies over de populatie vanuit data van geselecteerde individuen (steekproef)

Answer 77

A

een fenomeen waarvan we de uitkomst niet exact kunnen voorspellen maar waarvan de uitkomsten een regelmatige verdeling volgen bij een groot aantal herhalingen. (gooien van kop/munt)

Answer 78

A

alle mogelijke uitkomsten van een random phenomenon, bijvoorbeeld S = (K, M).

Answer 79

A

is een uitkomst of een reeks uitkomsten van een random phenomenon. Dat is dus een subset van de sample space S.

Answer 80

A

de kans op een uitkomst van een random phenomenon wordt uitgedrukt in de proportie dat de gebeurtenis voorkomt bij een groot aantal herhalingen.

Answer 81

A

de uitkomst op het ene moment heeft geen invloed op het volgende moment.

Answer 82

A

uitkomsten hebben niets gemeenschappelijks met elkaar. Kunnen niet tegelijkertijd voorkomen

Answer 83

A

De kans op een uitkomst ligt altijd tussen 0 en 1.
- Dit noteren we als 0 ≤ P ≤ 1.
- De kansen op alle mogelijke uitkomsten tellen altijd op tot 1, oftewel: P(S) = 1
- Het complement van gebeurtenis A (dus wanneer A NIET gebeurt), is altijd 1 - kans op A

Answer 84

A

bij elkaar uitsluitende gebeurtenissen (niet tegelijk). Dit moet samen altijd uitkomen op 1.
- P(A of B) = P(A) + P(B) – P(A en B (beiden)

Answer 85

A

als 2 gebeurtenissen geen uitkomsten gemeen hebben en dus niet samen kunnen voorkomen (disjoint), dan is de kans op de een OF de ander de som van beide kansen.
- P (A of B) = P(A) + P(B). Want P(A en B) is in deze gevallen gelijk aan 0.

Answer 86

A

Productregel voor onafhankelijke kansexperimenten. Event A heeft geen invloed op de uitkomst van event B.
P(A en B) = P(A) x P(B)