data screening deel 1 Flashcards

1
Q
  • Wat is belangrijk voor de kwaliteit van een kwantitatieve studie?
A

Of de data van hoge kwaliteit is.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q
  • Wat is er belangrijk om rekening mee te houden als data bewerkt moet worden?
A

Dat het alleen een vorm is van schade beperken

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q
  • Wat is data screening?
A

Het opsporen van fouten in de data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q
  • Wat zijn onmogelijke waarden?
A

Waarden die niet passen binnen de schaal range

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q
  • Wat zijn invoerfouten?
A

Dat wordt er geen spatie gedaan bij het overnemen van de resutaten, 44

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q
  • Wat zijn onmogelijke waarden die niiet mogelijk zijn?
A

Als iemand sneller reageert dat menselijk gezien mogelijk is

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q
  • Hoe kunnen onmogelijke waarden het snelst worden gevonden?
A

Via frequentie tabellen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q
  • Hoe kunnen invoerfouten in de data worden gecontroleerd?
A

Door terug te gaan naar de ruwe data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q
  • Wat moet er gedaan worden als niet achterhaald kan worden wat de echte data moet zijn als er fouten zijn?
A

Dan moet dit worden gezien als een missende waarde

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q
  • Wat zijn risico’s van data verwijderen zonder code script?
A

Geen repliceerbaarheid, verlies van transparantie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q
  • Wat is een labjournal?
A

Hierin wordt tijdens het onderzoek alle relevante informatie in opgeslagen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q
  • Wat is de rol van een labjournal bij missende of onmogelijke waarden?
A

Dit kan helpen om onmogelijke waarden te repareren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q
  • Wat zijn uitbijters of outeliers?
A

Dit zijn individuele observaties die sterk afwijken van de rest

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q
  • Wat is het verschil tussen uitbijters en onmogelijke waarden?
A

Uitbijters zijn eventueel wel mogelijk binnen de data reeksen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q
  • Welke twee soorten uitbijters zijn er?
A

Univariate en multivariate

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q
  • Wat is een univariate uitbijter?
A

Een extreme binnen 1 variabele (IQ of leeftijd)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q
  • Wat zijn multivariate uitbijters?
A

Dan is een combinatie tussen twee variabelen een gekke waarde
(18 jaar en een salaris van 70.000

18
Q
  • Wat is het nadeel van uitbijters in de data?
A

Het weghalen of houden zorgt in beide gevallen voor vertekening in de data

19
Q
  • Welke twee criteria zijn er voor het vinden van uitbijters?
A

Wijkt de data af van het gemiddelde, heeft de waarde invloed op het model

20
Q
  • Welke 4 oplossingen zijn er voor het omgaan met uitbijters?
A

Negeren, verwijderen, andere centrummaat (verlagen meetniveau), aanpassen

21
Q
  • Wanneer wordt gekozen om een uitbijter te negeren?
A

Als deze niet zo veel invloed heeft op de uitkomsten

22
Q
  • Wanneer kan worden gekozen voor het verwijderen van de uitbijter?
A

Als de conclussie niet echt veranderd

23
Q
  • Wat is van belang in onderzoek of uitbijters wel of niet verwijderd worden?
A

Dat het gerapporteerd wordt in het onderzoek

24
Q
  • Wat wordt gedaan bij het verlagen van het meetniveau bij uitbijters?
A

Dan wordt de mediaan berekend, in plaats van gemiddelde
(interval naar ordinaal)

25
Q
  • Wat is het nadeel van het verlagen van het meetniveau (uitbijters)
A

Er is niet altijd een geschikte toetst die het effect kan meten

26
Q
  • Wat is winzorring van de uitbijter?
A

Het wordt veranderd naar een minder extreme waarde

27
Q
  • Wat is belangrijk bij de reportage als winzorring is toegepast?
A

Duidelijk vermelden wat is veranderd en dit rapporteren, eventueel een extra analyse doen

28
Q
  • Wat is een manier van uitbijters opzoeken?
A

Door dit te doen met een statistische toets

29
Q
  • Hoe om te gaan met uitbijters die statistische zijn opgezocht?
A

Hier moet voorzichting (niet te streng) mee worden omgegaan

30
Q
  • Hoe kunnen uitbijters statistische worden opgezocht bij een normaal verdeelde variabele?
A

Dan kan het worden omgezet naar Z-scores

31
Q
  • Wat is een Z-score?
A

Hoeveel STD’s een vriabele af ligt van het gemiddelde

32
Q
  • Wat is het voordeel aan z-scores voor uitbijters?
A

Het is niet afhankelijk van steekproef grootte

33
Q
  • Wat zijn gebruikelijke waarden om te hanteren voor Z-scores?
A

3.29

34
Q
  • Waarom zijn Z-scores geen hele goede manier van uitbijters opsporen?
A

Het gemiddelde en STD is gemaakt met de extreme waarde in de data

35
Q
  • Hoe worden uitbijters opgezocht als de verdeling scheef verdeeld is?
A

Dan wordt gekeken naar de mediaan, interkwartiel afstand

36
Q
  • Welke waarden worden gehanteerd bij box plots om uitbijters te identificeren?
A

3 keer de IQR, interkwartielafstand

37
Q
  • Wat is de mahalanobis afstand?
A

Een meervoudige scatterplot om multivariate uitbijters op te sporen

38
Q
  • Wat is straightlining?
A

Dan worden er opzettelijk patronen in de data gezet

39
Q
  • Wat is een manier hoe striaghtlining wordt geprobeerd op te zoeken?
A

Door de schaalwaarden in de vragenlijst om te draaien

40
Q
  • Hoe moet worden omgegaan met staightlining?
A

Dit moet worden verwijderd uit de data en de reden onderzocht worden

41
Q
  • Wat is een reden dat het eerste deel bij staightlining nog wel bruikbaar is?
A

Als het komt door uitputting