Statistiek oefentoets Flashcards

1
Q

Aselecte steekproef

A

Er worden random respondenten uitgenodigd vanuit een lijkt van elementen in de populatie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Enkelvoudige aselecte steekproef

A

Lijst met elementen in de populatie
Random elementen selecteren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Gestratificeerde aselecte steekproef

A

Bij een gestratificeerde steekproef verdeel je de populatie in homogene subgroepen, of strata, op basis van relevante kenmerken voor je onderzoek (bijv. leeftijd, gewicht, inkomen et cetera). Vervolgens trek je uit elk stratum een steekproef.

Stel je bent geïnteresseerd in het meten van het gemiddelde inkomen van huishoudens in Amsterdam. Je weet dat er grote verschillen zijn in inkomen tussen verschillende delen van de stad.

Om een representatieve steekproef te verkrijgen, besluit je de stad op te delen in subgroepen op basis van de wijken, en vervolgens een steekproef te nemen uit elke wijk. De grootte van de steekproef kan worden bepaald op basis van het aantal huishoudens in elke wijk.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Systematische steekproef

A
  • Random startpunt selecteren, daarna selecteren met vast interval
  • Gebruiken als volgorde van invloed kan zijn.

(denk aan een straat, zo pak je van elk stukje van de straat een mening mee, bij enkelvoudige aselecte steekproef heb je misschien alles uit het begin van de straat)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Clustersteekproef

A

Wanneer de populatie wordt opgedeeld in clusters of groepen op basis van de geografische locatie en vervolgens willekeurig een aantal van deze clusters worden geselecteerd om als steekproef te dienen, spreekt men van een clustersteekproef. Je gebruikt een clustersteekproef doorgaans wanneer het niet praktisch of haalbaar is om individuen direct te selecteren uit de hele populatie, bijvoorbeeld wanneer de populatie te groot is of wanneer individuen verspreid zijn over een groot geografisch gebied.

Je bent geïnteresseerd in het meten van de prevalentie van diabetes onder de bevolking van een land. In plaats van alle individuen in het land te onderzoeken, besluit je een clustersteekproef te gebruiken

Je deelt het land op in geografische clusters, bijvoorbeeld steden of dorpen, en selecteert vervolgens willekeurig enkele van deze clusters om te onderzoeken. Binnen elke geselecteerde cluster worden dan alle individuen onderzocht.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Getrapte steekproef

A

Je doet onderzoek naar de arbeidsmarkt in een groot land en besluit een getrapte steekproef te doen. Je verdeelt de populatie eerst in regio’s, steden, wijken en straten.

In de eerste trap selecteer je willekeurig een aantal regio’s uit de populatie. In de tweede trap selecteer je willekeurig een aantal steden uit elke regio. Vervolgens selecteer je in de derde trap willekeurig een aantal wijken uit elke stad. In de vierde trap selecteer je willekeurig een aantal straten uit elke wijk.

Vervolgens worden de individuen die in de geselecteerde straten wonen, geselecteerd voor de steekproef en bevraagd door middel van een enquête of interviews.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

In welke vorm van statistiek wil je een conclusie trekken over de hele populatie op basis van een steekproef?

A

inferentiele statistiek

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Waar wordt dit symbool voor gebruikt?

σ

A

De standaarddeviatie in de populatie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Waar wordt dit symbool voor gebruikt?

M

A

steekproefgemiddelde

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

het symbool ‘s’ wordt gebruikt voor …

A

de steekproefstandaarddeviatie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

de modus is….

A

de waarde die het vaakst voorkomt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wat is het verschil tussen correlatie en causatie?

A

Correlatie betekent dat er een statistisch verband is tussen variabelen.

Causaliteit betekent dat een verandering in de ene variabele een verandering in de andere variabele veroorzaakt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

‘r’ staat voor …

A

de correlatiecoëfficiënt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Een correlatiecoëfficiënt kan alleen worden uitgerekend op welke niveau’s?

A

Interval/ratio niveau

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Het verschil tussen validiteit en betrouwbaarheid is:

A

Bij validiteit gaat het om het meten wat je beoogt te meten.

Bij betrouwbaarheid daarentegen gaat het om de vraag of je onderzoeksresultaten hetzelfde zouden zijn als je het onderzoek op dezelfde wijze nogmaals uitvoert.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

De p-waarde is de kans dat je …

A

het geobserveerde resultaat (of een extremer resultaat) vindt, aangenomen dat de nulhypothese waar is

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Worden griekse letters gebruikt bij de populatie of de steekproef?

A

populatie

μ = populatiegemiddelde

ρ = correlatie in de populatie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Noem de drie onderdelen van PAC

A
  • Population = de groep mensen (dieren, objecten) waar we onderzoek naar willen doen.
  • Association (verband/relatie) = de onderzoeker geeft aan welke relatie verwacht wordt. (plezier van eerste date neemt toe met meer contact via social media vooraf)
  • Constructs = De kenmerken die de onderzoeker wilt weten en meten en waartussen een verband verwacht wordt (plezier van eerste date & hoeveelheid social media contact vooraf)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

De conceptuele definitie

A

wat is verliefdheid? (wat bedoel je met het theoretische begrip)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

De operationele definitie

A

Hoe ga je de conceptuele definitie meetbaar maken?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Variabelen

A

Vragen of stellingen waar respondenten concreet op kunnen antwoorden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Begripsvaliditeit

A

meten we inhoudelijk wat we willen meten?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Inhoudsvaliditeit (content validity)

A

meet het meetinstument alle aspecten van zelfbeeld?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Indruksvaliditeit (face validity)

A

Experts kijken naar de vragenlijst, hoe beoordelen ze deze?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Convergente validiteit

A

komen de metingen van beide meetinstrumenten overeen?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Discriminante validiteit

A

Hangen de metingen van dit meetinstrument niet samen met andere kenmerken?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Criterium validiteit

A

Hangen de metingen van dit meetinstrument samen met gedragsmatige uitkomsten waarvan we weten dat er een verband hoort te zijn?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Interne validiteit

A

kunnen we een ‘goed’ antwoord geven op de onderzoeksvraag

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Externe validiteit

A

over welke populatie kunnen we op basis van onze steekproef conclusies trekken?

30
Q

Statistische validiteit

A

zijn de conclusies uit de statische
analyse te vertrouwen?

31
Q

Betrouwbaarheid

A

toevallige fouten, consistente antwoorden, hoe precies is de meting?

32
Q

In het response proces zijn er 4 fasen van antwoorden dit zijn: comprehension, retrieval, judgement en response.

Wat gebeurd er bij deze 4 stappen?

A

Comprehension = De respondent moet de vraag begrijpen

Retrieval = de respondent gaat graven in zijn geheugen (nuttige/niet nuttige informatie)

Judgement = De respondent heeft voor zichzelf bedacht wat voor een antwoord hij wilt geven (de zinvolle informatie)

Response = Dit is het antwoord wat er uiteindelijk echt uitkomt. Sociale grenzen etc…

33
Q

Wanneer gebruik je pearson en wanneer gebruik je spearman om een correlatiecoëfficiënt uit te rekenen?

A
  • Pearson correlatie: lineaire samenhang (en interval meetniveau)
  • Spearman correlatie: ook niet-lineaire samenhang, maar wel monotoon stijgend of dalend
34
Q

Noem de 5 stappen van NHST

A

Stap 1: toetskeuze, hypothese bepalen, significantie niveau kiezen
Stap 2: assumpties controleren
Stap 3: toetsingsgrootheid en p-waarde bepalen
Stap 4: conclusie trekken over Ho
Stap 5: Inhoudelijke conclusie en effect Groote bepalen

35
Q

Noem de assumpties bij het regressiemodel

A
  1. Lineaire samenhang tussen predictor en afhankelijke variabele
  2. Geen uitschieters (die teveel invloed hebben)
  3. Predictors en afhankelijke variabele hebben minimaal een interval meetniveau
  4. De predictoren mogen onderling niet teveel samenhangen (multi collinearity)
  5. Spreiding van residuen per x-waarde gelijk (homoscedasticity)
36
Q

Multi collinearity

A

Predictoren mogen niet teveel samenhangen.

37
Q

Dekkingsfout

A

Wanneer bepaalde personen niet terugkomen in de steekproef

38
Q

Steekproeffout

A

De steekproef is niet gelijk aan de populatie

39
Q

Non-responsfout

A

In een steekproef geeft niet altijd iedereen gehoor aan een verzoek om mee te doen aan onderzoek (unit-nonrespons, helemaal geen antwoord)

Mensen beantwoorden soms niet alle vragen (item-nonrespons, soms geen antwoord)

40
Q

Adjustment error

A

Aanpassingen die je doet na afname van de vragenlijst

Je werkt aan oplossing van die ene fout maar krijgt daardoor ook een andere fout

41
Q

Measurement error

A

meten we inhoudelijk wel wat we willen meten?

Begripsvaliditeit, stel je de goede vragen over het construct

Responsproces, kunnen respondenten goed antwoord geven op de vragen

42
Q

Processing error

A

interpretatie van de antwoorden door de onderzoeker

Hoe sportief ben je? (ik sport vier keer per week of ik hou niet van verliezen)

43
Q

Waarvoor wordt de Cronbach’s alfa gebruikt?

A

Om de betrouwbaarheid te meten.

44
Q

De voorwaarden om causaliteit aan te tonen zijn:

Experimenteel onderzoek is erg geschikt om causale relaties aan te tonen.

A
  • Corviance  Er moet een relatie zijn tussen oorzaak en gevolg
  • Temporal precedence  De oorzaak moet in de tijd voorafgaan aan het gevolg.
  • Internal validity  Alternatieve verklaringen voor de gevonden relatie moeten zijn uitgesloten.

De beste manier om aan de drie voorwaarden te voldoen is een gerandomiseerd experiment.

45
Q

Een onderzoeksvraag van een experimenteel onderzoek herken je aan PICO, wat is dit?

A
  • population  de groep mensen die de onderzoeker wilt onderzoeken
  • intervention  de variabelen die je manipuleert (onafhankelijke variabelen)
  • comparison  De niveaus van de gemanipuleerde variabele
  • outcome  gemeten variabelen
46
Q

Type 1 fout

A

Nulhypothese verwerpen maar dit hadden we niet moeten doen (verworpen)

47
Q

Type 2 fout

A

Nulhypothese niet verwerpen maar dit hadden we moeten doen (niet verworpen)

48
Q

De kans op een type 1 fout is gelijk aan …

A

Het significantieniveau (alfa)

49
Q

De power is de kans op …

A

de juiste beslissing

50
Q

Wanneer het significantieniveau kleiner wordt dan zal de power groter/kleiner worden?

A

kleiner

51
Q

Welke factoren zijn van invloed op power?

A
  • In de populatie is er een verschil, wat is de kans dat we dit vinden in onze steekproef?
  • Hoe groter het verschil in de populatie, hoe groter de kans dat H0 terecht verworpen wordt.
  • Spreiding van de scores
  • Significantieniveau (wanneer de alfa kleiner wordt dan de power ook)
52
Q

de assumpties voor de t toets voor onafhankelijke groepen zijn:

A
  • Aselecte steekproef
  • Afhankelijke variabele van interval/ratio meetniveau
  • Onafhankelijke waarnemingen / twee groepen zijn onafhankelijk
  • Geen uitschieters
  • Scores moeten in beide groepen normaal verdeeld zijn (histogram maken voor beide groepen)  robuustheid: er is niet aan de voorwaarde voldaan, maar het zal geen invloed hebben op de t-toets. Dit gebeurt wanneer groepen groter zijn dan 30.
  • Scores moeten in beide groepen gelijke spreiding hebben
53
Q

Design confounds (bedreigingen voor de interne validiteit)

A

was de gemanipuleerde variabele (nep medicijn) wel het enige verschil tussen de twee groepen? (alternatieve verklaringen)

54
Q

Maturation threat (bedreigingen voor de interne validiteit)

A

natuurlijke ontwikkeling, komt het door de training of ontwikkeling van kinderen?

55
Q

History threat (bedreigingen voor de interne validiteit)

A

externe gebeurtenis beïnvloed scores

56
Q

Regression of the mean (bedreigingen voor de interne validiteit)

A

groepen die extreem scoren, kunnen niet extremer scoren (kind dat extreem slecht scoort op rekenen, uiteindelijk haalt hij de volgende keer iets hoger) is dit toeval of betrouwbaar?

57
Q

Observer bias (bedreigingen voor de interne validiteit)

A

onderzoeker wilt graag dat experiment werkt  doe een blind of dubbel blind experiment, zo weet je niet wie uit de controle of experimentele groep komt.

58
Q

Demand characteristics (bedreigingen voor de interne validiteit)

A

de participanten willen graag dat het experiment werkt. Ook hier werkt een blind of dubbel blind experiment.

59
Q

Selectie-effect (bedreigingen voor de interne validiteit)

A

de groepen verschillen voordat het experiment begint

60
Q

Testing threats (bedreigingen voor de interne validiteit)

A

Respondenten worden beter in het invullen van de vragenlijsten

61
Q

Atrittion threats (bedreigingen voor de interne validiteit)

A

Respondenten vallen uit

62
Q

Instrument threats (bedreigingen voor de interne validiteit)

A

Wanneer het meetinstrument van de afhankelijke variabele tijdens het experiment verandert

63
Q

Noem het verschil tussen between subjects design en within subjects design (replicatie onderzoek)

A

Het verschil tussen experimentele groep en controle groep, dit noemen we between subjects design.

Als we het verschil tussen de voor en nameting analyseren noemen we within-subjects design.

64
Q

Directe replicatie

A

onderzoek wordt exact herhaald.

Voordeel: goed vergelijkbaar
Nadeel: Problemen met interne validiteit bij origineel onderzoek nog steeds aanwezig.

65
Q

Conceptuele replicatie

A

Aanpassingen zijn toegestaan

Voordeel: Mogelijkheid tot verbeteren
Nadeel: minder goed vergelijkbaar

66
Q

Replicatie + uitbreiding

A

De replica maar dan meer toevoegen (extra meetmoment, meer controlegroepen)

Voordeel: mogelijk aanvullende vragen onderzoek
Nadeel: minder goed vergelijkbaar

67
Q

Publication bias

A

onderzoek wordt alleen gepubliceerd als er een significant resultaat uit komt

68
Q

Questionable Research Practices

A

voor onderzoekers is het van belang dat hun onderzoek gepubliceerd wordt, dus zij worden verleid om te focussen op het vinden van een significant resultaat op-waarde onjuist rapporteren

o Data verwijderen om p-waarde te beïnvloeden
o Significantieniveau aanpassen om te ‘zorgen voor’ een significant resultaat
o Extra data verzamelen om te zien of het resultaat dan wel significant is
o Alleen verschillen tussen bepaalde groepen rapporteren (die wel significant zijn)

69
Q

Leg het verschil tussen NHST en Bayes uit:

A

Bij NHST nemen we de nulhypothese als uitgangspunt en verwerpen we deze als we hier bewijs tegen vinden.

Bij Bayes nemen we de data als uitgangspunt en kijken we hoeveel ondersteuning de nul/alternatieve ondersteuning krijgen (bij Bayes heb je het nooit over een significant resultaat)

70
Q

Kanskapitalisatie

A

de kans op een type 1 fout stapelt op