Thema 2 - T-Toets Flashcards

1
Q

Het verifiëren van de data-integriteit

A

Datascreening

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wat zijn drie globale aspecten van datascreening?

A
  1. Controleren op onmogelijke waarden
  2. Controleren op uitbijters
  3. Controleren van verdelingsvormen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wat zijn twee risico’s die een onderzoeker neemt bij het ‘codeloos’ verwijderen van data?

A
  1. Verlies van repliceerbaarheid
  2. Verlies van transparantie
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wat zijn twee soorten uitbijters?

A
  1. Univariate uitbijters
  2. Multivariate uitbijters
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wat zijn twee criteria die men kan hanteren om te bepalen of een waarde een uitbijter is?

A
  1. Of de waarde extreem afwijkt van het centrum
  2. Of de waarde (extreem veel) invloed heeft op het te schatten model
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wat zijn vier eenvoudige oplossingen voor uitbijters?

A
  1. Negeren
  2. Verwijderen (trimming)
  3. Verlagen van het meetniveau
  4. Winsorizing
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

De uitbijter aanpassen, zodat deze geen uitbijter meer is

A

Winsorizing

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wat zijn drie methoden voor het controleren van verdelingsvormen van de residuen?

A
  1. Visuele evaluatie
  2. Evaluatie van globale verdelingsvormkenmerken
  3. Toetsing van de verdelingsvorm tegen de kansverdeling
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wat zijn twee manieren voor visuele evaluatie van verdelingsvormen van de residuen?

A
  1. P-P plot
  2. Q-Q-plot
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Plots waarin een veronderstelde cumulatieve kansverdeling uitgezet wordt tegen de cumulatieve steekproefverdeling

A

P-P-plots

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Plots waarin de kwantielen van de theoretische kansverdeling worden uitgezet tegen de kwantielen van de steekproefverdeling

A

Q-Q-plots

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wat zijn twee verdelingsvormkenmerken?

A
  1. Kurtosis
  2. Skewness
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wat zijn twee manieren om de verdelingsvorm tegen de kansverdeling te toetsen?

A
  1. Kolmogorov-Smirnov
  2. Shapiro-Wilk
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Datapatroon waarbij deelnemers op iedere vraag in een (deel van een) vragenlijst hetzelfde antwoord geven, of een rechtlijnig patroon volgen

A

Straightlining

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Het herhalen van de analyse onder verschillende omstandigheden om te evalueren hoe repliceerbaar of robuust de resultaten zijn, door steeds iets te veranderen

A

Sensitiviteitsanalyse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Correctie voor de t-toets die rekening houdt met mogelijk verschillende varianties tussen de twee groepen

A

Welch’s t-toets

17
Q

Toets die controleert of varianties tussen twee groepen gelijk zijn

A

Levene’s toets

18
Q

Welke drie soorten Levene’s toetsen stellen Brown & Forsythe voor?

A
  1. Standaardtoets op basis van het gemiddelde
  2. Toets gebaseerd op mediaan
  3. Toets gebaseerd op trimmed mean
19
Q

Wat zijn de drie assumpties van de onafhankelijke t-toets?

A
  1. De observaties zijn onafhankelijk
  2. De residuen zijn normaal verdeeld
  3. De varianties tussen groepen zijn gelijk (homogeniteit van varianties)
20
Q

Extreme waarnemingen op één variabele en in vergelijking met andere waarnemingen in diezelfde variabele

A

Univariate uitbijters

21
Q

Extreme combinaties van waarnemingen/een ongewone combinatie van scores op twee of meer variabelen

A

Multivariate uitbijters

22
Q

Een populaire methode om multivariate extreme observaties te identificeren in de vorm van een meerdimensionaal scatterplot dat zo wordt gedraaid en vervormt dat de punten die de scatterplot vormen een cirkel- of meerdimensionale bolvorm hebben

A

Mahalanobis-afstand

23
Q

Stelt dat de steekproevenverdeling (de gemiddelden van een oneindig aantal steekproeven) normaal verdeeld zal zijn, mits iedere steekproef voldoende groot is

A

Centrale limietstelling (CLT)

24
Q

Wat zijn drie manieren om op uitbijters te controleren?

A
  1. Z-scores
  2. Interkwartielafstand
  3. Cook’s distance/leverage
25
Q

Wat zijn vier manieren om de verdelingsvormen op te controleren?

A
  1. Visueel; P-P- en Q-Q-plots
  2. Skewness
  3. Kurtosis
  4. Kolmogorov-Smirnov en Shapiro-Wilk
26
Q

Individuele observaties die erg veel afwijken van de overige observaties in de dataset

A

Uitbijters
(outliers, extreme waarden)

27
Q

Wat zijn twee misconcepties over de assumptie van normaliteit?

A
  1. Dat een variabele normaal verdeeld moet zijn
  2. Dat bij een voldoende grote (N>30) de steekproef als normaal verdeeld verondersteld mag worden
28
Q

Welke vier punten rondom datascreening moeten duidelijk zijn in de rapportage?

A
  1. Hoe je de datascreening hebt uitgevoerd
  2. Met welk criterium
  3. Het resultaat hiervan
  4. Wat je hebt gedaan in reactie daarop
29
Q

Verschil tussen de gemiddelden van twee groepen, gecorrigeerd voor de standaarddeviatie

A

Cohen’s d
(standardised mean difference)

30
Q

Uit welke twee stappen bestaat de t-toets?

A
  1. Berekenen t-waarde
  2. Bepalen van bijbehorende p-waarde met behulp van de t-verdeling
31
Q

Het verschil tussen de geobserveerde en werkelijke waardes zijn overal gelijk

A

De residuen zijn normaal verdeeld

32
Q

Waarmee wordt de assumptie dat de residuen normaal verdeeld zijn getoetst?

A

Shapiro-Wilk test met een alfa van 0.001

33
Q

Waarmee wordt de assumptie dat de varianties tussen groepen gelijk zijn getoetst?

A

Levene’s toets met een alfa van 0.05

34
Q

T-toets waarbij de continue variabele gemeten wordt bij verschillende personen, namelijk bij de twee te vergelijken groepen

A

Onafhankelijke t-toets

35
Q

T-toets waarbij dezelfde variabele twee keer gemeten wordt bij dezelfde persoon, waardoor er een verband is tussen de twee metingen

A

Afhankelijke (gepaarde) t-toets

36
Q

Gebruik van een andere centrummaat, of van een non-parametrische statistische methode

A

Verlagen van het meetniveau

37
Q

Toetsen die zich enkel richten op de ordening van de scores zonder de intervallen tussen scores mee te wegen

A

Non-parametrische toetsen

38
Q

Een robuuste F-toets die gebruikt kan worden in statistische toetsen waar groepen vergeleken worden én de assumptie geldt dat de varianties van de vergeleken groepen hetzelfde zijn, om deze assumptie te toetsen

A

Levene’s toets