Thema 2 - T-Toets Flashcards
Het verifiëren van de data-integriteit
Datascreening
Wat zijn drie globale aspecten van datascreening?
- Controleren op onmogelijke waarden
- Controleren op uitbijters
- Controleren van verdelingsvormen
Wat zijn twee risico’s die een onderzoeker neemt bij het ‘codeloos’ verwijderen van data?
- Verlies van repliceerbaarheid
- Verlies van transparantie
Wat zijn twee soorten uitbijters?
- Univariate uitbijters
- Multivariate uitbijters
Wat zijn twee criteria die men kan hanteren om te bepalen of een waarde een uitbijter is?
- Of de waarde extreem afwijkt van het centrum
- Of de waarde (extreem veel) invloed heeft op het te schatten model
Wat zijn vier eenvoudige oplossingen voor uitbijters?
- Negeren
- Verwijderen (trimming)
- Verlagen van het meetniveau
- Winsorizing
De uitbijter aanpassen, zodat deze geen uitbijter meer is
Winsorizing
Wat zijn drie methoden voor het controleren van verdelingsvormen van de residuen?
- Visuele evaluatie
- Evaluatie van globale verdelingsvormkenmerken
- Toetsing van de verdelingsvorm tegen de kansverdeling
Wat zijn twee manieren voor visuele evaluatie van verdelingsvormen van de residuen?
- P-P plot
- Q-Q-plot
Plots waarin een veronderstelde cumulatieve kansverdeling uitgezet wordt tegen de cumulatieve steekproefverdeling
P-P-plots
Plots waarin de kwantielen van de theoretische kansverdeling worden uitgezet tegen de kwantielen van de steekproefverdeling
Q-Q-plots
Wat zijn twee verdelingsvormkenmerken?
- Kurtosis
- Skewness
Wat zijn twee manieren om de verdelingsvorm tegen de kansverdeling te toetsen?
- Kolmogorov-Smirnov
- Shapiro-Wilk
Datapatroon waarbij deelnemers op iedere vraag in een (deel van een) vragenlijst hetzelfde antwoord geven, of een rechtlijnig patroon volgen
Straightlining
Het herhalen van de analyse onder verschillende omstandigheden om te evalueren hoe repliceerbaar of robuust de resultaten zijn, door steeds iets te veranderen
Sensitiviteitsanalyse
Correctie voor de t-toets die rekening houdt met mogelijk verschillende varianties tussen de twee groepen
Welch’s t-toets
Toets die controleert of varianties tussen twee groepen gelijk zijn
Levene’s toets
Welke drie soorten Levene’s toetsen stellen Brown & Forsythe voor?
- Standaardtoets op basis van het gemiddelde
- Toets gebaseerd op mediaan
- Toets gebaseerd op trimmed mean
Wat zijn de drie assumpties van de onafhankelijke t-toets?
- De observaties zijn onafhankelijk
- De residuen zijn normaal verdeeld
- De varianties tussen groepen zijn gelijk (homogeniteit van varianties)
Extreme waarnemingen op één variabele en in vergelijking met andere waarnemingen in diezelfde variabele
Univariate uitbijters
Extreme combinaties van waarnemingen/een ongewone combinatie van scores op twee of meer variabelen
Multivariate uitbijters
Een populaire methode om multivariate extreme observaties te identificeren in de vorm van een meerdimensionaal scatterplot dat zo wordt gedraaid en vervormt dat de punten die de scatterplot vormen een cirkel- of meerdimensionale bolvorm hebben
Mahalanobis-afstand
Stelt dat de steekproevenverdeling (de gemiddelden van een oneindig aantal steekproeven) normaal verdeeld zal zijn, mits iedere steekproef voldoende groot is
Centrale limietstelling (CLT)
Wat zijn drie manieren om op uitbijters te controleren?
- Z-scores
- Interkwartielafstand
- Cook’s distance/leverage
Wat zijn vier manieren om de verdelingsvormen op te controleren?
- Visueel; P-P- en Q-Q-plots
- Skewness
- Kurtosis
- Kolmogorov-Smirnov en Shapiro-Wilk
Individuele observaties die erg veel afwijken van de overige observaties in de dataset
Uitbijters
(outliers, extreme waarden)
Wat zijn twee misconcepties over de assumptie van normaliteit?
- Dat een variabele normaal verdeeld moet zijn
- Dat bij een voldoende grote (N>30) de steekproef als normaal verdeeld verondersteld mag worden
Welke vier punten rondom datascreening moeten duidelijk zijn in de rapportage?
- Hoe je de datascreening hebt uitgevoerd
- Met welk criterium
- Het resultaat hiervan
- Wat je hebt gedaan in reactie daarop
Verschil tussen de gemiddelden van twee groepen, gecorrigeerd voor de standaarddeviatie
Cohen’s d
(standardised mean difference)
Uit welke twee stappen bestaat de t-toets?
- Berekenen t-waarde
- Bepalen van bijbehorende p-waarde met behulp van de t-verdeling
Het verschil tussen de geobserveerde en werkelijke waardes zijn overal gelijk
De residuen zijn normaal verdeeld
Waarmee wordt de assumptie dat de residuen normaal verdeeld zijn getoetst?
Shapiro-Wilk test met een alfa van 0.001
Waarmee wordt de assumptie dat de varianties tussen groepen gelijk zijn getoetst?
Levene’s toets met een alfa van 0.05
T-toets waarbij de continue variabele gemeten wordt bij verschillende personen, namelijk bij de twee te vergelijken groepen
Onafhankelijke t-toets
T-toets waarbij dezelfde variabele twee keer gemeten wordt bij dezelfde persoon, waardoor er een verband is tussen de twee metingen
Afhankelijke (gepaarde) t-toets
Gebruik van een andere centrummaat, of van een non-parametrische statistische methode
Verlagen van het meetniveau
Toetsen die zich enkel richten op de ordening van de scores zonder de intervallen tussen scores mee te wegen
Non-parametrische toetsen
Een robuuste F-toets die gebruikt kan worden in statistische toetsen waar groepen vergeleken worden én de assumptie geldt dat de varianties van de vergeleken groepen hetzelfde zijn, om deze assumptie te toetsen
Levene’s toets