Thema 2 - T-Toets Flashcards
Het verifiëren van de data-integriteit
Datascreening
Wat zijn drie globale aspecten van datascreening?
- Controleren op onmogelijke waarden
- Controleren op uitbijters
- Controleren van verdelingsvormen
Wat zijn twee risico’s die een onderzoeker neemt bij het ‘codeloos’ verwijderen van data?
- Verlies van repliceerbaarheid
- Verlies van transparantie
Wat zijn twee soorten uitbijters?
- Univariate uitbijters
- Multivariate uitbijters
Wat zijn twee criteria die men kan hanteren om te bepalen of een waarde een uitbijter is?
- Of de waarde extreem afwijkt van het centrum
- Of de waarde (extreem veel) invloed heeft op het te schatten model
Wat zijn vier eenvoudige oplossingen voor uitbijters?
- Negeren
- Verwijderen (trimming)
- Verlagen van het meetniveau
- Winsorizing
De uitbijter aanpassen, zodat deze geen uitbijter meer is
Winsorizing
Wat zijn drie methoden voor het controleren van verdelingsvormen van de residuen?
- Visuele evaluatie
- Evaluatie van globale verdelingsvormkenmerken
- Toetsing van de verdelingsvorm tegen de kansverdeling
Wat zijn twee manieren voor visuele evaluatie van verdelingsvormen van de residuen?
- P-P plot
- Q-Q-plot
Plots waarin een veronderstelde cumulatieve kansverdeling uitgezet wordt tegen de cumulatieve steekproefverdeling
P-P-plots
Plots waarin de kwantielen van de theoretische kansverdeling worden uitgezet tegen de kwantielen van de steekproefverdeling
Q-Q-plots
Wat zijn twee verdelingsvormkenmerken?
- Kurtosis
- Skewness
Wat zijn twee manieren om de verdelingsvorm tegen de kansverdeling te toetsen?
- Kolmogorov-Smirnov
- Shapiro-Wilk
Datapatroon waarbij deelnemers op iedere vraag in een (deel van een) vragenlijst hetzelfde antwoord geven, of een rechtlijnig patroon volgen
Straightlining
Het herhalen van de analyse onder verschillende omstandigheden om te evalueren hoe repliceerbaar of robuust de resultaten zijn, door steeds iets te veranderen
Sensitiviteitsanalyse