Thema 3: Betrouwbaarheidsanalyse Flashcards
Wat zijn betrouwbaarheidsanalyses?
- Onderzoeken van de onderdelen van een meetinstrument. Of het correspondeert met responsmodel
- Onderdeel van data-screening
Wat is data-screening?
Kijken of de verzamelde datareeksen van elk item kloppen met het responsmodel bij dat item, zoals vastgesteld tijdens de ontwikkeling van het meetinstrument
Wat is een datapunt?
- Een representatie van de uitkomst van een meting
- Allerlei vormen
- Bits (reeksen 0 en 1en)
Wat is een datareeks?
- Meerdere datapunten
- Type: numeric, integer, float, string
- Factor: datareeks waarbij elk datapunt slechts een paar waarden aan kan nemen
- Ook een datareeks voor data
Welke 2 meetniveau’s bestaan er?
- Continu. Doorlopende schaal
- Categorisch. Discrete schaal
(3. Dichotome: categorisch en continue (interval))
Noem kenmerken van het continue meetniveau
- Doorlopende schaal
- Ratio en interval
- Numerieke datatype
Noem 3 kenmerken van categorisch meet niveau
- Discrete schaal
- Ordinaal en nominaal
- Factor datatype, soms string
Noem 4 redenen waarom het schadelijk is om variabele categorisch te meten als het continue gemeten kan worden
- Bij laag meetniveua zijn meer deelnemers nodig
- Continue variabelen zijn meer valide
- Van continue kun je naar lager niveau, andersom niet
- Categorsiche indeling geeft meer vertekening van de werkelijkheid
Noem 2 redenen waarom toch onderzoek wordt gedaan met categorische variabelen
- Manipulaties in experimenteel onderzoek zijn categorisch
- Valide en betrouwbare operationalisatie belangrijk
Geef 3 kenmerken voor goede variabelenamen
- Engelstalig
- Spreken voor zich
- Geen problematische karakters
- Machine-readability
vb. camelCase of snake_case
Noem 2 type bestandsformaten
- Open: .csv, .ods
- Proprietary: .spss
- Deels open: .xlsx
Noem een voordeel en nadeel van .csv bestandsformaat
+: Eenvoudig
-: Ondersteunt geen metadata
Waarom zijn individuele datapunten niet van belang?
Datareeksen worden verzameld om informatie te krijgen over een populatie. Patronen in datareeksen zijn belangrijker dan individuele datapunten omdat populaties gedefinieerd zijn als oneindig groot
Wat is de verdelingsvorm? Distribution
De manier waarop de datapunten om het gemiddelde heen liggen
Welke 3 termen worden gebruikt om een verdelingsvorm te beschrijven?
- Modaliteit (toppigheid) - Hartigans’ dip test
- Scheefheid (skewness)
- Spitsheid (kurtosis)
Noem 8 kenmerkenv an modaliteit/toppigheid
- Beschrijft aantal toppen van een verdeling
- Modus; meest voorkomende waarde in een datareeks. Vormt top in een verdeling
- Unimodaal of multimodaal. Ook bimodaal
- Doel: obv verdelingsform in steekproef iets te zeggen over verdelingsvorm in populatie
- Ambiguiteit door meetfout of onduidelijk beeld in populatie
- Multimodale verdelingen vaak indicatie dat populatie uit meerdere subpopulaties bestaat
- Verdelingsmaat: Hartigan’s diptest –> indicatie unimodaliteit (0).
- Grafiek én verdelingsmaat bekijken
Noem 3 kenmerken van scheefheid
- Beschrijft of een verdeling symmetrisch of asymmetrisch is
- Verdelingsmaat: skeweness. Perfect: 0
- Vuistregels: conservatief -1/1; liberaal pas schending bij -3/3
Noem 3 kenmerken van spitsheid/kurtosis
- Beschrijft hoe spits of plat een verdeling is
- Leptokurte - uniforme/platykurte verdeling
- Verdelingsmaat: kurtosis. 0 = perfect normale verdeling
- Vuistregels: conservatief -1/1, liberaal -3/3
Noem 6 kenmerken van de normale verdeling
- Unimodaal
- Symmetrisch
- Niet bijzonder spits of plat
- 68% vd datapunten binnen 1 stdv van het gemiddelde
- 955 vd datapunten binnen 2 stdv van het gemiddelde
- 99,7% vd datapunten binnen 3 stdv van het gemiddelde
Beschrijf de perfecte normale verdeling
Unimodaal (diptest 0), symmetrisch (skewness 0) en niet bijzonder spits of plat (kurtosis 0).
Wat is de standaardnormale verdeling / z-verdeling?
- Normaalverdeling met gemiddelde van 0 en stdv van 1
- Datapunten heten z-scores
- Standaardisering
Wat geeft de z-score aan?
Hoe ver een waarde van het gemiddelde af ligt
Als normaal verdeeld: ook informatie over hoe extreem dat datapunt is
Noem 2 kenmerken van standaardisering
- Vertaalt datareeksen naar zelfde schaal (0 is gemiddeld, 1 is een stdv)
- Standaardisering verandert de onderlinggende verdeling van de waarden niet!