hoofdstuk 1 en 2 Flashcards
de empirische cyclus
is een methode die ons in staat stelt om kennis te verwerven. De cyclus bestaat uit het herhaaldelijk doorlopen van 5 stappen: observatie, inductie, deductie, toetsing en evaluatie
statistische geletterdheid
is het vermogen om te redeneren door middel van statistiek en data
statistiek
is de wetenschap van het leren uit data en van het meten, controleren en communiceren van onzekerheid
de 4 fases van het statistisch onderzoeksproces
1 het formuleren van de onderzoeksvraag
2 het ontwerpen van de studie en de dataverzameling
3 het verkennen en beschrijven van de data
4 het formuleren van conclusies die verder rijken dan de geobserveerde data
populatie
is de verzameling van subjecten die men wil bestuderen. In de gedragswetenschappen is dit vaak een grote groep personen
observationele eenheden
zijn de eenheden waarvan men data zal verzamelen
de steekproef
is een deel van de populatie
het steekproefkader
is de lijst met informatie over de personen in de populatie die we gebruiken om de steekproef samen te stellen
representatieve steekproef
is een steekproef die een goede weerspiegeling is van de populatie en haar karakteristieken die we wensen te onderzoeken
enkelvoudige aselecte/lukrake/willekeurige steekproeftrekking
is een steekproeftrekking waarbij elke steekproef dezelfde kans heeft om gekozen te worden
proportioneel gestratificeerde steekproeftrekking
is een steekproeftrekking waarbij we de populatie opdelen in een aantal strata. Binnen in een aantal strata en binnen elk stratum voeren we een enkelvoudige aselecte steekproeftrekking uit. De proportie personen per stratum in de steekproef is gelijk aan die in de populatie.
gemakshalve steekproeftrekking
is een steekproeftrekking die gemakkelijk uit te voeren was en waarbij vooral personen die makkelijker bereikbaar zijn een grote kans hebben om tot de steekproef te behoren. Dit kan leiden tot selectiebias.
selectiebias
is een vertekening waarbij sommige groepen in de populatie over- of ondervertegenwoordigd worden in je steekproef.
steekproefgrootte (n)
is gelijk aan het aantal elementen in de steekproef waarvoor we data hebben verzameld.
non-responders
zijn personen die, hoewel ze werden uitgenodigd, niet deelnemen aan de studie. Ze kunnen tot non-respons bias leiden.
non-respons bias
is een vertekening die kan optreden wanneer uitgenodigde personen toch niet deelnamen aan het onderzoek.
variabelen
zijn karakteristieken van de observationele eenheden die we wensen te onderzoeken. Deze kunnen variëren.
operationaliseren
is het meetbaar maken van de eigenschappen die men wenst te bestuderen.
de uitkomstvariabele
is de hoofdvariabele van de studie. We wensen inzicht te krijgen in deze variabele, waarbij we proberen te verklaren waarom deze variabele varieert.
verklarende/voorspellende variabelen of predictoren
zijn variabelen die ons in staat stellen (deels) te begrijpen waarom de uitkomstvariabele varieert
de controlevariabelen
zijn variabelen die substantiële verschillen tussen groepen in rekening brengen wanneer we groepen vergelijken
cross-sectionele studie
is een type van studie waarbij men variabelen slechts op één moment in de tijd bevraagt
longitudinale studie
is een type van studie waarbij men een of meerdere variabelen op verschillende momenten in de tijd bevraagt
observationele studie
is een type studie waarbij men enkel observeert zonder een interventie uit te voeren
replicatie
is een herhaling van een studie volgens dezelfde methodes als de oorspronkelijke studie, waarbij de conclusies in lijn zijn met die van de oorspronkelijke studie
HARKing (hypothedizing after the results are known)
is een werkwijze waarbij men onderzoekshypotheses opstelt op basis van bevindingen in de data en vervolgens diezelfde data gebruikt om deze hypotheses te toetsen. Dit is in strijd met de empirische cyclus.
een protocol
is een document waarin de onderzoekers schetsen wat het doel is van de studie, welke variabelen ze zullen meten, welke hypotheses ze zullen onderzoeken, hoe ze de steekproef zullen samenstellen en hoe ze de data zullen analyseren. Het verhoogt de repliceerbaarheid van de studie.
beschrijvende analyse
is een analyse waarbij we statistische methoden (tabellen, samenvattende maten en figuren) gebruiken om inzicht te krijgen in de data.
de verdeling van een variabele
is een variabele die weergeeft welke waarden de variabele kan aannemen en hoe vaak elke waarde wordt aangenomen. Dit kan uitgedrukt worden in absolute of relatieve frequenties.
de univariate verdeling
is de verdeling van één variabele
absolute frequentie van een waarde
is het aantal keer dat een waarde van een variabele voorkomt in de steekproef
relatieve frequentie van een waarde of proportie
is de absolute frequentie gedeeld door de steekproefgrootte
odds van een waarde
is het aantal keer dat een waarde van een variabele wordt aangenomen gedeeld door het aantal keer dat een andere waarde wordt aangenomen
staafdiagram
is de visualisatie van de verdeling van een variabele, waarbij per waarde van de variabele een staaf wordt getekend waarvan de hoogte gelijk is aan de absolute of relatieve frequentie van die waarde in de steekproef. De breedtes van de staven zijn gelijk.
kwalitatieve/categorische variabele
is een variabele met kenmerken of categorieën als waarden
kwantitatieve/numerieke variabele
is een variabele met getallen als waarden waarmee je zinnige rekenkundige bewerkingen kan uitvoeren
discreet
is de toestand waarbij een numerieke variabele een beperkt aantal verschillende waarden kan aannemen
continu
is de toestand waarbij een numerieke variabele vrij veel verschillende waarden kan aannemen
binaire variabele
is een variabele die slechts 2 waarden aanneemt
centrummaten
zijn maten die we kunnen berekenen voor een variabele uit de steekproef, haar numerieke waarde geeft het centrum van de verdeling weer
het gemiddelde
is de som van de waarden van een groep getallen gedeeld door het aantal getallen in de groep. Het is een centrummaat.
de mediaan
is de waarde waarvoor geldt dat 50% van de observaties niet groter is en 50% niet kleiner is. Het is een centrummaat.
de modus (meervoud modi)
is de waarde die het vaakst voorkomt in de steekproef.
spreidingsmaten
zijn maten die de spreiding kwantificeren van een variabele in de steekproef. Ze nemen de waarde nul aan als er geen spreiding is en worden groter naarmate er meer spreiding is.
variatiebreedte
is een eenvoudige spreidingsmaat die gelijk is aan het verschil tussen de maximale en minimale waarde van een variabele
standaardafwijking of standaarddeviatie (s)
is de gemiddelde afwijking tussen waarden. Het is een spreidingsmaat
de variantie (s^2)
is het kwadraat van de standaardafwijking. Het is een spreidingsmaat.
kwartielen
zijn de delen die we bekomen als we de elementen in de steekproef ordenen van klein naar groot en opdelen in vier gelijke stukken.
Q1: eerste kwartiel
Q2 of md: tweede kwartiel of mediaan
Q3: derde kwartiel
interkwartielafstand (IQR)
is de spreidingsmaat die gelijk is aan het derde min het eerste kwartiel
groeperen van data
is het onderverdelen van de waarden van een variabele in groepen
histogram
is een soort van staafdiagram op basis van gegroepeerde data, die vaak wordt gebruikt wanneer een numerieke variabele veel waarden aanneemt
symmetrische verdeling
is een verdeling waarbij afwijkingen ten opzichte van het centrum (ongeveer) een gelijk patroon vertonen voor waarden links en rechts van het centrum. De mediaan is gelijk aan het gemiddelde
scheve verdeling
is de verdeling waarbij een histogram lijkt op een berg met ongelijke flanken
scheef naar links: uitloper langs links, mediaan groter dan gemiddelde
scheef naar rechts: uitloper langs rechts, mediaan kleiner dan gemiddelde
uitschieters of outliers
waarden die significant kleiner of groter zijn
boxplot
is een figuur op basis van de kwartielen, het minimum en het maximum, die ook toelaat uitschieters te visualiseren
bivariate verdeling
is de verdeling van twee variabelen gezamenlijk
voorwaardelijke relatieve frequentie van een waarde
is de relatieve frequentie van die waarde binnen een deelverzameling van de steekproef
kruistabel
is een tabel waarbij we de waarden van een variabele kruisen. Het laat toe de bivariate verdeling van twee categorische variabelen op te stellen en verschillende relatieve frequenties te berekenen
risicoverschil
is het verschil tussen voorwaardelijke relatieve frequenties
relatief risico
is de verhouding van twee voorwaardelijke relatieve frequenties, waarvan de grootste van beide frequenties in de teller staat
odds ratio
is gelijk aan de verhouding van twee voorwaardelijke odds, waarvan de grootste van beide odds in de teller staat
spreidingsdiagram
is een tweedimensionale figuur waarop we de waarden van twee variabelen uitzetten ten opzichte van elkaar. Ze visualiseert de verdeling van twee numerieke variabelen, waarvan de punten evenredig zijn met het aantal herhalingen
correlatie(coëfficiënt) (r)
is de maat voor de lineaire samenhang tussen twee numerieke variabelen die een waarde tussen -1 en 1 aanneemt. Indien er geen samenhang is zal de waarde rond nul liggen
regressierechte
is de best passende rechte voor de puntenwolk
causaliteit
is een oorzaak- gevolgrelatie tussen twee variabelen waarbij wijzigingen in de ene variabele veroorzaakt worden door wijzigingen in de andere variabele
contrafeitelijk denken
is voorstellen hoe de werkelijkheid zou zijn bij een bepaalde interventie
randomisatie
is het willekeurig toekennen van subjecten aan groepen of interventies
confounder
is een variabele die de relatie tussen twee andere variabelen kan verstoren/verwarren. We kunnen pas spreken over een confounder als de variabele met beide andere variabelen een samenhang vertoont