Lecture 1 (Introduction & Samples pt.1) Flashcards
Kansrekening
Gaat uit van deductie: gegeven dat we alle details van een populatie weten (van algemeen naar specifiek, van model naar data)
Statistiek
Gaat uit van inductie: gegeven een bepaalde steekproef uitkomst, wat kunnen we zeggen over de populatie? (van specifiek naar algemeen, van data naar model)
Definitie statistiek
De wetenschap van het verzamelen, organiseren, en interpreteren van numerieke feiten, die gegevens of data worden genoemd
Beschrijvende statistiek
Vat een steekproef of populatie samen aan de hand van nummers, tabellen, en grafieken
Gemiddelden, standaarddeviaties, IQR, etc.
Voorbeelden van beschrijvende statistiek
Inferentiële statistiek
Voorspellingen maken over populatie parameters, gebaseerd op steekproefdata
Hypothesetoetsen, betrouwbaarheidsintervallen, regressie analysen, etc.
Voorbeelden van inferentiële statistiek
Data
Observaties van karakteristieken (variabelen)
Populatie
De totale set van deelnemers relevant voor de onderzoeksvraag
Steekproef
Het deel van de populatie waarover data verzameld is
Betrouwbaarheid (reliability)
De repliceerbaarheid van onderzoek
Validiteit (validity)
De mate waarin er wordt gemeten wat er gemeten moet worden (meet je wat je denkt te meten?)
Meetniveaus
Categorisch (kwalitatief) of numeriek (kwantitatief)
Nominaal meetniveau
Ongeordende categorieën
Ordinaal meetniveau
Geordende categorieën
Interval meetniveau
Gelijke afstand tussen opeenvolgende waarden
Ratio meetniveau
Gelijke afstand tussen opeenvolgende waarden + absoluut nulpunt
Waardenbereik
Discreet of continu
Discreet waardenbereik
Eindig deelbare eenheid
Continu waardenbereik
Oneindig deelbare eenheid
Steekproefproblemen
Deze zorgen ervoor dat de steekproefgrootheden kunnen verschillen van de populatieparameters
Steekproeffout (sampling error)
Het verschil tussen de voorspelde populatieparameter en de daadwerkelijke populatieparameter. Kan worden veroorzaakt door toevallige steekproefverschillen, het verminderd de betrouwbaarheid van je steekproef. Dit is een niet-systematisch probleem.
Steekproefvertekening (sampling bias)
De steekproef is niet representatief voor de gehele doelpopulatie, dit kan zijn veroorzaakt door selectieve werving (convenience sampling). Dit is een systematische fout, en verminderd de validiteit van je steekproef.
Meetfout (response bias)
De afwijking tussen de voorspelde populatieparameter en de daadwerkelijke populatieparameter. Dit is een systematische fout die de validiteit van je steekproef verminderd.