Week 1 Flashcards
Wat is statistische geletterdheid?
Begrijpen welke conclusies je wel/niet kan trekken o.b.v de data. Je kan misleidende en bruikbare statistiek herkennen
Wat is het verschil tussen kansrekening en statistiek
- Kansrekening bepaald de kans op een steekproef-uitkomst als je alles weet over de populatie
- Statistiek bepaald de waarschijnlijkheid dat een steekproef-uitkomst ook voor de populatie geldt
Wat is statistiek in verhouding to methodologie?
in methodologie bepaal je hoe je je onderzoek doet en statistiek is het instrument waarmee je het onderzoek uitvoert
Is er onzekerheid bij beschrijvende of inferentiële statistiek
alleen bij inferentiële statistiek is sprake van onzekerheid.
Wat is een database?
Een bestaande en eerder opgenomen data, die voor nieuw onderzoek gebruikt wordt.
Wat is het verschil tussen parameter en statistiek?
- Parameter is de numerieke samenvatting van de populatie
- Statistiek is de numerieke samenvatting van de steekproef
Wat is een conceptuele populatie?
- wanneer je een generalisatie maakt naar een populatie die niet echt bestaat.
Wat is een data file?
Een spreadsheet met
- in elke horizontale rij de verschillende scores van 1 subject
- In elke kolom binnen de rij een observatie van een bepaalde karakteristiek.
Wat is een meetschaal/measurement scale?
Alle waarden die een bepaalde variabele kan hebben (dit kan oneindig zijn)
Wat zijn de twee categoriale variabelen?
Nominale en ordinal variabelen.
Wat is het verschil tussen ordinaal en interval?
- Bij interval heb je een modus mediaan en gemiddelde, gemiddelde ontbreekt bij ordinaal.
- Bij interval is er een interpreteerbaar verschil, wat bij ordinaal niet kan
- Je kan optellen en aftrekken bij interval
Wat is het verschil tussen nominaal en ordinaal?
- Bij ordinaal heb je modus en mediaan, terwijl je bij nominaal alleen een modus hebt.
- Ordinaal is geordend
- Je kan vergelijken bij ordinaal (hoger dan of lager dan), terwijl je bij nominaal alleen kan zeggen gelijk of niet gelijk.
Wat is het verschil tussen ratio en interval?
- Je hebt dezelfde centrummaten
- Bij ratio is er een absoluut nulpunt
- Je kan vermenigvuldigen en delen bij ratio
Hoe wordt een ordinale variabele soms interval gemaakt?
Elke categorie krijgt een numerieke waarde toegewezen.
Wanneer worden de statistische methodes voor discrete en continuele variabelen gebruikt?
- Discreet als er weinig waarden zijn van een variabele
- Continueel als er veel/oneindig waarden zijn.
Wanneer is er simpel random sampling?
- Als iedere mogelijke steekproefsamenstelling dezelfde kans heeft om gekozen te worden.
Wat is een sample survey?
Een steekproefpopulatie wordt geïnterviewd d.m.v bijvoorbeeld een gesprek of self-report.
Wat zijn observationele studies vergeleken met experimentele studies? Ook voor en nadeel geven.
- Je observeert het effect van een variabele zonder dat je deze manipuleert/controleert.
- Handig als je geen random assignment kan doen, maar wel kans op confounding.
Wat is een sampling error, en wat is de margin of error?
- Een afwijking die onvermijdelijk is als je een statistiek gebruikt om een uitspraak te doen over de populatie.
- De populatie-waarde licht binnen de margin of error
Wat is een response bias en nonresponse bias?
- response bias is wanneer de gegeven antwoorden niet waar zijn, bijvoorbeeld door priming
- Nonresponse bias is wanneer mensen die geselecteerd zijn voor een steekproef weigeren of niet kunnen.
Wat is missende data?
- Data die voor bepaalde subjecten niet gemeten zijn, waardoor de software hun gegevens negeren.
Hoe doe je systematisch random steekproeftrekken (4 stappen)?
- k = N/n (populatiegrootte/ gewenste steekproefgrootte)
- Eerst selecteert je willekeurig een persoon uit de eerste k namen
- dan elke volgende k weer een
- Zo kom je op de gewenste grootte.
Wat is disproportionele en proportionele gestratificeerd steekproeftrekken?
- Het verschil of de strata’s wel of niet overeenkomen met de werkelijke populatie verhouding.
Wat zijn de twee stappen van cluster sampling?
- De populatie wordt opgedeeld in clusters
- Er word aselect een cluster geselecteerd.
Wat zijn relatieve frequenties?
Het percentage observaties dat binnen een bepaalde categorie valt.
Wat is een frequentie distributie en relatieve frequentiedistributie.
Een lijst met elke mogelijke waarde van een variabele en de absolute/percentuele hoeveelheid observaties bij die waarde.
Wat is belangrijk als je een kwantitatieve variabele onderverdeelt in klassen?
- Je moet niet te veel/weinig klassen maken.
- Elke mogelijke waarde moet alleen binnen 1 categorie vallen.
Wat is het verschil tussen proportie en percentage?
- Proportie is tussen 0 en 1 en x100 is het percentage
Wat is een stam-en bladplot?
- De stam is het leidende, eerste getal van een waarde. Het blad is het laatste getal.
- Je kan ook twee steekproeven vergelijken op deze manier
Welke 2 symmetrische distributie vormen zijn er? En wat is een niet-symmetrische distributie?
- u-Vorm en Bel-vorm
- Bij een niet-symmetrische is één staart langer.
Hoe bereken je het weighed average van meerdere steekproeven?
Je deelt het steeproefgemiddelde x de populartie) van beide steekproeven door de totale steekproefgrootte van beide steekproeven opgeteld.
Hoeveel procent van de observaties ligt boven de mediaan?
50%
Wanneer wordt de modus vaak gebruikt?
voor discrete variabelen als “universitair opgeleid” om te laten zien wat het meeste voor komt
Wat staat het dichtste en verste van de piek bij een skewed distribution (Gemiddelde, modus, mediaan)
De modus is het dichtste bij de piek en het gemiddelde licht er het verste van af.
Waarom is de variantie s in het kwadraat?
Omdat de standaarddeviatie s de wortel van variantie is
Hoe bereken je standaard deviatie?
De wortel van de som van elke observatie min het gemiddelde in het kwadraat, gedeeld door n-1
Wat is de empirische regel van ongeveer gelijk verdeelde variabelen?
- Tussen x +/- s ligt 68% van de steekproeven
- Tussen x +/- 2s ligt 95%
- Tussen x +/- 3s ligt vrijwel alles
Wat is het percentueel/percentiel?
Het percentueel (p) waar p% onder of op dat punt vallen en 100-p % er boven vallen.
- Mediaan is het 50 percentueel
Wat is het kwartiel?
q1 is het 25e percentueel en q3 is het 75 percentueel
Wat is IQR/interkwartiel range?
het verschil tussen q1 en q3.
Wanner is er een outlier?
- Als de meting 1,5 IQR afwijkt van q1 of q3
- als de meting meer dan 3 standaarddeviaties afwijkt
Hoe bereken je z-score van een observatie, gegeven dat je alle informstie iver de populatie hebt?
X-µ/σ
Wat is de response en explanatory variabele?
- response=afhankelijk
-explanatory=onafhankelijk
Wat laat een contingency tabel zien?
Het is een tabel die laat zie of de waarde van de uitkomst-variabele afhangt van de categorie van de onafhankelijk variabele
Wat is regressie analyse op een puntenwolk?
Een lijn die het gemiddelde effect laat zien, zodat je een voorspelling kan maken van de ene variabele obv de andere.
Wat is sampling bias/steekproefvertekening?
- Sampling bias is wanneer je niet een aselecte steekproeftrekking doet.
- Zoals alleen rijke mensen vragen
Wat is een response bias/meetfout?
Response Bias is wanneer de participanten niet het goede antwoord geven door bijvoorbeeld priming
Wat is non-response bias/selectieve respons?
Non-response bias is wanneer mensen die wel geselecteerd zijn voor de steekproef niet in de steekproef komen door bijvoorbeeld te weigeren
Wat is een steekproeffout/sampling error?
sampling error is de afwijking tussen de steekproef en de populatie die onvermijdelijk is, maar wel minder kan worden gemaakt.
Wat zijn positiematen en spreidingsmaten?
- positiematen laten zien wat de relative positie van observaties is, zoals de hoogste 10%.
- Spreidingsmaten laten zien hoe erg observaties van de centrummaat af variëren
Welke beschrijvende statistiek gebruik je voor Nominaal, Ordinaal, Interval+ratio?
- Nominaal: Frequentie, percentage, modus
- Ordinaal: Frequentie, modus, mediaan, percentielen
- Interval: Ordinaal + Gemiddelde en standaarddeviatie
Welke grafieken kan je gebruiken voor nominaal, ordinaal, interval+ratio
- Nominaal: staafdiagram en taartdiagram
- Ordinaal: Nominaal + Stam- en bladplot.
- Interval: Ordinaal + histogram en box plot.