HC 12.2: Statistische begrippen Flashcards
de 3 demonen van de wetenschap:
- de dataduivel - data is slecht gearchiveerd en daardoor is het niet mogelijk om alles te checken/ na te kijken
- het replicatieprobleem - je wil wetenschap kunnen toetsen en dus na kunnen doen. je wil weten welke data iemand heeft gebruikt, welke data analyse er is gedaan. je moet alles na kunnen doen
- de verificatiekramp -
publish or perish, je moet het dus publiceren, anders is het niet waar. je hele carrière hangt eigenlijk af van jouw goede artikel die worden gepubliceerd. maar wanneer wordt iets makkelijker/sneller/beter gepubliceerd?
wanneer je een significant, niet op toeval gebaseerd, resultaat vindt. en dan gaat men dus net zo lang zoeken, totdat men iets heeft wat wel significant is (terwijl het eigenlijk juist ook vaak op toeval is gebaseerd) en dat gaat men dan publiceren.
de gegevens die we verzamelen, komen van patiënten. en die gegevens zijn natuurlijk belangrijk voor de zorg, maar ze zijn ook belangrijk voor wetenschappelijk onderzoek.
wat is belangrijk bij het verzamelen van gegevens?
- compleetheid van de data
- nauwkeurigheid van de data, dus nauwkeurige meetprotocollen en één observer/gegevens over inter-observervariatie
- de data moet reproduceerbaar zijn (dit gaat dus over betrouwbaar meten, meet je iedere keer hetzelfde?)
- validiteit (meet je wel, wat je wil meten?)
bij het verzamelen van gegevens zijn er altijd meetfouten:
- toevallige meetfouten (gewoon de onnauwkeurigheid van het instrument of de waarnemer)
- systematische meetfouten (dit kan voor individuele waarden wel uitmaken, maar als je twee groepen gaat vergelijken maakt het voor het verschil niet uit) (denk aan een weegschaal die standaard 5 kilo te laag staat ingesteld, als je dan in 2 groepen het gewichtverlies bekijkt na een interventie of geen interventie, kan je nog steeds iets zeggen over het verschil)
- differentiële systematische meetfouten (in de ene groep wordt een andere systematische fout gemaakt dan in de andere groep) (dit is dus eigenlijk erger)
tijdens het doen van wetenschappelijk onderzoek, zijn er bepaalde variabelen die we meten. wat voor soort variabelen hebben we?
Numerieke/kwantitatieve variabelen en die zijn:
- óf discreet, dus gehele getallen (aantal dagen ziek, aantal kinderen)
- óf continu, dus reële getallen (lengte, gewicht, bloeddruk, inkomen)
Categorische variabelen en die zijn:
- óf nominaal, dus geen rangordening en het ene is niet meer dan de ander (geslacht, soort OK, klacht)
- óf ordinaal, dus wel rangorde en ook waarbij de verschillende stapjes/stadia verschillend zijn en ook ‘meer’ zijn dan de ander (ernst ziekte, stagering tumor)
waarom is het meetniveau van belang?
- het bepaalt hoe gegevens gepresenteerd kunnen worden
- bepaalt hoe gegevens geanalyseerd moeten worden
bij numerieke variabelen kun je:
- het gemiddelde berekenen of de mediaan
- je kan de standaarddeviatie berekenen en de interkwartielafstand berekenen
- je kan van deze variabelen een histogram of een boxplot maken
bij categorische variabelen kun je:
- percentages berekenen van bepaalde groepen, hoeveel procent bevindt zich in een bepaalde categorie (bijv. hoeveel procent is man, hoeveel procent is vrouw?)
- je kan van deze gegevens taartdiagrammen maken
bij categorische uitkomstvariabelen mag je geen T-toets doen.
waarom is statistiek nodig?
- er is spreiding en variabiliteit in gegevens
- en de fysieke/medische/psychologische eigenschappen van mensen liggen niet vast door natuurkundige wetten
wat is de belangrijkste maat voor spreiding?
standaarddeviatie
kijk aantekeningen in word!!!