HC.2 - Statistische begrippen Flashcards
Wat zijn de drie demonen van de wetenschap?
- Dataduivel: data is slecht gearchiveerd (data is weg)
- Replicatieprobleem: studieresultaten moeten eigenlijk gecheckt worden (literaal kan toeval zijn)
- Verificatiekramp: te hard proberen om een gewenst resultaat te krijgen –> lang doorgaan vanzelf een keer significant resultaat (maar is toevalsbevinding)
Wat wordt er wel eens gedaan om de significantiekramp te beperken?
Pre-registratie: vooraf dingen afspreken met tijdschrift en dit hoeft niet per se om significantie te gaan
Voor welke twee dingen doen we gegevens verzameling?
- patienten zorg
- wetenschappelijk onderzoek
Wat is belangrijk bij het verzamelen van gegevens?
- compleetheid: achteraf niet meer dingen veranderen of corrigeren
- Nauwkeurigheid
- reproduceerbaarheid
4 validiteit: meten wat je wil meten
Hoe kunnen we nauwkeurigheid van gegevens verzameling waarborgen?
- gebruiken van meetprotocollen waardoor overal dezelfde manier gebruiken
- 1 Observer vs inter-observer variatie: meerdere mensen die het eens zijn met elkaars beoordelingen
Welke drie dingen moet geprobeerd worden om te voorkomen/vermijden/beperken bij het verzamelen van gegevens?
- toevallige meetfouten: door onnauwkeurigheid van instrument of waarnemer (onnodige ruis)
Zijn er ALTIJD ( niet te voorkomen) maar kans zo klein mogelijk maken - systematische meetfouten: fouten in meetinstrument
bvb fout geijkte bloeddrukmeter
Probleem bij reproduceerbaarheid - differentieel systematische meetfouten: in de ene groep wordt een andere systematische fout gemaakt dan in de andere groep –> hierdoor kan een verschil aangetoond worden dat er eigenlijk niet is
Welke twee variabelen zijn er?
- numerieke/kwantitatieve variabelen = getallen
- Categorische variabelen = groep
Welke twee meetniveau’s kennen de variabelen?
Numerieke:
- discreet: gehele getallen bvb aantal dagen ziek, aantal kinderen (half niet mogelijk)
- Reele getallen bvb lengte, gewicht, bloeddruk, inkomen (kan elke waarde aannemen)
Categorisch:
- nominaal: geen ordening (geslacht, soort OK, klacht) dus een groep is niet meer of beter dan de ander
- ordinaal: wel rangorde (ernst ziekte, stagering van tumor) er kan een ongelijke afstand tussen de variabelen zitten (bvb niet ziek, beetje ziek, ernstig ziek)
Wat is het belang van het meetniveau?
- bepaalt hoe gegevens gepresenteerd worden
- Bepaalt hoe gegevens geanalyseerd moeten worden
Hoe kunnen we gegevens presenteren mbv de 2 variabelen?
- numerieke variabelen
- gemiddelde of mediaan
- standaarddeviatie, interkwartielafstand
- histogram, boxplot - categorische variabelen:
- percentages in de categorieen
- taartdiagram
Wat voor analyses kunnen we doen met numerieke (continue) uitkomst variabelen?
- T-test voor onafhankelijke groepen
= vergelijken van gemiddelden. van groepen
Bvb Is de daling van de bloeddruk verschillend bij behandeling A en B?
NIET MET CATEGORISCHE VARIABELEN - Lineaire regressie analyse = welke factoren bepalen bvb de daling
- uitkomst MOET numeriek zijn en normaalverdeling hebben
- variabelen maken niet uit dus kan numeriek of categorisch (wel goed in model zetten)
- het zijn verklarende variabelen die op verschillende manieren gebruikt worden
- corrigeren voor variabelen
bvb welke factoren bepalen de grootte van de daling (bvb behandeling, geslacht, leeftijd, bloedgroep –> corrigeren hiervoor)
Welke analyses gebruiken we voor categorische varialen?
- Categorische variabelen zijn vaak dichotoom = twee mogelijke waarden bvb hypertensie tijdens zwangerschap: ja of nee
- Chi-kwadraat toets: kruistabellen
Komt het vaker voor bij vrouwen van niet-westerse achtergrond?
KAN NIET MET NUMMERIEKE VARIABELEN - Logistische regressie analyse bij een CATEGORISCHE UITKOMST VARIABELE om risicofactoren te onderzoeken
bvb hypertensie voorspellen
Wanneer kan er GEEN lineaire regressie analyse worden gedaan?
Bij categorische uitkomst variabele
Dus ook niet als ja of nee uitkomst hebt
Voor welke twee dingen is statistiek nodig?
- er zit altijd spreiding en variabiliteit in de gegevens
- omdat medische/psychologische eigenschappen van mensen niet vast liggen in natuurkundige wetten
Wat is de belangrijkst maat voor spreiding? Wat betekent dit?
Standaarddeviatie (SD)
Hoe gespreid is iedereen rond het gemiddelde –> hoe ver ligt iedereen van het gemiddelde af
Wat is de centrum maat van de SD?
Het gemiddelde
= som van alle scores / aantal scores