12.2 statistische begrippen Flashcards
welke 3 demonen zijn er in de wetenschap?
de dataduivel
- data slecht gearchiveerd
het replicatieprobleem
- studieresultaten moeten door andere studies gecheckt worden
de verificatiekramp
- te hard proberen het gewenste resultaat te krijgen
waat let je op bij het verzamelen van gegevens?
compleetheid
nauwkeurigheid
- meetprotocollen
- een observer/ gegevens over inter-observervariatie
reproduceerbaarheid
validiteit
wat probeer je te vermijden/ beperken bij verzamelen van gegevens?
toevallige meetfouten
(door meetonnauwkeurigheid van instrument of waarnemer). veroorzaken onnodige ‘ruis’
systematische meetfouten
(door fouten in meetinstrument)
differentiele systematische meetfouten
(in de ene groep wordt een andere systematische fout gemaakt dan in de andere groep)
wat is meetniveau van variabelen?
numerieke/ kwantitatieve variabelen
- discreet: gehele getallen (aantal dagen ziek, aantal kinderen)
- continu: reele getallen (lengte, gewicht, bloeddruk, inkomen)
categorische variabelen
- nominaal: geen ordening (geslacht, soort OK, klacht)
- ordinaal: wel rangorde (ernst ziekte, stagering tumor)
waarom is het meetniveau van belang?
bepaalt hoe gegevens gepresenteerd kunnen worden
bepaalt hoe gegevens geanalyseerd moeten worden
hoe kunnen variabelen gepresenteerd worden?
numerieke variabelen
- gemiddelde of mediaan
- standaarddeviatie of interkwartielafstand
- histogram, boxplot
categorische variabelen
- percentages in de categorien
- taartdiagram
waarom is statistiek nodig?
spreiding/ variabiliteit in gegevens
fysieke/ medische/ psychologische eigenschappen van mensen liggen niet vast door natuurkundige wetten
belangrijke maat voor spreiding: standaarddeviatie
wat is standaarddeviatie?
hoe ver liggen de individuele waarden van het gemiddelde af?
wat zijn populatie parametes?
onbekende numerieke karakteristieken van een populatie
bijv. verschil cholesterol mannen/ vrouwen, gemiddelde systolische bloeddruk bij diabetes patienten
wat is aanname bij statistische theorie?
de steekproef is aselect (random samling): iedereen in de populatie heeft evenveel kans om in de steekproef te komen
wat is steekproefvariabiliteit?
bij een schatting uit een steekproef moet rekening gehouden worden met toevallige fouten (steekproefvariabiliteit). dit is niet te voorkomen
wat is bias?
fouten/ gebreken in steekproef, meetmethoden, analyses geven een systematische fout (bias). is te voorkomen
wat is inferentiele statistiek?
als je op basis van een steekproef iets wilt zeggen over de gehele populatie
hoe kunnen numerieke (continue) variabele geanalyseerd worden?
bijv daling in de bloeddruk kan tijdens behandeling kan gebruikt worden om verschil tussen behandeling A en B mbv T test voor onafhankelijke groepen te analyseren
T test dus
hoe kunnen categorische variabele geanalyseerd worden?
lineaire regressie analyse
wat is chi kwadraat toets
OF FACTOREN VAKER VOORKOMT BIJ EEN BEPAALDE DOELGROEP
bijvoorbeeld: pf hypertensie tijdens zwangerschap vaker voorkomt bij vrouwen van niet westerse afkomst
wat is T test
wordt gebruikt om de gemiddelden van maximaal twee groepen met elkaar te vergelijken.
bijv: of de BD meer daalt bij behandeling A of B
wat is lineaire regressie analyse?
WELKE FACTOREN BEPALEN EEN EFFECT?
bijv door te bepalen welke factoren de grootte van de daling bepalen bij een behandeling
of behandeling A of B zorgt voor meer BD daling kan je bekijken met een T test
wat is logistische regressie analyse?
Met logistische regressie kan je een dichotome uitkomstvariabele (twee mogelijke waarden zoals hypertensie tijdens zwangerschap ja/nee) relateren aan één of meerdere predictoren
ONDERZOEKEN RISICOFACTOREN BIJ BEPAALDE ZIEKTE
bijv om risicofactoren voor hypertensie tijdens zwangerschap te onderzoeken§
wat is een gewone regressie analyse?
De regressie analyse kijkt of er een (voorspellend) verband is. Dit wordt gedaan op basis van de correlatie van de onafhankelijke variabele en de afhankelijke variabele.
kan gebruikt worden voor continue variabele
een logistische regressie analyse wordt gebruikt bij dichotome uitkomstvariabele
wat geeft de standaard fout aan?
hoe verspreid het gemiddelde is
wat zegt het 95% betrouwbaarheidsinterval?
95% van alle steekproeven het enige echte populatiegemiddelde bevat
we meten met 95% zekerheid dar het populatiegemiddelde in het gevonden interval ligt
wat is selectiebias?
toevallige fout, niet te voorkomen
wat is standaardfout?
hoe verpreid het gemiddelde is van 100 mensen
wat is bij normale verdeling nauwkeuriger dan betrouwbaarheidsinterval 95?
T verdeling: hoe groter de steekproef, hoe meer het lijkt op de standaard normale verdeling