12.2 Statistische begrippen Flashcards
Welke 3 demonen zijn er in de wetenschap?
De dataduivel:
- Data slecht gearchiveerd
Het replicatieprobleem:
- Studieresultaten moeten door andere studies gecheckt worden
De verificatiekramp:
- Te hard proberen het gewenste resultaat te krijgen
Waar wordt er op gelet bij het verzamelen van de gegevens?
- Compleetheid
- Nauwkeurigheid:
-> Meetprotocollen
-> Een observer/gegevens over inter-observervariatie - Reproduceerbaarheid
- Validiteit
Wat moet geprobeerd om vermeden te worden/beperkt te worden tijdens het verzamelen van gegevens?
- Toevallige meetfouten (Door meetonnauwkeurigheid van instrument of waarnemer): Veroorzaken onnodige ‘ruis’
- Systematische meetfouten (Door fouten in meetinstrument)
- Differentiële systematische meetfouten (In de ene groep wordt een andere systematische fout gemaakt dan in de andere groep)
Wat is het meetniveau van variabelen?
Numerieke/Kwantitatieve variabelen:
- Discreet: Gehele getallen (Aantal dagen ziek, aantal kinderen)
- Continu: Reële getallen (Lengte, gewicht, bloeddruk, inkomen)
Categorische variabelen:
- Nominaal: Geen ordening (Geslacht, soort OK, klacht)
- Ordinaal: Wel rangorde (Ernst ziekte, stagering tumor)
Waarom is het meetniveau van belang?
Bepaalt hoe gegevens gepresenteerd kunnen worden
Bepaalt hoe gegevens geanalyseerd moeten worden
Hoe kunnen variabelen gepresenteerd worden?
Numerieke variabelen:
- Gemiddelde of mediaan
- Standaarddeviatie of interkwartielafstand
- Histogram, boxplot
Categorische variabelen:
- Percentages in de categorieën
- Taartdiagram
Waarom is statistiek nodig?
- Spreiding/variabiliteit in de gegevens
- Fysieke/medische/psychologische eigenschappen van mensen liggen niet vast door natuurkundige wetten
Belangrijke maat voor de spreiding: Standaarddeviatie
Wat is de standaarddeviatie?
Hoe ver liggen de individuele waarden van het gemiddelde af?
Wat zijn populatie parameters?
Onbekende numerieke karakteristieken van een populatie
Bijvoorbeeld: Verschil cholesterol mannen/vrouwen, gemiddelde systolische bloeddruk bij diabetes patiënten
Wat is de aanname bij statische theorie?
De steekproef is aselect (Random sampling): Iedereen in de populatie heeft evenveel kans om in de steekproef te komen
Wat is de steekproefvariabiliteit?
Bij een schatting uit een steekproef moet rekening gehouden worden met toevallige fouten (Steekproefvariabiliteit). Dit is niet te voorkomen
Wat is bias?
Fouten/gebreken in steekproef, meetmethoden, analyses geven een systematische fout (Bias). Dit is te voorkomen
Wat is inferentiële statistiek?
Als er op basis van een steekproef iets gezegd wilt worden over de gehele populatie
Hoe kunnen numerieke (Continue) variabele geanalyseerd worden?
Bijvoorbeeld daling in de daling kan tijdens de behandeling gebruikt worden om een verschil tussen behandeling A en B met behulp van T-test voor onafhankelijke groepen te analyseren
T-test dus
Hoe kunnen categorische variabele geanalyseerd worden?
Lineaire regressie analyse