12.2 Statistische begrippen Flashcards

1
Q

Welke 3 demonen zijn er in de wetenschap?

A

De dataduivel:
- Data slecht gearchiveerd

Het replicatieprobleem:
- Studieresultaten moeten door andere studies gecheckt worden

De verificatiekramp:
- Te hard proberen het gewenste resultaat te krijgen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Waar wordt er op gelet bij het verzamelen van de gegevens?

A
  • Compleetheid
  • Nauwkeurigheid:
    -> Meetprotocollen
    -> Een observer/gegevens over inter-observervariatie
  • Reproduceerbaarheid
  • Validiteit
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wat moet geprobeerd om vermeden te worden/beperkt te worden tijdens het verzamelen van gegevens?

A
  • Toevallige meetfouten (Door meetonnauwkeurigheid van instrument of waarnemer): Veroorzaken onnodige ‘ruis’
  • Systematische meetfouten (Door fouten in meetinstrument)
  • Differentiële systematische meetfouten (In de ene groep wordt een andere systematische fout gemaakt dan in de andere groep)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wat is het meetniveau van variabelen?

A

Numerieke/Kwantitatieve variabelen:
- Discreet: Gehele getallen (Aantal dagen ziek, aantal kinderen)
- Continu: Reële getallen (Lengte, gewicht, bloeddruk, inkomen)

Categorische variabelen:
- Nominaal: Geen ordening (Geslacht, soort OK, klacht)
- Ordinaal: Wel rangorde (Ernst ziekte, stagering tumor)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Waarom is het meetniveau van belang?

A

Bepaalt hoe gegevens gepresenteerd kunnen worden
Bepaalt hoe gegevens geanalyseerd moeten worden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hoe kunnen variabelen gepresenteerd worden?

A

Numerieke variabelen:
- Gemiddelde of mediaan
- Standaarddeviatie of interkwartielafstand
- Histogram, boxplot

Categorische variabelen:
- Percentages in de categorieën
- Taartdiagram

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Waarom is statistiek nodig?

A
  • Spreiding/variabiliteit in de gegevens
  • Fysieke/medische/psychologische eigenschappen van mensen liggen niet vast door natuurkundige wetten

Belangrijke maat voor de spreiding: Standaarddeviatie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wat is de standaarddeviatie?

A

Hoe ver liggen de individuele waarden van het gemiddelde af?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wat zijn populatie parameters?

A

Onbekende numerieke karakteristieken van een populatie

Bijvoorbeeld: Verschil cholesterol mannen/vrouwen, gemiddelde systolische bloeddruk bij diabetes patiënten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wat is de aanname bij statische theorie?

A

De steekproef is aselect (Random sampling): Iedereen in de populatie heeft evenveel kans om in de steekproef te komen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wat is de steekproefvariabiliteit?

A

Bij een schatting uit een steekproef moet rekening gehouden worden met toevallige fouten (Steekproefvariabiliteit). Dit is niet te voorkomen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wat is bias?

A

Fouten/gebreken in steekproef, meetmethoden, analyses geven een systematische fout (Bias). Dit is te voorkomen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wat is inferentiële statistiek?

A

Als er op basis van een steekproef iets gezegd wilt worden over de gehele populatie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hoe kunnen numerieke (Continue) variabele geanalyseerd worden?

A

Bijvoorbeeld daling in de daling kan tijdens de behandeling gebruikt worden om een verschil tussen behandeling A en B met behulp van T-test voor onafhankelijke groepen te analyseren

T-test dus

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Hoe kunnen categorische variabele geanalyseerd worden?

A

Lineaire regressie analyse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wat is de chi-kwadraat toets?

A

Of factoren vaker voorkomen bij een bepaalde doelgroep

Bijvoorbeeld: Of hypertensie tijdens de zwangerschap vaker voorkomt bij vrouwen van niet-westerse afkomst

17
Q

Wat is de T-test?

A

Wordt gebruikt om de gemiddelden van maximaal twee groepen met elkaar te vergelijken

Bijvoorbeeld: Of de bloeddruk meer daalt bij behandeling A of B

18
Q

Wat is de lineaire regressie analyse?

A

Welke factoren bepalen een effect?
Bijvoorbeeld door te bepalen welke factoren de grootte van de daling bepalen bij een behandeling

Of behandeling A of B zorgt voor een meer bloeddruk daling kan worden bekeken met een T-test

19
Q

Wat is logistische regressie analyse?

A

Onderzoeken van risicofactoren bij een bepaalde ziekte

Met logistische regressie kan er een dichotome uitkomstvariabele (Twee mogelijke waarden zoals hypertensie tijdens zwangerschap ja/nee) worden gerelateerd aan één of meerdere predictoren

Bijvoorbeeld om risicofactoren voor hypertensie tijdens de zwangerschap te onderzoeken

20
Q

Wat is een gewone regressie analyse?

A

De regressie analyse kijkt of er een (Voorspellend) verband is. Dit wordt gedaan op basis van de correlatie van de onafhankelijke variabele en de afhankelijke variabele

Kan gebruikt worden voor continue variabele
Een logistische regressie analyse wordt gebruikt bij dichotome uitkomstvariabele

21
Q

Wat geeft de standaard fout aan?

A

Hoe verspreid het gemiddelde is

22
Q

Wat zegt het 95% betrouwbaarheidsinterval?

A

Dat 95% van alle steekproeven het enige echte populatiegemiddelde bevat

95% wordt met zekerheid gemeten dat het populatiegemiddelde in het gevonden interval ligt

23
Q

Wat is selectiebias?

A

Toevallige fout. Niet te voorkomen

24
Q

Wat is standaardfout?

A

Hoe verspreid het gemiddelde is van 100 mensen

25
Q

Wat is bij normale verdeling nauwkeuriger dan de betrouwbaarheidsinterval van 95%?

A

T-verdeling: Hoe groter de steekproef, hoe meer het lijkt op de standaard normale verdeling