HC 12.2 Statistische begrippen Flashcards

1
Q

Wat zijn de 3 demonen in de wetenschap?

A
  • De dataduivel: de data is vaak slecht gearchiveerd
  • Het replicatieprobleem: studieresultaten moeten door andere studies gecheckt worden.
  • De verificatiekramp: te hard proberen het gewenste resultaat te krijgen. Want anders komt er een nulbevinding uit je onderzoek en dat publiceert niet lekker.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wat is belangrijk voor het verzamelen van gegevens bij het doen van onderzoek?

A

We verzamelen sowieso al gegevens voor de patiëntenzorg. Maar het mooie is je kan die gegevens ook gebruiken mits er toestemming (informed consent) is voor wetenschappelijk onderzoek. Daarvoor zijn de volgende dingen belangrijk:
- Compleetheid: je wilt de gegevens zo compleet mogelijk hebben
- Nauwkeurigheid
o Meetprotocollen
o Je moet het eigenlijk doen met meerdere observatoren, zodat subjectiviteit voorkomen kan worden. Als er weinig inter-observervariatie is dan ben je betrouwbaar aan het meten.
- Reproduceerbaarheid
- Validiteit: meet je het goede?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wat moet je proberen te vermijden/beperken bij het verzamelen van gegevens?

A

Toevallige meetfouten (door meetonnauwkeurigheden van instrument of waarnemer). Veroorzaken onnodige “ruis”. Hier kun je niks aan doen. Daarnaast zijn er systemische meetfouten (door fouten in meetinstrument), dit heeft niet zo veel gevolgen voor de uitkomst, het maakt wel uit als er sprake is van differentiële systematische meetfouten: in de ene groep wordt een andere systematische fout gemaakt dan in de andere groep.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Welke soorten variabelen zijn er?

A

Numerieke / kwantitatieve variabelen
- Discreet: gehele getallen (aantal dagen ziek, aantal kinderen)
- Continu: reële getallen (lengte, gewicht, bloeddruk, inkomen)
Categorische variabelen
- Nominaal: geen ordening (geslacht, soort OK, klacht)
- Ordinaal: wel rangorde (ernst ziekte, stagering tumor)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Waarom is het meetniveau van belang?

A
  1. Bepaalt hoe gegevens gepresenteerd kunnen worden.
  2. Bepaalt hoe de gegevens geanalyseerd moeten worden.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hoe worden numerieke variabelen gepresenteerd?

A
  • Gemiddelde of mediaan
  • Standaarddeviatie of interkwartielafstand
  • Histogram, boxplot
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hoe worden categorische variabelen gepresenteerd?

A
  • Percentages in de categoriën
  • Taartdiagram
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hoe worden numerieke (continue) uitkomstvariabelen geanalyseerd?

A

b.v. daling in bloeddruk tijdens de behandeling.
Is deze verschillend tussen behandeling A en behandeling B?
-> T-test voor onafhankelijke groepen
Welke factoren bepalen de grootte van de daling? (behandeling, geslacht, leeftijd, bloedgroep)
-> Lineaire regressie analyse
In die lineaire regressie analyse moet je verschillend omgaan met het gebruik van categorische variabelen (zoals bloedgroep) en numerieke variabelen (zoals leeftijd)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Hoe worden categorische uitkomstvariabelen geanalyseerd?

A

vaak: Dichotoom (= twee mogelijke waarden)
b.v. hypertensie tijdens zwangerschap: ja / nee
Komt dit vaker voor bij vrouwen van niet-westerse afkomst?
-> Chi-kwadraattoets
Wat zijn risicofactoren voor hypertensie?
(leeftijd, bloedgroep, pariteit, familie?)
-> Logistische regressie-analyse (je gebruikt dit bij een wel/niet uitkomst)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Waarom is statistiek nodig?

A

Omdat we de hele tijd te maken hebben met spreiding / variabiliteit van de gegevens. Fysieke/medische/psychologische eigenschappen van mensen liggen niet vast door natuurkundige wetten. Belangrijke maat voor spreiding: standaarddeviatie (gemiddelde spreiding in een groep).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wat is de variantie?

A

De variantie is een maat voor de spreiding van de betrokken waarden. Deze kan berekend worden met de formule die hiernaast beschreven staat

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Waarin zijn we geïnteresseerd bij de statistiek?

A

Populatieparameters: onbekende numerieke karakteristieken van een populatie.
Voorbeelden:
μ: gemiddelde systolische bloeddruk bij diabetespatiënten
π: proportie complicaties na aanleggen stoma
δ: μv - μm = verschil in cholesterol mannen/vrouwen
βleeftijd : regressiecoëfficiënt: hoeveel neemt systolische bloeddruk toe, per één jaar stijging in leeftijd
RR: kans op overlijden aan longkanker van rokers ten opzichte van niet-rokers

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Hoe kun je iets zeggen over de populatie terwijl je nooit de gehele populatie hebt?

A

In de praktijk heb je dus nooit de gehele populatie, je wilt hier wel wat over zeggen, dit kun je doen met behulp van een steekproef. Aanname bij statistische theorie: De steekproef is aselect (“random sampling”): iedereen in de populatie heeft evenveel kans om in de steekproef te komen. Dit is heel erg moeilijk. Praktijk: Men hoopt dat de studiegroep even goed is als een echte aselecte steekproef.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wat zijn fouten die kunnen ontstaan bij schattingen bij steekproeven?

A

Bij een schatting uit een steekproef moet rekening gehouden worden met een toevallige fout. (steekproefvariabiliteit). Dit is niet te voorkomen.
Fouten/gebreken in steekproef, meetmethoden, analyses geven een systematische fout (Eng: bias). Zo veel mogelijk proberen te voorkomen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wat is inferentiële statistiek?

A

Inferentiële statistiek = op basis van een steekproef iets groters willen zeggen over de populatie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Waarvan is de spreiding van resultaten van afhankelijk?

A
  • Spreiding van de individuele waarden (populatiestandaarddeviatie)
  • Grootte van de steekproef
17
Q

Hoe bereken je de standaardafwijking?

A

De verdeling van alle mogelijke steekproefgemiddelden is bij benadering een normale verdeling met:
- gemiddelde μ
- standaardafwijking = σ / wortel van n
Als: populatiegemiddelde = μ, populatiestandaarddeviatie = σ, steekproefgrootte = n

18
Q

Hoe kun je het betrouwbaarheidsinterval berekenen?

A

Het gemiddelde – 1,96 * SE en het gemiddelde + 1,96 * SE. SE = standaarddeviatie (s) / wortel van steekproefgrootte (n). Hoe groter je steekproef hoe preciezer je iets kan zeggen, omdat het betrouwbaarheidsinterval kleiner wordt.

19
Q

Wat is het verschil tussen de T- en Z-verdeling?

A

Bij een echt normaal verdeelde parameter is de T-verdeling nog nauwkeuriger dan de normale verdeling. Hoe groter de steekproef, hoe meer deze T-verdeling gaat lijken op de standaard normale Z-verdeling. Dus bij kleinere aantallen gebruik je een T-verdeling.

20
Q

Wat geldt er voor OR, RR, HR omtrent normale verdeling?

A

Voor sommige parameters (Odds Ratio, Relatief Risico, Hazard Ratio) geldt: log(parameter) heeft normale verdeling.
- bepaal SE van log(parameter).
- bereken BI van log(parameter) met (+/- 1.96* SE)
- terug-transformeren naar oorspronkelijke schaal.