Statistiek Flashcards

1
Q

Continue variabelen

A

De variabele kan in een bepaald interval iedere waarde aannemen. Voorbeelden: lengte, gewicht, temperatuur.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Categorische variabelen

A

De variabele kan geen getal aannemen, maar kenmerken. Ook wel discrete variabelen. genoemd. Voorbeeld: bloedgroep A, man of rouw, welk vat, mening/geen mening ect.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Nulhypothese

A

Er is geen verschil

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Populatie

A

De gehele groep waarin we geïnteresseerd zijn

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Normaal verdeling

A

Veel voorkomende verdeling van gegevens: klokvorm, symmetrisch. Ook: verdeling van veel statische concenpten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Gemiddelde

A

De som van alle waarde, gedeeld door het totale aantal waarde

Deze kiezen wanneer ook de extreme waarden belangrijk zijn

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Mediaan

A

De middelste waarde als je de dataset van kleinste naar grootste waarde rankschikt.

Deze kiezen als de uitschieters minder van belang zijn.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Standaarddeviatie

Standar deviation

A

Maat voor spreiding van gegevens/afwijkinge t.o.v. het gemiddelde

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Standard errors (of the mean)

Standaardfout

A

Maat voor de onzekerheid van de gevonden schatting voor de uitkomst

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

P-waarde

A

Maat voor toevalligheid gevonden bevinding

P < 0.05 wordt als significant beschouwd

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Betrouwbaarheidsinterval(BI of CI)

A

Als je het onderzoek oneindig vaak zou herhalen, zou …% van alle betrouwbaarheidsintervallen op de echte, ware populatiepercentage liggen.
Bestaat uit de boven en ondergrens van schatting die je verwacht te vinden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Range

A

Geeft aan wat de laagste en hoogste waarde van data zijn.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Interquartille range (IQR)

A

De afstand tussen de eerste en derde kwartiel: de grens van het eerste is de waarde waarbij 25% van de data kleiner zijn; de grens van derde is de waarde waarbij 75% van de data kleiner zijn.

Het geeft indruk waar de extreme waarde liggen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Percentielen

A

Een percentiel is in een geordende dataset een van de in principe 99 punten die de dataset in 100 delen van gelijke grootte verdelen.
Het k-de percentiel is dan een getal dat de k% kleinste data van de (100-k)% grootste scheidt.

Bij 95e percentiel, is 95% kleiner en 5% groter of gelijk aan

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Steekproef

Sample

A

De groep waarin gegevens verzameld worden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Invloed van grootte van steekproef op resultaat?

A
  • Een te kleine groep kan zorgen dat er geen significant resultaat is.
  • Een te grote groep kan ervoor zorgen dat er altijd wel iets gevonden wordt.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Statistisch significant

A

Gevonden bevinding is geen toevalligheid

18
Q

Betrouwbaarsniveau

A

Het percentage van de keren dat je verwacht in de buurt van dezelfde schatting te komen als je je experiment nog een keer uitvoert of opnieuw op dezelfde manier een steekproef uit de populatie haalt.

19
Q

Toevallige fout

Random error

A

Afwijking van de echte uitkomst door toevallige, niet te controleren oorzaken

20
Q

Systematische fout

A

Afwijking van de echte uitkomst alf gevolg van aanwijsbare reden

21
Q

Correlatie

A

De statistische samenhang tussen twee grootheden. De variabelen veranderen samen, maar dat hoeft niet door een (indirect) oorzakelijk verband. De verandering hoeft dus niet perse de verandering van de andere te veroorzaken.

Correlatie impliceerd dus geen causaliteit

22
Q

Causaliteit

A

Dat een verandering in de ene variabele de verandering in de andere variabele veroorzaakt, er is dus sprake van oorzaak-gevolgrelatie tussen variablelen. De twee zijn dus gecorreleerd en er is sprake van een causale relatie.

Causaliteit impliceert wel altijd een correlatie

23
Q

Regressie analyse

A

Een statistische techniek voor het analyseren van gegevens waarin sprake is van een specifieke samenhang, aangeduid als regressie.
Je kan het gebruiken om de samenhang tussen twee variabelen te bepalen.

24
Q

Survival analyse

A

Gebruikt voor data die informatie geeft over de tijd tot optreden van een bepaald event (overlijden, relapse, herstel enz). Dit is vanaf de start van follow-up van patiënt tot aan optreden van een event.

25
Q

Correctie voor multiple testing

A

Door te corrigeren maak je daarmee de kans kleiner dat je ten onrechte de nulhypothese verwerkpt en daarmee ten onrechte een effect aanwijst (type 1 fout)

26
Q

Bonferroni correctie

A

Deze stelt dat de a(p-waarde, die als statistisch significant wordt beschouwd) moet worden gedeelt door het aantal vergelijkingen waarvoor men toetst (n)

Bonferroni correctie p-waarde = a/n

Voorbeeld: p waarde is 0.05 en twee uitkomsten worden getoetst, dan is significantiegrens 0.05/2

27
Q

Waar is de breedte van betrouwbaarheidsinterval afhankelijk van:

A
  • Hoe groot moet de betrouwbaarheid zijn? (meestal 95%)
  • Steekproefgrootte n
28
Q

Referentie interval

A

Gebied rondom het gemiddelde waarin bepaald percentage van de gegevens ligt

29
Q

Wanneer klopt de nulhypothese?

A

Als het gevonden resultaat ergens in het midden van de verdeling zit, dus dichtbij 0

30
Q

Wanneer kan je de nulhypothese verwerpen?

A

Als het gevonden resultaat ver van het midden ligt, dus ergens in uiteindes/ in de 5% regio (significantie niveau).
Het moet kleiner dan 5 zijn

5% staat gelijk aan p=0.05

31
Q

Wat zegt P < 0.05

A

De nulhypothese verwerpen, uitkomst is statistisch significant

32
Q

Wat zegt P > 0.05

A

Geen rede om aan te nemen dat nulhypothese niet waar is, uitkomst is niet significant

33
Q

Type 1 fout

A

De nulhypothese is waar, maar je vindt bij toeval een extreme uitkomst in steekproef.

34
Q

Waardoor kan een Type 2 fout gemaakt worden

A

Deze wordt bepaald door steekproefgroote. Hoe groter de groep, hoe kleiner deze fout. Wordt vaak gemaakt als alternatieve hypothese dicht bij de nulhypothese ligt. (Hoe verder, hoe minde rkans op t2 fout)

35
Q

Verband tussen P-waarde en betrouwbaarheidsintervallen?

A
  • Als de nulhypothese in het betrouwbaarheidsinterval ligt (er zit een 0 in) Dan is het niet statistisch significant, wanneer niet, dan wel statistisch significant.
  • Bij ratio is het niet een 0 erin, maar een 1
36
Q

Type 2 fout

A

Nulhypothese is neit waar, maar je vindt toch een waarde onder de nulhypothese die niet zo extreem is

37
Q

Hoe bereken je de power?

A

Power = 1 - type 2 fout, dus als power 80% is dan is type 2 20
%

38
Q

Wat betekent een grote SD?

A

Dat de waarnemingen gemiddeld verder van het gemiddelde afliggen en er dus veel spreiding is.

39
Q

Wat betekent een kleine SD?

A

Dat de waarden dicht rondom het gemiddelde liggen.

40
Q

Wanneer een betrouwbaarheidsinterval van 68%?

A

Tussen - 1 SD en + 1 SD

41
Q

Wanneer een betrouwbaarheidsinterval van 95%?

A

Tussen - 2 SD en + 2 SD