Begrippen Statistiek 1 (H1-H3) Flashcards

1
Q

Statistiek

A

De wetenschap van het leren uit data en van het meten, controleren en communiceren van onzekerheid

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Observationele eenheden

A

de eenheden waarvoor men data zal verzamelen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Statistische geletterdheid

A

is het vermogen om te redeneren door middel van statistiek en data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Steekproefkader

A

de lijst met info over de persoon in de populatie die we gebruiken om de steekproef samen te stellen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Enkelvoudige aselecte/ lukrake steekproeftrekking

A

elke steekproef heeft dezelfde kans om gekozen te worden.
Impliceert dat elk element in het steekproefkader dezelfde kans heeft om tot de steekproef te behoren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Gestratificeerde steekproeftrekking

A

we delen de populatie op in een aantal strata en binnen en stratum voeren we een enkelvoudige aselecte steekproeftrekking uit.
De proportie personen per stratum is gelijk aan die populatie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Gemakshalve steekproeftrekking

A

personen die makkelijker bereikbaar zijn hebben een grotere kans om tot de steekproef te behoren.
Nadeel: kan resulteren in een selectiebias

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Variabelen

A

karakteristieken van de observationele eenheden die we wensen te onderzoeken

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

operationaliseren

A

het meetbaar maken van eigenschappen die men wenst te bestuderen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Cross- sectionele studie

A

een type studie waarbij men variabelen slechts op een moment in de tijd bevraagt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Longitudinale studie

A

een type studie waarbij men een of meerdere variabelen op verschillende momenten in de tijd bevraagt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Observationele studie

A

een type studie waarbij men enkel observeert zonder een interventie uit te voeren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Experimentele studie

A

een type van studie waarbij men een interventie uitvoert om de impact van de interventie te onderzoeken

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

HARKing

A

hypotethisizing after the results are known
een werkwijze waarbij men onderzoekshypotheses opstelt op basis van bevindingen in de data en vervolgens diezelfde data gebruikt om hypotheses te toetsen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Beschrijvende analyse

A

hierbij gebruiken we statistische methoden om inzicht te krijgen in de data. We maken hierbij gebruik van tabellen, samenvattende maten en figuren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

De verdeling

A

geeft weer welke waarden de variabele kan aannemen en hoe vaak elke waarde wordt aangenomen. Dit kan uitgedrukt worden in absolute en relatieve frequenties.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Univariate verdeling

A

Verdeling van een variabele

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Absolute frequentie

A

aantal keer dat een waarde van een variabele voorkomt in een steekproef

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Relatieve frequentie

A

absolute frequentie gedeeld door de steekproefgrootte
Synoniem = proportie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Odds

A

aantal keer dat een waarde van een variabele wordt aangenomen gedeeld door het aantal keer dat een andere waarde wordt aangenomen

21
Q

Binaire variabele

A

een variabele die slechts twee waarden aanneemt.
vb. een muntstuk (kan enkel kop of munt zijn)

22
Q

Spreidingsmaten

A

maten die in staat zijn om de spreiding van variabelen te kwantificeren
synoniem = variatie
wanneer er geen spreiding is, nemen ze de waarde 0 aan, en worden groter naarmate er meer spreiding is. Ze kunnen ook nooit negatief zijn

23
Q

Variatiebreedte

A

een eenvoudige spreidingsmaat die gelijk is aan het verschil tussen de maximale en de minimale waarde van de een variabele

24
Q

Standaardafwijking of standaarddeviatie

A

de gemiddelde afstand tussen de waarden en het steekproefgemiddelde

25
Q

Variantie

A

het kwadraat van de standaardafwijking

26
Q

Interkwartielafstand

A

spreidingsmaat die gelijk is aan het derde kwartiel mil het eerste kwartiel

27
Q

Histogram

A

soort staafdiagram op basis van gegroepeerde data. Deze figuur wordt vaak gebruikt als een numerieke variabele veel waarden aanneemt.
vorm van het histogram hangt af van de manier waarop de data in groepen zijn opgedeeld.

28
Q

Boxplot

A

figuur op basis van de kwartielen en het minimum en maximum, die ook toelaat uitschieters te visualiseren

29
Q

Symmetrische verdeling

A

de mediaan ligt in het midden van de rechthoek en de staarten zijn ongeveer even lang

30
Q

Verdeling scheef naar links

A

de mediaan ligt RECHTS van het midden van de rechthoek en de staart LINKS is langer dan die RECHTS

31
Q

Verdeling scheef naar rechts

A

de mediaan ligt LINKS van het midden van de rechthoek en de staart naar LINKS is korter dan die naar RECHTS

32
Q

Voorwaardelijke relatieve frequentie

A

de relatieve frequentie van die waarde binnen een deelverzameling van de steekproef

33
Q

Kruistabel

A

tabel waarbij we de waarden van variabele kruisen. Een kruistabel laat toe de bivariate verdeling van twee categorische variabelen op te stellen.
Op basis van een kruistabel kunnen we verschillende relatieve frequenties berekenen: we kunnen delen door de steekproefgrootte, de kolomtotalen of rijtotalen. De laatste 2 mogelijkheden resulteren in voorwaardelijk relatieve frequenties

34
Q

Risicoverschil

A

het verschil tussen voorwaardelijke relatieve frequenties

35
Q

Relatief risico

A

de verhouding van twee voorwaardelijke relatieve frequenties.
Het is de conventie om de grootste van beide frequenties in de tellen te zetten zodat het relatief risico groter is dan 1.

36
Q

Odds ratio

A

is gelijk aan de verhouding van twee voorwaardelijke odds.
Het is de conventie om de grootste van beide frequenties in de tellen te zetten zodat het relatief risico groter is dan 1.

37
Q

Spreidingsdiagram

A

tweedimensionale figuur waarop we de waarden van twee variabelen uitzetten ten opzichte van elkaar.
Ze laat toe de verdeling van twee numerieke variabelen te visualiseren
Indien er veel eenheden eenzelfde waarde hebben, kun je ervoor kiezen om de grootte van de punten evenredig te maken aan het aantal herhalingen

38
Q

Correlatiecoëfficiënt

A

Rxy is een maat voor de lineaire samenhang tussen twee numerieke variabelen die een waarde tussen -1 en 1 aanneemt. Indien er geen samenhang is, zal de waarde rond 0 liggen.
Bij een toenemende lineaire samenhang zal de waarde verder afwijken van 0.

39
Q

Regressierechte

A

de best passende rechts voor de puntenwolk

40
Q

Confounder

A

een variabele die de relatie tussen twee andere variabelen kan verstoren of verwarren. We kunnen pas spreken over een confounder als: de variabele met beide andere variabelen een samenhang vertoont.

41
Q

Covariantie

A

een maat voor lineair samenhang tussen twee variabelen X en Y

42
Q

Regressierechte

A

een rechte die het best bij de puntenwolk past

43
Q

Residu

A

geeft het verschil weer tussen de geobserveerde waarde en haar voorspelling

44
Q

Residudiagram

A

een spreidingsdiagram met ei op de verticale as en xi op de horizontale as

45
Q

Extrapolatie

A

wanneer we de regressierechte gebruiken om voorspellingen te doen voor een waarde die buiten het geobserveerde gebied van de verklarende variabele ligt wordt dit extrapolatie genoemd

46
Q

Determinatiecoëfficiënt

A

is gelijk aan de gekwadrateerde correlatiecoëfficiënt en geeft de proportie weer van de totale geobserveerde variantie in de uitkomstvariabelen die verklaard kan worden door wijzigingen in de verklarende variabele

47
Q

Invloedrijke observatie

A

een observatie die een grote impact heeft op de regressierechte of de correlatiecoëfficiënt

48
Q

Simpsons Paradox

A

een bijzonder geval van confounding waarbij de richting van de associatie wijzigt wanneer de confounder in rekening wordt gebracht