Week 1 Flashcards

1
Q

Wat betekent beschrijvende statistiek?

A

Hoe ziet de data eruit? Bijvoorbeeld: je hebt een enquête afgenomen onder 10 studenten en beschrijft hoe de data eruit ziet (wat is het gemiddelde, hoe enthousiast zijn de studenten etc.)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wat betekent inferentiële statistiek?

A

Voorspellen (speculeren). Uitspraken en voorspellingen doen over de hele populatie, op basis van de verkregen data (steekproef). Bijvoorbeeld: opiniepeilingen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Waar heeft het boek het er in de terminologie over?

A

Sample statistic (beschrijvende statistiek) en population parameter (inferentiële statistiek).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wat betekent een univariaat?

A

Dat zijn de vele verschillende manieren om de gegevens van één variabelen te beschrijven.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wat zijn variabelen?

A

Het kenmerk, of de kenmerken waarnaar je onderzoek doet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wat is een categorische variabelen?

A

Die hebben als waarde geen getallen, maar alleen kenmerken of categorieën. Deze kunnen worden verdeeld in nominaal en ordinaal.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wat betekent nominaal (en waar valt het onder)?

A

De variabelen heeft meerdere groepen maar er is geen rangordening. Bijvoorbeeld: wat is je lievelingskleur, nationaliteit of religie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Kan je met een nominale variabelen wiskundige berekeningen doen?

A

Nee, dit is enkel puur voor de kwalitatieve gegevens.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wat betekent dichotoom en onder welke variabele valt het?

A

Het valt onder de nominale variabelen. Het kan slechts twee waarden aannemen. Bijvoorbeeld: ja of nee, geslacht (man of vrouw) of een testresultaat (positief of negatief).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wat betekent ordinaal (en waar valt het onder)?

A

Rangordening is wel mogelijk, maar er is geen vaste afstand. Bijvoorbeeld: rangen in het leger of opleidingsniveau. De stap van havo naar vwo is misschien niet hetzelfde als van hbo naar wo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wat is een kwantitatieve variabel?

A

Variabelen die als waarde getallen aannemen. Bijvoorbeeld: gewicht, leeftijd en inkomen. Verschillen tussen de waarden van deze schaal hebben een betekenis (optellen en aftrekken is mogelijk). Verhoudingen hebben geen betekenis (je kunt niet vermenigvuldigen of delen).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Waar heeft het mee te maken dat verschil tussen waarden betekenis hebben (optellen en aftrekken) en verhouding niet (niet vermenigvuldigen en delen)?

A

Omdat variabelen op intervalschaal geen vast nulpunt hebben.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wat is een synoniem voor kwantitatieve variabelen?

A

Interval/Ratio

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Waarin zijn kwantitatieve variabelen onder te delen?

A

Discreet en continu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wat betekent een discrete variabel?

A

Dat zijn variabelen waarbij slechts bepaalde (gehele) waarden kunnen voorkomen en tussenliggende waarden niet mogelijk zijn. Bijvoorbeeld: aantal kinderen, huisdieren. De rangorde, de afstand tussen variabelen is even lang. Je kan niet 3.5 kind hebben.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wat betekent een continu variabel?

A

Dat zijn variabelen waarbij oneindig veel mogelijkheden zijn in de waarde. Bijvoorbeeld: tijd, afstand en gewicht. De tijdsduur van een college is 44,99999 minuten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Waarom is het onderscheidt in meetniveaus belangrijk?

A

Ze staan verschillende rekenkundige/statistische operaties toe.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Waar zegt een centrummaat niks over?

A

Over hoeveel alle waarden op elkaar lijken.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Wat is een andere belangrijke benaming van het gemiddelde?

A

De verwachting.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Wanneer maak je gebruik van het gemiddelde?

A

Als je verder nog niks weet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Waarvoor staat de X-bar (X̄)?

A

Dat is het symbool voor het gemiddelde.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Wat is de mediaan (Md)?

A

Het middelpunt van de observaties als je ze van laag naar hoog ordent.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Wanneer maak je gebruik van de mediaan?

A

Als er grote uitschieters zitten inde te berekenen waarde (oftewel, grote variantie tussen waardes).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Wat is de modus?

A

Dit is de waarde die het vaakst voorkomt en dus de grootste categorie is.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Bij welke variabel gebruik je de modus?

A

Bij categorische variabelen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Bij welke variabel gebruik je het gemiddelde (mean)?

A

Bij kwantitatieve variabelen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Bij welke variabel gebruik je de mediaan?

A

Bij kwantitatieve variabelen.

28
Q

Wat is je overweging tussen de keuze bij centrummaten bij kwantitatieve variabelen?

A

Je kiest de mediaan als je een invloedrijke outlier hebt. Als je dat niet hebt, dan kies je voor het gemiddelde.

29
Q

Wat betekent verdeling van de data?

A

De waarden die een variabele aanneemt en hoevaak elke waarde voorkomt. Bijvoorbeeld: welk cijfer ga ik halen?

30
Q

Wat is een datamatrix?

A

Dat is een overzicht van alle variabelen en cases.

31
Q

Hoe kun je categorische data uitdrukken (in welke visualisatie?)

A
  • Frequentietabel
  • Taartdiagram
  • Staafdiagram
32
Q

Hoe kun je kwantitatieve data uitdrukken (in welke visualisatie?)

A
  • Dot plot (puntdiagram)
  • Steam and leaf plot (stamdiagram)
  • Histogram
33
Q

Hoe noem je het als onderzoekers kwantitatieve variabelen omzetten in ordinale categorieën?

A

Hercoderen.

34
Q

Kan je ordinale variabelen hercoderen in kwantitatieve variabelen?

A

Nee dat kan niet, maar andersom kan wel. Dus van kwantitatieve variabelen omzetten in ordinale variabelen met bijvoorbeeld vijf categorieën.

35
Q

Wanneer heeft een staafdiagram voordelen ten opzichte van een cirkeldiagram?

A

Als het aantal categorieën in een variabel toenemen.

36
Q

Wanneer kan je een puntdiagram niet meer gebruiken en wat gebruik je dan?

A

Als de steekproef te groot wordt, je gebruikt dan een histogram.

37
Q

Wat is het verschil tussen een histogram en staafdagram?

A

Bij een histogram raken de bars elkaar aan. Dat komt omdat de waarden van een interval ratio een onderliggende continue schaal presenteren.

Bij een staafdiagram moet er een witregel tussenzitten omdat het geen vloeiende lijn is, het is namelijk een categorische variabelen.

Er zijn dus twee verschillende concepten voor twee variabelen.

38
Q

Wat is een proportie?

A

Dat is een verhouding.

39
Q

Waartussen wordt een proportie altijd uitgedrukt?

A

Tussen 0 en 1.

40
Q

Hoe bereken je een proportie?

A

Aantal observaties in een categorie/totaal aantal observaties.

41
Q

Percentages kunnen ook worden uitgedrukt als proporties. Hoe noem je deze dan?

A

Conditionele proporties.

42
Q

Waarom worden percentages die in proporties uit worden gedrukt conditionele proporties genoem?

A

De formatie is afhankelijk van een andere variabele.

43
Q

Wat betekent unimodaal?

A

Er is één meestvoorkomende waarde, die zit in het midden.

44
Q

Wat is bimodaal?

A

Er zijn twee modussen. Bijvoorbeeld: de een is heel positief en de ander is heel negatief. Meningen zijn erg verdeeld waardoor er meerdere pieken ontstaan.

45
Q

Teken skewed to the right

A

Dus:

  • Heuvel linkerkant
  • Volgorde van hoog naar laag modus, mediaan, gemiddelde
46
Q

Teken skewed to the left

A

Dus:

  • Heuvel rechterkant
  • Volgorde van laag naar hoog gemiddelde, mediaan, modus
47
Q

Wat betekent spreiding?

A

Afwijkingen van het gemiddelde

48
Q

Teken twee lijnen (een rode en een zwarte) waarin je een grote spreiding laat zien en een kleine spreiding.

A

Grote spreiding: lage lijn (zwart, verspreid).

Lage spreiding: hoge lijn (rood, een piek)

49
Q

Hoe wordt de spreiding ook wel genoemd?

A

De variantie van de data.

50
Q

Hoe wordt de spreidingsbreedte berekend?

A

Het verschil tussen de hoogste en laagste waarde.

51
Q

Waar is de spreidingsbreedte gevoelig voor?

A

Het is heel gevoelig voor outliers.

52
Q

Wat kan er beter gebruikt worden in plaats van de spreidingsbreedte en waarom?

A

Het interkwartielafstand (IQR) kan beter worden gebruikt. Het laat de extreme waarden buiten beschouwing.

53
Q

Hoe groter de variantie…?

A

Hoe groter de variabiliteit. Dat betekent hoe groter de variantie, hoe meer waardes rondom het gemiddelde verspreid zijn.

54
Q

Wat is het nadeel van de variantie?

A

Het is een gekwadrateerde maat (positieve en negatieve waarden zijn gekwadrateerd zodat ze elkaar niet opheffen).

55
Q

Waarom is het gebruik van de standaarddeviatie belangrijk?

A

Het is belangrijk om de zekerheid te bekijken.

56
Q

Teken een normale verdeling (klokvormig) met de bijbehorende tekens en percentages.

A

Zie samenvatting.

57
Q

Hoe bereken je de deviatie?

A

Dat is x - x-bar (dus waarde - gemiddelde).

58
Q

Wat geeft een standaarddeviatie aan?

A

Hoeveel de data gemiddeld afwijkt van het gemiddelde.

59
Q

Waarvoor gebruik je een Z-score?

A

Om te berekenen hoeveel standaarddeviaties een bepaalde observatie van het gemiddelde afligt.

60
Q

Welke score krijg je als je alle Z-scores bij elkaar optelt?

A

0, de negatieve en positieve Z-scores heffen elkaar op.

61
Q

Hoe bereken je een Z-score?

A

Geobserveerde waarde - gemiddelde / standaarddeviatie.

62
Q

Wat geeft een percentiel aan?

A

Geeft aan hoeveel procent de observaties op of onder een bepaald punt ligt.

63
Q

Hoe bereken je de interquartile range?

A

Q3 - Q1

64
Q

Welk type grafiek is heel handig wat betreft het beschrijven van het centrum, variabiliteit en het opsporen van outliers?

A

De Boxplot

65
Q

Wanneer is het een outlier?

A

Als een observatie meer dan 1,5 keer de IQR onder het eerste kwartiel of boven het derde kwartiel ligt.