HC4 + H1, H2, H4, H5 SPSS Flashcards

1
Q

Wat is een histogram/frequentie distributie?

A

Het is een grafiek die aangeeft hoe vaak een bepaalde optie voorkomt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Hoe ziet een normaal verdeling eruit?

A

Dat is een soort parabool, die aan beide kanten er precies hetzelfde uitziet. Het is symmetrisch

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

De normaalverdeling wordt veel gebruikt bij een veelgebruikte variabele. Welke?

A

Lengte

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Er zijn twee veel voorkomende manier waarbij een verdeling afwijkt van normaal. Welke

A
  1. Gebrek aan symmetrie (skew, ookwel scheefheid)
  2. Puntigheid (kurtosis)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Scheve verdelingen zijn niet symmetrisch en in plaats daarvan zijn de meest voorkomende scores geclusterd aan het uiteinde van de schaal. Hoe ziet de positieve scheve verdeling eruit?

A

De frequente scores zitten vooral aan het begin en loopt daarna af en de staart/punt is richting de meer hogere scores

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Hoe ziet de negatieve scheve verdeling eruit?

A

Dit is het spiegelbeeld van de positieve verdeling. De frequente scores zitten vooral aan het einde en de staart/punt is richting de meer lagere scores

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wat is kurtosis?

A

Kurtosis verwijst naar de mate waarin scores clusteren aan het einde van de verdeling (ookwel staarten genoemd) en dit heeft de neiging zich uit te drukken in hoe puntig een verdeling is.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wat is een positieve kurtosis?

A

Een verdeling met positieve kurtosis heeft veel scores in de staart (zwaarstaart distributie) en is puntig. Dit wordt leptokurtisch genoemd.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wat is een negatieve kurtosis?

A

Een verdeling met negatieve kurtosis is relatief dun in de staart en is platter dan normaal. Dit wordt platikurtisch genoemd.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wat is de centrale tendentie en welke drie metingen worden daar voor gebruikt?

A

De centrale tendentie is om uit te rekenen waar het centrum van een frequentieverdeling ligt. Hiervoor worden de modus, de mediaan en het gemiddelde gebruikt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wat is de modus? Hoe wordt het genoemd als er twee modi zijn en hoe wordt het genoemd als het er meer dan 2 zijn?

A

Dit is het getal/de waarde die het meeste voorkomt in een dataset. Als het er twee zijn wordt het bimodaal genoemd. Bij meer dan twee wordt het multimodaal genoemd.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wat zijn de nadelen van de modus?

A
  • Het is mogelijk dat er meer dan één modus is
  • Bij lage kurtosis/puntigheid kunnen een paar waarnemingen de waarde van de modus al beïnvloeden.
  • Het zegt weinig over de hele scoreverdeling
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wat zijn de voordelen van de modus?

A
  • Makkelijk te bepalen
  • Kan ook voor elke variabele gebruikt worden: ook nominaal meetniveau
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wat is de mediaan? Met welke formule wordt het uitgerekend?

A

Dit is de waarde die als de data opeenvolgend van laag naar hoog wordt gezet, de waarde die op de middelste plek staat. Als de dataset even is, dan wordt het gemiddelde genomen tussen de twee middelste waarden. Het kan worden uitgerekend door (n+1)/2 = mediaan

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wat zijn de voordelen van de mediaan?

A
  • Wordt niet sterk beïnvloed door: extreme waarden en scheefheid van de verdeling
  • Het kan gebruikt worden voor ordinale, interval en ratio data.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wat zijn de nadelen van de mediaan?

A
  • Kleine steekproefstabiliteit
  • Weinig rekenkundige mogelijkheden
  • Het meetniveau van de variabele moet minimaal ordinaal zijn
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Wat is het gemiddelde, hoe wordt het berekend?

A

Je telt alle waarden bij elkaar op en deelt het dan door het aantal waarden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Wat zijn de nadelen van het gemiddelde?

A
  • Gevoelig voor outliers en scheefheid van de verdeling.
  • Meetniveau moet interval/ratio zijn
19
Q

Wat zijn de voordelen van het gemiddelde?

A
  • Meest gebruikte maat
  • Elke score wordt gebruikt
  • Veel rekenkundige mogelijkheden
20
Q

Alleen de centrummaten is niet genoeg voor het interpreteren van de data. Hiervoor hebben we ook spreidingsmaten. Welke spreidingsmaten zijn er en hoe wordt een spreidingsmaat gedefinieerd?

A

Spreidingsmaat = de maat voor de variatie binnen de steekproef: liggen getallen in een verdeling dichtbij of juist ver uit elkaar?
- Sum of squared errors
- Bereik/range
- Standaarddeviatie
- Variantie

21
Q

Wat is de spreiding/het bereik?

A

Het verschil tussen de hoogste en de laagste score

22
Q

Wat is het nadeel van de spreiding?

A

Het is heel gemakkelijk beïnvloed door uitschieters, want het pakt juist alleen de hoogste en laagste waarde

23
Q

De dataset kan worden opgedeeld in kwartielen, de dataset wordt verdeeld in groepen van 25%. 50% is de mediaan, ookwel het tweede kwartiel. Q1 is de mediaan van het laagste helft. Q3 is de mediaan van de hoogste helft. Wat is de interkwartielafstand?

A

Q3-Q1

24
Q

Wat zijn kwantiels? vb.

A

Waarden die een dataset splitsen in gelijke delen. Als een dataset in 9 gelijke stukjes moet worden verdeeld, dan heet dit een noniel.

25
Q

Wat is de sum squared errors (SS) en wat is het doel?

A

Het geeft een indicatie van totale spreiding van een variabele. Het doel is om te kijken naar de afwijkingen van elke score t.o.v. gemiddeld (deviantie)

26
Q

Met welke formule kan de deviantie/afwijking worden berekend? En wat is de formule van de SS?

A

deviantie = Sigma (xi - xgem)
SS = Sigma (xi - xgem)^2

27
Q

Waar wordt de kwadratensom (sum of squares (errors)) voor gebruikt? Waarom wordt dit eigenlijk niet vaak gebruikt en wat wordt er dan wel gebruikt?

A

Het is een indicator van de totale afwijking van het gemiddelde. Het wordt niet veel gebruikt, omdat het niet vergeleken kan worden met andere dataset die een andere hoeveelheid data hebben. Daarom wordt de gemiddelde afwijking van het gemiddelde gebruikt. Dit wordt de variantie genoemd.

28
Q

Hoe wordt de variantie/gemiddelde afwijking van het gemiddelde berekend?

A

Variantie (s^2) = (Sigma (deviantie)^2)/(N-1)

29
Q

Hoe wordt de standaarddeviatie berekend? Waarom wordt de standaarddeviatie vaak gebruikt? Wat is de standaarddeviatie?

A

Maat voor gemiddelde afwijking van de scores van het steekproefgemiddelde.
Sd = Wortel (s^2). Het wordt vaak gebruikt omdat het niet in het kwadraat is, maar de daadwerkelijke gemiddelde afwijking van het gemiddelde.

30
Q

Op welke manier hebben het gemiddelde en de standaarddeviatie invloed op de dataverdeling?

A

Gemiddelde = plaats. Als het gemiddelde verandert, dan schuift de klokvorm in zijn geheel naar links of naar rechts.
Standaarddeviatie = vorm. Als de variantie of standaarddeviatie verandert, dan wordt de klokvorm breder of smaller

31
Q

Stap 3 van de analyse is rekenen met de data. Data kan ook in waarschijnlijkheid worden uitgedrukt, een kansverdeling genoemd. Dit werkt alleen bij een normaalverdeling. Het ziet er dan ook zo uit. bv. Bij cijfers van een tentamen kan berekend worden hoe groot de kans is om een 9 of hoger te halen. Met welke berekening moet dit worden gedaan?

A

z = ((Xi-Xgem)/sd)

32
Q

Wat is de z-score?

A

Een gestandaardiseerde score voor specifieke uitkomst zodat deze overeenkomt met standaard normaalverdeling. Geeft aan hoeveel standaarddeviaties een score van het gemiddelde af zit.

33
Q

Wat moet er verder gedaan worden als we de z-waarde weten.

A

We kijken in de bijlage A.1, zoeken de z-waarde op en kijken bij de smaller portion, want we willen weten hoe groot de kans is om een 9 of hoger te halen. Dat is het antwoord.

34
Q

Wat moeten we doen om te bepalen wat de kans is om een 9 of lager te halen?

A

Z berekenen met voorgaande formule en dan de z-waarde opzoeken in bijlage A.1 en kijken bij larger portion. Dat is het antwoord

35
Q

Je kunt nooit de hele werkelijkheid meten. Toch wordt hier het meest naar gestreefd. Wat is de formule die hierbij hoort?

A

Werkelijkheid = model + fout

36
Q

Uitspraken doen over de werkelijkheid is uitspraken doen over de gehele populatie. Wat is het probleem hiermee?

A

Uitspraken over de hele populatie is meestal onhaalbaar. Een oplossing daarvoor is de steekproef. Het is dan belangrijk om naar de kwaliteit (probability vs non-probability sampling) en de grootte (n belangrijk voor betrouwbaarheidsinterval, power en significantie) te kijken

37
Q

Wat is een parameter?

A

Een meetbare waarde die de populatie of een aspect van de populatie, karakteriseert. Parameters in de populatie (de werkelijkheid) kunnen geschat worden op basis van steekproef data. Voor een populatie zijn dat Griekse tekens, zoals sigma en mu en voor een steekproef zijn dat Latijnse tekens, zoals s en x

38
Q

Wat houdt een model fit in?

A

De mate waarin een model de data goed representeert

39
Q

Stap 1 in de analyse is data verkennen. Wat is de frequentie?

A

Aantal keer dat een bepaalde waarde van een variabele voorkomt in de data

40
Q

Bij het verkennen van de data kan er sprake zijn van een frequentieverdeling en een normaalverdeling. Waarom moet je bij een frequentieverdeling van elke variabele in je onderzoek bekijken hoe de verdeling eruit ziet?

A
  • Om fouten te ontdekken (bv. typfouten bij invoeren)
  • Checken of iedereen wel alle vragen heeft ingevuld (item-missings)
  • Samenvatting van de onderzoeksgegevens.
41
Q

Wat is er kenmerken aan een normaalverdeling?

A
  • Klokvormig
  • Symmetrisch
42
Q

Welke soort fenomenen hebben normaliter een normaalverdeling?

A
  • Scores op een toets
  • Lengte van mensen
43
Q

Waarom is het zo belangrijk om te kijken of jouw variabelen normaal verdeeld zijn?

A

Sommige statistische toetsen vereisen dat variabelen normaal verdeeld zijn (assumptie van normaliteit)

44
Q

Stap 2 in de analyse is data beschrijven/samenvatten. Dit gaat over centrale tendentiematen/centrummaten. Hoe weet je of scores normaal verdeeld zijn?

A

Als de modus, mediaan en het gemiddelde op dezelfde plek zitten.