boek Groningen Flashcards

1
Q

onderzoekseenheden

A

objecten of personen waar je iets over zegt

kenmerken van onderzoekseenheden waar je iets over zegt = variabelen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

variabele zonder vaststaande numerieke waarde

A

categorieën toch numerieke waarde geven om dataverwerking te vergemakkelijken

bv. vrouw = 1, man = 2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

datamatrix

A

manier om kenmerken (kolommen) van onderzoekseenheden (rijen) onder te brengen

frequentieverdeling kun je maken om uitspraak te kunnen doen over percentuele verdeling over variabele

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

termen in datamatrix

A

variabelenaam = naam boven kolom

wat wordt bedoeld met variabelenaam zet je bij ‘variabelelabel’

waarde/value = getallen in cellen

valuelabel = aangeven wat wordt bedoeld met de waarden

deze info toevoegen bij tabblad ‘Variable view’

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

absolute en percentages in frequentietabel

A

absolute frequentie: aantal eenheden

percentage

cumulative percent = percentages van elke volgende waarde erbij opgeteld

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

frequentietabel opvragen

A

analyze > descriptive statistics > frequencies
daar variabelen selecteren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

valid percent

A

de missing values worden niet meegerekend en daardoor kun je qua percentages beter daar kijken.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

grafiek

A

Geen extra info, maar visueel snel duidelijk

taart-/cirkeldiagram meestal bij percentages (relatief)
staafdiagram meestal bij absolute aantallen

niet gebruikt bij heel veel verschillende waarden

grafiek maken in spss:
analyze> descriptive statistics > frequencies
>charts

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

benoemen aantal onderzoekseenheden

A

n = ….

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

meetbaar maken van variabelen

A

operationaliseren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

latente variabele

A

variabele die je niet direct met één variabele kunt meten
bv. seksisme in tijdschrift

Dan vaak samengestelde schaal, op intervalniveau gemeten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

onafhankelijke variabele

A

oefent invloed uit
meestal: x

afhankelijke wordt beïnvloed
meestal: y

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

4 meetniveaus

A

nominaal, ordinaal, interval, ratio

nominaal meetniveau:
nummers hebben geen betekenis als getal
geen rangordening
alleen bepalen: zelfde waarde of niet
bv. woonplaats, geslacht

ordinaal meetniveau:
wel rangordening
intervallen hebben geen betekenis, afstanden tussen waarden zijn betekenisloos
bv. opleidingsniveau, schaal helemaal oneens tot helemaal eens

nominaal en ordinaal: categorisch, kan niet mee gerekend worden.

interval meetniveau:
wel gelijke afstand waarden, daardoor hebben intervallen betekenis
rangorde
geen absoluut nulpunt

bij geen absoluut nulpunt (bv temp.) kun je niet zeggen 20 gr is 2x warmer dan 10 gr.
bv. temperatuur
ook geboortejaar, want chinezen rekenen anders. Het is iets dat is afgesproken, arbitrair

ratio meetniveau:
gelijke intervallen
absoluut nulpunt
rangorde
bv. lengte in cm, aantal vrienden

interval en ratio = numeriek
kun je mee rekenen
in spss: Scale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

continue en discrete

A

continue: alle waarden zijn mogelijk
discrete: beperkt tot telbaar aantal waarden (tussenliggende waarden geen betekenis, bv. 1,5 tv)

continu verschijnsel vaak wel discrete meetschaal, bv leeftijd

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

hercoderen (recode)

A

waarden herverdelen in verschillende klassen
bv kijktijd in minuten naar 3 categorieën (keuze onderbouwen)
daarmee van ratio naar ordinaal
minder analyses mogelijk

compute? blz122

in spss:
transform > record into different variables (oorspronkelijke variabelen worden daarmee bewaard!)
variabele > numeric variable > output variable
nieuwe naam
change

old and new values
range toevoegen door minimum en maximum-waarde toe te voegen + add (niet mogelijk bij nominale waarden, daar geen rangorde)

kan ook: Lowest through value (laagste waarde t/m bepaalde waarde) en value through highest (vanaf bepaalde waarde t/m hoogst mogelijke waarde)

nieuwe variabelen is laatste/onderste variabele.
Via data zelf labels typen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

centrummaten 1.7

A

Rond welke (centrale) waarde de uitkomst ligt van waarnemingen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

modus

A

waarde die het meest voor komt
hoogst in frequentie, bepalen a.d.h.v. frequentiemeting

bij alle meetniveaus te gebruiken, niet altijd zinnig

nominaal niveau: modus het meest geschikt en ook de enig mogelijke centrummaat
mag ook modus van andere meetniveaus

nadeel: modus geeft geen info over de overige waarden (dus soms niet zinvol om modus te berekenen)

modus is nummer van categorie met hoogste waarde.
bv modus is 1: categorie 1 (bier) heeft hoogste frequentie. getalsmatig zegt 1 hier niks.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

mediaan

A

middelste waarneming na rangordening data van laag naar hoog
50% ligt onder deze waarde en 50% boven

niet op nominaal niveau, want daar is geen rangorde
ordinaal niveau of hoger
meest geschikt voor ordinaal

categorieën moeten elkaar uitsluiten!

bij even aantal waarnemingen:
eerst sorteren, middelste twee optellen en delen door 2

Kan zinnig zijn bij interval- of ratio:
> mediaan is ongevoelig voor uitschieters (in tegenstelling tot gemiddelde)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

(rekenkundig) gemiddelde

A

alleen bij interval en ratio

waarnemingen optellen en delen door totaal aantal waarnemingen (n)

ook wel - x (streep boven x) of M (mean)

zie formule blz 41

sigma: neem de som van
n: totaal aantal waarnemingen
i=1, waarneming 1 t/m n, delen door n

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

spreidingsmaat

A

geven aan hoe sterk de waarden zich concentreren

vooral van belang bij interval en ratio,
want afstand tussen variabelen staat centraal

21
Q

iets zeggen over spreiding bij nominaal niveau

A

bv. aantal mogelijke waarden/ aantal categorieën
(eerst vier verschillende drankjes besteld, later meer)

of:
variatie-ratio, aandeel van onderzoekseenheden dat niet in modale categorie (= modus) valt

22
Q

spreiding en ordinaal niveau

A

range: verschil tussen hoogste en laagste variabele (hoogste - laagste= range)
wel moeilijk interpreteren

kan zinvol zijn om te vergelijken met andere range
bv leeftijden, range vriendengroep en range familie verschilt, terwijl het gemiddelde vergelijkbaar kan zijn.
maar: zegt niks over spreiding

23
Q

kwartielen

A

25%
Q1: 25% heeft kleinere of gelijke waarde, 75% gelijke of hogere waarde
enz.

interkwartielafstand (IQR): afstand tussen Q1 en Q3 (Q3 - Q1=)
alleen zinvol als minimaal interval niveau is
zie blz 45
waarde van interkwartielafstand beter te interpreteren wanneer je deze vergelijkt met andere interkwartielafstand

24
Q

boxplot

A

grafische weergave van kwartielen
> bekijken van zowel centrale tendentie als spreiding in één oogopslag:
laagste waarde, Q1, mediaan, Q3, hoogste waarde

25
variantie
bij spreiding op interval- en rationiveau per waarde afstand tot gemiddelde berekenen x i - x- (streepje boven x) individuele x - gemiddelde van x= som hiervan komt altijd op 0 uit > daarom kwadreren: (xi - x-)2 daarna gemiddelde van de gekwadreerde afstanden berekenen. formule op blz 48 = variatie nadeel: sterk afhankelijk van aantal onderzoekseenheden daarom: variantie (s2) gekwadreerde afstanden optellen en delen door totaal aantal waarnemingen - 1 nog steeds wel lastig interpreteren vergelijken met variantie van andere groep wel zinvol
26
standaarddeviatie
s ook wel: standaardafwijking wortel trekken uit variantie daardoor beter te interpreteren in combi met gemiddelde
27
spreidingsmaten spss
bij numerieke variabelen (interval- en rationiveau) via analyze anders onoverzichtelijk door vele waarden
28
grafieken
staaf en cirkeldiagram > als niet zoveel verschillende waarden van variabele zijn cirkel: vaak percentage staaf: vaak absolute aantallen minimaal interval: histogram: grafische weergave van frequentieverdeling van geordende data of frequentiepolygoon: middens van bovenkant staven met elkaar verbinden population piramide: vergelijken populaties
29
scheefheid > normaal
symmetrisch = normale verdeling klokvormig figuur modus, mediaan en gemiddelde vallen samen hierbij: kun je kans berekenen dat bepaalde waarde voorkomt empirische regel: hierbij ook: 34% ligt tussen gemiddelde en 1 SD hoger of lager 2 SD = 13,5% 3 SD of hoger/lager = 2,5% (overschrijdingskans)
30
z-score
hoeveel maal SD de waarde afwijkt van gemiddelde waarde - gemiddelde : door s= z-score
31
standaardnormale verdeling
normale verdeling van de waarden omzetten in verdeling van z-scores gemiddelde is hierbij altijd 0 SD is altijd 1 altijd bij standaardiseren
32
extreme waarde
z < -2 of z > 2
33
outlier
z < -3 of z > 3
34
kurtosis
gewelfdheid: hoe plat of spits spitser: minder verdeeldheid berekenen in spss via explore
35
skewness
= 0 > dan symmetrisch = positief > rechtsscheef = negatief > linksscheef over het algemeen: marge van 1, daarboven = scheef scheefverdeling: niet meer empirische regel in boxplot scheefheid te herkennen aan plek mediaan mediaan meer naar rechts: linksscheef mediaan meer naar links: rechtsscheef
36
correlatiecoëfficiënt r
Pearson productmoment correlatiecoëfficiënt beide variabelen minimaal interval wat op welke as: onafh > horizontaal (x) afh > verticaal (y) voorwaarde: beide variabelen normaal verdeeld en symmetrisch (zien in scatterplot)
37
spreidingsdiagram
grafische weergave: spreidingsdiagram (scatterplot) > eerste indruk van sterkte en richting ook kijken: is er sprake van kromlijnig verband? (dan mogelijk verband niet te zien aan r, die alleen lineaire samenhang) extreme waarden kunnen zorgen voor kromming in diagram (dan beter spearmans rho)
38
effectgrootte van r
kwadraat van r (R2)
39
kruistabelanalyse
kijken naar percentages en spreiding ervan
40
rangorde n
n staat voor aantal dus hoogste (laatste) getal
41
spearmans rho correlatiecoëfficiënt
ps of rs rangcorrelatiecoëfficiënt bij kromlijnig verband of scheef verdeeld of bij minimaal 1 ordinale var. of veel extreme waarden bij interval/ratio > kijken naar de plaats die waarde inneemt in verhouding tot andere waarden dus rekenen met rangordeningen ipv oorspronkelijke waarden hoogste waarde var = 1 daarna = 2 enz
42
compute
letterlijk: berekenen nieuwe variabele uitrekenen met 1 of meerdere variabele meetniveau minimaal interval (uitzondering: ordinale schaal waarvan antwoorden op interval lijken) in spss: transform > compute variable > nieuwe naam onder 'target variable' > berekening onder 'numeric expression'
43
associatiematen op nominaal niveau
geven geen info over de richting, wel over de sterkte
44
Cramers V
als minimaal 1 variabele nominaal is bij symmetrische relaties, geen onderscheid afh en onafh. var.
45
voorwaarde om kruistabel te interpreteren
- niet teveel waarden - minimaal 80% van cellen heeft verwachte frequentie van minimaal 5 - alle cellen een verwachte frequentie van minimaal 1
46
interpreteren sterkte van associatiematen
richtlijnen: 0 - 0,10 geen of zeer zwak verband 0,11 - 0,30 zwak verband 0,31 - 0,50 redelijk 0,51 - 0,80 sterk verband 0,81 - 0,99 zeer sterk 1 perfect verband
47
rapporteren verband
apa-richtlijnen bv Chi2 (4, N= 65) = 51,85, p < 0,001, V = 0,63 én minimaal 2 percentages uit kruistabel vrijheidsgraden (df): bij elke toets op andere manier berekend (aantal kolommen -1) x (aantal rijen - 1) 3 x 3: 3-1 x 3-1= 2 x 2 = 4 aantal onderzoekseenheden - 1 > het aantal observaties dat vrij is om te variëren.
48
phi
symmetrische associatiemaat nominaal niveau alleen bij 2x2 tabellen
49
verwachte frequentie
wat je zou verwachten qua frequentie als er geen samenhang is sommen en rijen optellen totaal rij... x kolom ... : aantal waarnemingen