coderen Flashcards

1
Q

kenmerken van multivariate technieken

A
  • kwantitatief
  • toetsend of explorerend
  • datareductie of modeltoetsing
    • Modeltoetsing: bepaalde uitkomstmaten kijken, waar we de relaties veronderstellen tussen die uitkomstmaten en verschillende oorzakelijke factoren. We onderzoeken vervolgens hoe die relaties liggen en of de verbanden überhaupt aanwezig zijn en of zij dezelfde richting hebben als we theoretisch veronderstellen
  • hoog versus laag
    voorspelling versus samenhang
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Univariate technieken

A

technieken die slechts 1 variabele gebruiken

- descriptieve maten gebruiken

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

bivariate technieken

A

technieken met 2 variabelen

- correlaionele mate gebruiken

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Multivariate technieken

A

3 of meer variabelen gebruiken

-geintegreerde analyse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

codeboek

A

= technisch verslag waarbij je duidelijk maakt hoe je van een varzglijst naar een databestand gaat

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Coderen: bijkomende punten en samenvattende regels

A
  • overzichtelijke vragenlijst (genummerd)
  • duidelijk en consequent codeboek (‘veldcoderen’ uitsluiten)
  • afspraken voor ‘weet niet’ (7, 77,…), ‘geen antwoord’ (8, 88,…), ‘niet van toepassing’ (9, 99,…): zie bv. codeboek SCV survey
  • afspraken voor filtervragen
  • afspraken voor onduidelijke antwoorden
  • afspraken verwerking meerdere antwoordmogelijkheden
    data-entry
    data-cleaning
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

rol van statistiek

A
  • inferentiële: modelleren van onzekerheid. hoe waarschijnlijk is een resultaat onder een bepaalde veronderstelling van een resultaat, wetenschap probaliteit
  • beschrijvende statistiek
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Modellen

A

beangrijkste structuur van een fenomeen weergeven
- structuurovereenkomst met de werkelijkheid die ze beschrijven
onafhankelijk van de werkelijkheid

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Bivariaat symmetrische technieken

A

= verband beschrijven

  • pearson correlatie (metrç’sch)
  • spearman en kendall tau (ordinaal)
  • kruistabbelen, chi² en odds ratio (nominaal)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Pearson Correlatiecoëfficient

A
  • som v/d afwijkingen van de individuele score van het gemiddelde op variabele X
  • maal de afwijking van de individuele score van het gemiddelde op variabele Y
  • gedeeld door de standaarddeviaties van X en Y
  • gecorrigeerd door de steekproefgrootte
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Pearson correlatiecoëfficient oppassen

A
  • uitschieters

- lineaire verdeling noet kwadratisch of longitudinaal

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Chi² oppassen

A
  • geen observaties => hercoderen en minder categoreën
  • kleine steekproeven (N<20) fisher exact test
  • 2x2 tabel: continuity correction (indien de verwachte waarde in 1 of meer <5
  • 20% of meer cellen een verwachte frequentie <5
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Odds ratio

A

= verhouding relatief risico
-hoeverre een score op de ene variabele een risicoverhoging geeft voor een score op de andere variabel
gebruikt
- logistischeregressie analyse
- beter pearson als de gegevens scheef verdeeld zijn

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Parametrische toetsen met 2 groepen

A

assumptie
- gelijke verdeling van de populatie
- afhanekelijk variabel is een continu metrische
types
- onafhankelijke steekproeven
- varianties van beide populaties zijn gelijk
- varianties van beide populaties zijn nier gelijk
=> alternatieve berekeing van t en df
- afhankelijke steekproeven
=> geen varuiantie berkenene: gaan ervan uit bij dezelfde groep dat deze veranderd is

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Niet-parametrische toetsen met twee groepen

A

Assumptie
- vervalt
Mann Whitney test

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

parametrische toetsen met meer dan twee groepen

A

assumptie
- normaal verdeeld in de populatie
- afhankelijke variable is een continu metrische variabele
afhankelijke
- anova: analyse of variance, F-toets, variantieanalyse

F-toets

  • groter naarmate de between en de within variantie kleiner worden
  • between: afwijking of verschillen tussen gemiddelde van de 3 groepen
  • within: de variantie van de groepen zelf

sneller significant
- verschillen gemiddelden vrij groot en de spreiding tussen de groepen zeer klein zijn

=> conclusie globaal => tussen 2 groepen doen moet je een post hoc test doen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Niet parametrische toetsen met meer den twee groepen

A

assumptie

  • afhankelijke variabel is ordinaal of metrisch
  • niet-normaal verdeelde variabel

test
- kruskall wallis

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

likertschaal

A
  • s reeks vragen/stellingen
  • meten van concepten
  • 4/5 tot 7 antwoordcatagorieën
  • positie op een continu kenmerk weergeeft
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

schaaltechnieken

A

schaal als verzameling van items die geacht worden eenzelfde eigenschap te meten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

cronbachs alpha

A

maat van intern consistentie waarbij er gekeken wordt naar de globale samenhang tussen variabelen
- variabelen of items in de schaal zijn ongeveer gelijk
- doel achterliggende houding, trak, attutude, …
wie hoog scoort op ene item, scoort hoog op het andere item

belangrijk

  • over hetzelfde onderwerp
  • schaal bevat voldoende items
  • vragen andersom formuleren en dit afwisselend

relatieve maat: het varieert doordat het aan de hand van gemiddelde correlatiecoëfficient berekend is

0-1
- ondergrens .60-.80 => afhanekelijk van aantal items

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

weinig interne samenhang

A

1 schaal tweedmimensioneel
2 invers geformuleerde vragen
3 construct meerdere schale of dimensie bevat

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

correlatiematrix

A

= symmetrische maat van bivariate samenhang

23
Q

eigenwaarde

A

= maat voor de verklaarde/gedeelde variantie van een principale componentanalyse
eigenwaarde groter dan 1 zijn om meer variantie te hebben dan in de individuele

24
Q

indicatoren van principale component

A
  • metrische variabel
  • ordinaal: likert schaal (best 5-6 antwoordcategorieën)
  • substantiële factorlading >.30
  • opletten kruisladingen
25
Q

Hoeveel componenten of factoren?

A
  • afhankelijk van de structuur
  • eigenwaarde criterium
  • sree plot, scree criterium, knik criterium
  • interpreteerbaarheid criterium
26
Q

assumptie PC

A
  • variabelen zijn normaal verdeeld
  • niet te veel ruis in de meting: variablen betrouwbaar zijn
  • relaties tussen de variabelen zijn lineair
  • min interval meetniveau
27
Q

Prediction

A

in hoeverre zeggen scores op de ene variabele of ene set van variabelen iets over een andere variabelen
- situaring regressieanalyse

28
Q

forecasting

A

= als we weten dat wat X is, dan kunnen we Y voorspellen

- situering bij de regressieanalyse

29
Q

e

A

=voorspelfout, gesommeerde afstand van de punten tot de rechte
- error, residuele fout, residu
als ei klein is wilt dit zeggen dat ^yi heel dicht is bij de echte ^y
= yi - ^yi

30
Q

schattingsprocedure

A

fitten van de rechte = kleinste kwadrant

=> som van kwwadraten van de errortermen wordt geminimaliseerd

31
Q

regressieanalyse

A
  • vaak gebruikt
  • voorspeellen, verklaren
  • verklaren van een theorie
  • theorievorming
  • forecasting
  • prediction
    voordeel: info over voorspelling oplevere
    nadeel: bouwen en interpretern van het model is niet altijd even gemakkelijk
32
Q

Niet zomaar zoveel mogzlijk predictoren nemen om de R² zo groot mogelijk te maken, 2 overwegingen

A
  • Inhoudelijke: theoretische overweging van het opnemen van voorspellers => anders black box benadering
  • Kanskapitalisme: techniek kapitaliseert op toevallige, uniek combinaties
33
Q

regressiegewichten

A

= welk gewicht elke X-variabele krijgt in de regressievergelijking
Gestandaardiseerde
- schaalonafhankelijk => -1 en 1
- niet inhoudelijk
- partiële correlatiecoëfficient: in de reeks ov na te gaan welke variabel het meest bijdraagt aan de AV. degene met het grootste regressiegewicht, kan onderling met elkaar vergelijken

Ongestandaardiseerde

  • schaalafhankelijk: bepaald door de eenheid va de ov
  • inhoudelijk
34
Q

kwaliteit van voorspelling regressieanalyse

A


= hoeveel van de variantie van y verklaard wordt door ov => goodness of fit maat
- laag: niet significant is
- verklarende variantie

adjusted R²

  • gecorrigeerde maat voor hat aantal ov in het model
  • zoeken spaarzaam model = parsimonious => ov die een impact hebben op de Av
35
Q

voorwaarden regressieanalyse

A

1) X en Y zijn metrisch
- AV zeker
- OV kan verschil
- controleren door interpretatie en face validity

2) lineair verband tussen X en Y
- curvelineaire rechte gaat niet
- ander soort verband detecteert men niet
- scatterplot plotten en kijken naar de rechte

3) OV hangen onderling niet sterk aan elkaar
- multicollineariteit: problemen met de interpretatie e zorgt voor overlap => 1 uit de analyse laten
- variablene correleren met .80
- enkel variabelen meenemen die i-uniek bijdrage aan de voorspelling van y
- controleren correlatiematrix

4)outliners

36
Q

3 extra assumpties: voorwaarden

A

1) waarneming zijn onafhankelijk, de kwaliteit van de voorspelling van de ene persoon is onafhankelijk van de andere persoon - de afstand t.a.v. de rechte. niet de bedoeling dat de afstand tot de rechte bepaald wordt door ander punt. - onafhankelijk steekproeven, waarbij de observatie niet beïnvloed wordt door steekproeven
: durbin-watson toets

2) voorspelfouten zijn normaal verdeeld
- errortermen zijn normaal verdeeld, agressieanalyse kan scheef zijn
=> av normaal erdeeld zijn, de afstand tot de rechte normaal verdeeld
- grote steekproef nodig
- oplossing logistische regressieanalyse: binair voorspellen of iemand in de groep zijn en niet kijke naar de spreiding

3) homoskedasticiteit:
- errortermen gelijk verdeeld zijn over de waarden van X
- puntenwolk dezelfde range heeft voor elke waarde van de OV.
- bandbreedte gelijk blijft

37
Q

Durbin-Watson toets

A

kijken waarnemeningen onafhankelijk zijn

38
Q

F-toets

A

uitvoeren om te kijken of men de afzonderlijke gewichten kan meten. INdien deze sgnificant is kan dit

39
Q

A

geeft aan hoeveel procent van de afhankelijke de onafhankelijke kan verklaren

40
Q

Berekenen van regressieanalyse

A

1) R²
2) adjusted R²
3) nulhypothese maken
4) Ftoets
5) p-waarde
6) individuele kijken indien de F-toets significant is
7) B-waarde
- significant of niet
8) intercept
9) verklarind geven
10) 3 assumpties + 4 voorwaarden

41
Q

nadelen correlatiecoëfficient

A

gevoelig voor uitlijners

maar-t voor lineaire samenhang => niet kwadratische samenhang

42
Q

Controleren op onmogelijke antwoorden

A

1) outliners
2) onmogelijke combinaties
3) frequentietabel
4) kruitabel

43
Q

strategieën bij ontbrekende waarden

A

1 niets doen

  • litwise delition
  • vertekening van de data => niet toevallig

2 imputatie

43
Q

strategieën bij ontbrekende waarden

A

1 niets doen

  • litwise delition
  • vertekening van de data => niet toevallig

2 imputatie

44
Q

strategieën bij ontbrekende waarden

A

1 niets doen

  • listwise deletion
  • vertekening van de data => niet toevallig
  • zeker multivaiate analyse: verlies power, kleineere n

2 imputatie

  • invullen missing value
  • complexe of eenvoudige
  • mogelijk vertekening
  • probleem: uitgaan dat vraag toevallig niet is beantwoord => 2 analyses doen en kijken naar de correlatie
45
Q

aard van de missing

A

MCAR: Missing Completely At Random
MAR: Missing At Random
MNAR: Missing Not At Random

46
Q

variabelen klaarmaken voor analyse

A

Transformeren
Hercoderen
Sommeren

47
Q

transformeren

A
bv. probleem met normale verdeling van de variabele 
‘niets doen’
   - robuuste techniek
   - indicatie van vertekening?
transformatie
betekenis van transformatie? 
ook hier: lapwerk…
48
Q

Beschrijvende statistiek

A

maten centrale tendentie

maten voor spreiding

49
Q

Inferentiele statistiek

A
  • steekproeven en populatie
  • omgaan met onzekerheid
  • steekproefgrootte
  • betrouwbaarheidsintervallen
  • verdeling
50
Q

Centrale tendentie

A
  • beschrijvend emaat
  • gemiddelde
  • modus
51
Q

maat coor spreiding

A
  • beschrijvende statistiek
  • variantie
  • standaarddeviatie
  • range: : spectrum van je waarneming
52
Q

fout gaan bij omgaan onzekerheden

A
  • te kleien steekproef
  • te veel ruis in de data dat samenhang in de ruis verdwijnt
  • assumptie van toetingsprocedure geschonden