coderen Flashcards

Question 1

Q

kenmerken van multivariate technieken

Answer

A

kwantitatief
toetsend of explorerend
datareductie of modeltoetsing
• Modeltoetsing: bepaalde uitkomstmaten kijken, waar we de relaties veronderstellen tussen die uitkomstmaten en verschillende oorzakelijke factoren. We onderzoeken vervolgens hoe die relaties liggen en of de verbanden überhaupt aanwezig zijn en of zij dezelfde richting hebben als we theoretisch veronderstellen
hoog versus laag
voorspelling versus samenhang

Question 2

Q

Univariate technieken

Answer

A

technieken die slechts 1 variabele gebruiken

- descriptieve maten gebruiken

Question 3

Q

bivariate technieken

Answer

A

technieken met 2 variabelen

- correlaionele mate gebruiken

Question 4

Q

Multivariate technieken

Answer

A

3 of meer variabelen gebruiken

-geintegreerde analyse

Question 5

Q

codeboek

Answer

A

= technisch verslag waarbij je duidelijk maakt hoe je van een varzglijst naar een databestand gaat

Question 6

Q

Coderen: bijkomende punten en samenvattende regels

Answer

A

overzichtelijke vragenlijst (genummerd)
duidelijk en consequent codeboek (‘veldcoderen’ uitsluiten)
afspraken voor ‘weet niet’ (7, 77,…), ‘geen antwoord’ (8, 88,…), ‘niet van toepassing’ (9, 99,…): zie bv. codeboek SCV survey
afspraken voor filtervragen
afspraken voor onduidelijke antwoorden
afspraken verwerking meerdere antwoordmogelijkheden
data-entry
data-cleaning

Question 7

Q

rol van statistiek

Answer

A

inferentiële: modelleren van onzekerheid. hoe waarschijnlijk is een resultaat onder een bepaalde veronderstelling van een resultaat, wetenschap probaliteit
beschrijvende statistiek

Question 8

Q

Modellen

Answer

A

beangrijkste structuur van een fenomeen weergeven
- structuurovereenkomst met de werkelijkheid die ze beschrijven
onafhankelijk van de werkelijkheid

Question 9

Q

Bivariaat symmetrische technieken

Answer

A

= verband beschrijven

pearson correlatie (metrç’sch)
spearman en kendall tau (ordinaal)
kruistabbelen, chi² en odds ratio (nominaal)

Question 10

Q

Pearson Correlatiecoëfficient

Answer

A

som v/d afwijkingen van de individuele score van het gemiddelde op variabele X
maal de afwijking van de individuele score van het gemiddelde op variabele Y
gedeeld door de standaarddeviaties van X en Y
gecorrigeerd door de steekproefgrootte

Question 11

Q

Pearson correlatiecoëfficient oppassen

Answer

A

uitschieters

- lineaire verdeling noet kwadratisch of longitudinaal

Question 12

Q

Chi² oppassen

Answer

A

geen observaties => hercoderen en minder categoreën
kleine steekproeven (N<20) fisher exact test
2x2 tabel: continuity correction (indien de verwachte waarde in 1 of meer <5
20% of meer cellen een verwachte frequentie <5

Question 13

Q

Odds ratio

Answer

A

= verhouding relatief risico
-hoeverre een score op de ene variabele een risicoverhoging geeft voor een score op de andere variabel
gebruikt
- logistischeregressie analyse
- beter pearson als de gegevens scheef verdeeld zijn

Question 14

Q

Parametrische toetsen met 2 groepen

Answer

A

assumptie
- gelijke verdeling van de populatie
- afhanekelijk variabel is een continu metrische
types
- onafhankelijke steekproeven
- varianties van beide populaties zijn gelijk
- varianties van beide populaties zijn nier gelijk
=> alternatieve berekeing van t en df
- afhankelijke steekproeven
=> geen varuiantie berkenene: gaan ervan uit bij dezelfde groep dat deze veranderd is

Question 15

Q

Niet-parametrische toetsen met twee groepen

Answer

A

Assumptie
- vervalt
Mann Whitney test

Question 16

Q

parametrische toetsen met meer dan twee groepen

Answer

A

assumptie
- normaal verdeeld in de populatie
- afhankelijke variable is een continu metrische variabele
afhankelijke
- anova: analyse of variance, F-toets, variantieanalyse

F-toets

groter naarmate de between en de within variantie kleiner worden
between: afwijking of verschillen tussen gemiddelde van de 3 groepen
within: de variantie van de groepen zelf

sneller significant
- verschillen gemiddelden vrij groot en de spreiding tussen de groepen zeer klein zijn

=> conclusie globaal => tussen 2 groepen doen moet je een post hoc test doen

Question 17

Q

Niet parametrische toetsen met meer den twee groepen

Answer

A

assumptie

afhankelijke variabel is ordinaal of metrisch
niet-normaal verdeelde variabel

test
- kruskall wallis

Question 18

Q

likertschaal

Answer

A

s reeks vragen/stellingen
meten van concepten
4/5 tot 7 antwoordcatagorieën
positie op een continu kenmerk weergeeft

Question 19

Q

schaaltechnieken

Answer

A

schaal als verzameling van items die geacht worden eenzelfde eigenschap te meten

Question 20

Q

cronbachs alpha

Answer

A

maat van intern consistentie waarbij er gekeken wordt naar de globale samenhang tussen variabelen
- variabelen of items in de schaal zijn ongeveer gelijk
- doel achterliggende houding, trak, attutude, …
wie hoog scoort op ene item, scoort hoog op het andere item

belangrijk

over hetzelfde onderwerp
schaal bevat voldoende items
vragen andersom formuleren en dit afwisselend

relatieve maat: het varieert doordat het aan de hand van gemiddelde correlatiecoëfficient berekend is

0-1
- ondergrens .60-.80 => afhanekelijk van aantal items

Question 21

Q

weinig interne samenhang

Answer

A

1 schaal tweedmimensioneel
2 invers geformuleerde vragen
3 construct meerdere schale of dimensie bevat

Question 22

Q

correlatiematrix

Answer

A

= symmetrische maat van bivariate samenhang

Question 23

Q

eigenwaarde

Answer

A

= maat voor de verklaarde/gedeelde variantie van een principale componentanalyse
eigenwaarde groter dan 1 zijn om meer variantie te hebben dan in de individuele

Question 24

Q

indicatoren van principale component

Answer

A

metrische variabel
ordinaal: likert schaal (best 5-6 antwoordcategorieën)
substantiële factorlading >.30
opletten kruisladingen

Question 25

Q

Hoeveel componenten of factoren?

Answer

A

afhankelijk van de structuur
eigenwaarde criterium
sree plot, scree criterium, knik criterium
interpreteerbaarheid criterium

Question 26

Q

assumptie PC

Answer

A

variabelen zijn normaal verdeeld
niet te veel ruis in de meting: variablen betrouwbaar zijn
relaties tussen de variabelen zijn lineair
min interval meetniveau

Question 27

Q

Prediction

Answer

A

in hoeverre zeggen scores op de ene variabele of ene set van variabelen iets over een andere variabelen
- situaring regressieanalyse

Question 28

Q

forecasting

Answer

A

= als we weten dat wat X is, dan kunnen we Y voorspellen

- situering bij de regressieanalyse

Question 29

Q

e

Answer

A

=voorspelfout, gesommeerde afstand van de punten tot de rechte
- error, residuele fout, residu
als ei klein is wilt dit zeggen dat ^yi heel dicht is bij de echte ^y
= yi - ^yi

Question 30

Q

schattingsprocedure

Answer

A

fitten van de rechte = kleinste kwadrant

=> som van kwwadraten van de errortermen wordt geminimaliseerd

Question 31

Q

regressieanalyse

Answer

A

vaak gebruikt
voorspeellen, verklaren
verklaren van een theorie
theorievorming
forecasting
prediction
voordeel: info over voorspelling oplevere
nadeel: bouwen en interpretern van het model is niet altijd even gemakkelijk

Question 32

Q

Niet zomaar zoveel mogzlijk predictoren nemen om de R² zo groot mogelijk te maken, 2 overwegingen

Answer

A

Inhoudelijke: theoretische overweging van het opnemen van voorspellers => anders black box benadering
Kanskapitalisme: techniek kapitaliseert op toevallige, uniek combinaties

Question 33

Q

regressiegewichten

Answer

A

= welk gewicht elke X-variabele krijgt in de regressievergelijking
Gestandaardiseerde
- schaalonafhankelijk => -1 en 1
- niet inhoudelijk
- partiële correlatiecoëfficient: in de reeks ov na te gaan welke variabel het meest bijdraagt aan de AV. degene met het grootste regressiegewicht, kan onderling met elkaar vergelijken

Ongestandaardiseerde

schaalafhankelijk: bepaald door de eenheid va de ov
inhoudelijk

Question 34

Q

kwaliteit van voorspelling regressieanalyse

Answer

A

R²
= hoeveel van de variantie van y verklaard wordt door ov => goodness of fit maat
- laag: niet significant is
- verklarende variantie

adjusted R²

gecorrigeerde maat voor hat aantal ov in het model
zoeken spaarzaam model = parsimonious => ov die een impact hebben op de Av

Question 35

Q

voorwaarden regressieanalyse

Answer

A

1) X en Y zijn metrisch
- AV zeker
- OV kan verschil
- controleren door interpretatie en face validity

2) lineair verband tussen X en Y
- curvelineaire rechte gaat niet
- ander soort verband detecteert men niet
- scatterplot plotten en kijken naar de rechte

3) OV hangen onderling niet sterk aan elkaar
- multicollineariteit: problemen met de interpretatie e zorgt voor overlap => 1 uit de analyse laten
- variablene correleren met .80
- enkel variabelen meenemen die i-uniek bijdrage aan de voorspelling van y
- controleren correlatiematrix

4)outliners

Question 36

Q

3 extra assumpties: voorwaarden

Answer

A

1) waarneming zijn onafhankelijk, de kwaliteit van de voorspelling van de ene persoon is onafhankelijk van de andere persoon - de afstand t.a.v. de rechte. niet de bedoeling dat de afstand tot de rechte bepaald wordt door ander punt. - onafhankelijk steekproeven, waarbij de observatie niet beïnvloed wordt door steekproeven
: durbin-watson toets

2) voorspelfouten zijn normaal verdeeld
- errortermen zijn normaal verdeeld, agressieanalyse kan scheef zijn
=> av normaal erdeeld zijn, de afstand tot de rechte normaal verdeeld
- grote steekproef nodig
- oplossing logistische regressieanalyse: binair voorspellen of iemand in de groep zijn en niet kijke naar de spreiding

3) homoskedasticiteit:
- errortermen gelijk verdeeld zijn over de waarden van X
- puntenwolk dezelfde range heeft voor elke waarde van de OV.
- bandbreedte gelijk blijft

Question 37

Q

Durbin-Watson toets

Answer

A

kijken waarnemeningen onafhankelijk zijn

Question 38

Q

F-toets

Answer

A

uitvoeren om te kijken of men de afzonderlijke gewichten kan meten. INdien deze sgnificant is kan dit

Question 39

Q

R²

Answer

A

geeft aan hoeveel procent van de afhankelijke de onafhankelijke kan verklaren

Question 40

Q

Berekenen van regressieanalyse

Answer

A

1) R²
2) adjusted R²
3) nulhypothese maken
4) Ftoets
5) p-waarde
6) individuele kijken indien de F-toets significant is
7) B-waarde
- significant of niet
8) intercept
9) verklarind geven
10) 3 assumpties + 4 voorwaarden

Question 41

Q

nadelen correlatiecoëfficient

Answer

A

gevoelig voor uitlijners

maar-t voor lineaire samenhang => niet kwadratische samenhang

Question 42

Q

Controleren op onmogelijke antwoorden

Answer

A

1) outliners
2) onmogelijke combinaties
3) frequentietabel
4) kruitabel

Question 43

Q

strategieën bij ontbrekende waarden

Answer

A

1 niets doen

litwise delition
vertekening van de data => niet toevallig

2 imputatie

Question 44

Q

strategieën bij ontbrekende waarden

Answer

A

1 niets doen

litwise delition
vertekening van de data => niet toevallig

2 imputatie

Question 45

Q

strategieën bij ontbrekende waarden

Answer

A

1 niets doen

listwise deletion
vertekening van de data => niet toevallig
zeker multivaiate analyse: verlies power, kleineere n

2 imputatie

invullen missing value
complexe of eenvoudige
mogelijk vertekening
probleem: uitgaan dat vraag toevallig niet is beantwoord => 2 analyses doen en kijken naar de correlatie

Question 46

Q

aard van de missing

Answer

A

MCAR: Missing Completely At Random
MAR: Missing At Random
MNAR: Missing Not At Random

Question 47

Q

variabelen klaarmaken voor analyse

Answer

A

Transformeren
Hercoderen
Sommeren

Question 48

Q

transformeren

Answer

A

bv. probleem met normale verdeling van de variabele 
‘niets doen’
   - robuuste techniek
   - indicatie van vertekening?
transformatie
betekenis van transformatie? 
ook hier: lapwerk…

Question 49

Q

Beschrijvende statistiek

Answer

A

maten centrale tendentie

maten voor spreiding

Question 50

Q

Inferentiele statistiek

Answer

A

steekproeven en populatie
omgaan met onzekerheid
steekproefgrootte
betrouwbaarheidsintervallen
verdeling

Question 51

Q

Centrale tendentie

Answer

A

beschrijvend emaat
gemiddelde
modus

Question 52

Q

maat coor spreiding

Answer

A

beschrijvende statistiek
variantie
standaarddeviatie
range: : spectrum van je waarneming

Question 53

Q

fout gaan bij omgaan onzekerheden

Answer

A

te kleien steekproef
te veel ruis in de data dat samenhang in de ruis verdwijnt
assumptie van toetingsprocedure geschonden