les 1 - eyeballing data Flashcards

1
Q

bosplot geeft info over

A

positie, spreiding, symmetrie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

histogram geeft info over

A

normaliteit verdeling

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Analyse missing data

A

= Ontbrekende waarden voor 1/meer variabelen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

oorzaken analyse missing data

A
  • Onafhankelijk van respondent:
    Procedure
    Codeerfouten
  • Afhankelijk van de respondent:

Omvang? (veel of weinig)
Analyse van het profiel van missing data (is er systematiek of random?)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

impact missing data

A
  • Praktische impact
  • Nonrandom missingness
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

praktische impact van missing data

A
  • Reductie steekproefgrootte (listwise deletion; vb. Antarctica data )
  • Indien te veel: N vergroten of remediëren (zie verder)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

nonrandom missingness

A
  • Bias!
  • Specifieke groepen uitgesloten uit analyse (vb. hoge inkomens )
  • Merk je pas op als je missing data hebt bestudeerd
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

soort missing data

A

Verwaarloosbare missing data

Niet-verwaarloosbare missing data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

verwaarloosbare missing data

A

= verwacht, deel van de procedure, toegelaten
= random missingness

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

random missingness

A
  1. Data van individuen (observatie-eenheden) die niet in de steekproef zitten
  2. Skip-patronen in design (e.g., “Rookt u? Zo neen, ga naar item x”)
  3. Censored data: niet beschikbaar
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

gekende nier-verwaarloosbare missing data

A

= te wijten aan procedurele factoren
= weinig controle over

Codeerfouten, fouten bij ingeven data

Vragenlijst niet volledig ingevuld (vb tijdsgebrek)

Sterfte respondent

Weigering “gevoelige” items, “geen mening”

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Missing Completely At Random (MCAR)

A
  • Tussen de subgroepen zijn missing data random gelijk
  • De kans dat data missing is, is gelijk voor iedereen in de sample
  • De oorzaak van missing data is onafhankelijk van de data
  • Elke remedie ok; zeer weinig voorkomend
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Missing At Random (MAR)

A
  • Binnen subgroepen zijn missing data random, maar verschillen tussen groepen
  • Missing data zijn afhankelijke van andere variabelen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Omgaan met missing data

A

Trachten te vermijden (bijv. check vragenlijsten, aandachtig bij coderen,…)

Standaard listwise deletion (enkel complete cases)

Cases en/of variabelen verwijderen (als random)

MAR of MCAR: Imputatie (missing data vervangen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

outliers

A

Buitenbeentjes, uitbijters

Duidelijk anders dan de andere observaties

Kunnen grote invloed hebben op analyse + interpretatie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

sensitviteitsanalyse:

A

wat gebeurt het met de resultaten als je de outlier weglaat, itt andere waarnemingen?

17
Q

Voorwaarden om multivariate analyses te mogen uitvoeren

A
  1. Normaliteit
  2. Homoscedasticiteit (gelijke spreiding)
  3. Lineariteit
18
Q

Kurtosis

A

Kurtosis: gepiektheid of platheid (hoogte) tov normaalverdeling

19
Q

rol van N

A
  • Hoe groter de sample, hoe kleiner het effect van niet-normaalverdeeldheid
  • N<30 -> grote impact op resultaten
  • N>200 -> impact verwaarloosbaar
20
Q

Homoscedasticiteit

A

Afhankelijke variabele(n) vertonen vergelijkbare niveaus van variantie over de range van onafhankelijke variabele(n) hee

21
Q

Potentiële nadelen van transformaties

A
  • Interpretatie van de resultaten kan minder duidelijk zijn
  • Theoretische en empirische overwegingen
  • Betekenis van de afhankelijke variabele (bvb. gekwadrateerde inkomensverschillen ( geen negatieve waarden meer)