Hoorcollege 12 Flashcards

Big data

1
Q

Wat zijn de 4 voordelen van bestaande data?

A
  • Mogelijkheid tot niet-reactieve (non-reactive) dataverzameling
  • Kosten- en tijdsbesparing
  • Bestuderen van fenomenen in het verleden
  • Veel data
  • Vergelijkend onderzoek (bijv. cross-cultureel met ISSP)
  • Bestuderen van maatschappelijke, sociale en culturele veranderingen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
1
Q

Wat zijn data-archieven?

A
  • Opslagplaatsen voor data die al verzameld zijn
  • Secundaire analyse (secondary analysis)

Voorbeelden:
* General Social Survey (GSS)
* European Social Survey (ESS)
* International Social Survey Programme (ISSP)
* Organization for Economic Co-Operation and Development (OECD)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
1
Q

Wat wordt er bedoeld met privé-documenten?

A

Privé-bezit van personen
* Dagboeken (bijv. dagboek Anne Frank)
* Brieven (bijv. brieven van soldaten aan familie tijdens WWII)

Privé-bezit van bedrijven en organisaties
* Personeelsbestanden
* Fiscale rapporten
* Patiëntenbestanden van ziekenhuizen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
1
Q

Waar kan je betouwbare informatie vinden over bijvoorbeeld statistiek? (2 bronnen)

A

Rijksoverheid en CBS

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wat is Open Science Framwork?

A

➢ Inventarisatie: Is mijn onderzoeksvraag nieuw en uniek?
➢ Ontwerp: Preregistratie
➢ Uitvoering: Opslaan van data (= data repository) en analysestrategie
➢ Verslaglegging: Gelinkt aan alle voorgaande informatie

Voordelen
✓ Bevordert transparantie en dus controleerbaarheid en repliceerbaarheid van onderzoek
✓ Bevordert wetenschappelijke vooruitgang
✓ Bevordert samenwerking tussen onderzoekers over de hele wereld

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wat is massamedia en in welke 3 vormen komen we het tegen?

A

Fysiek: kranten, tijdschriften

Digitaal: televisie, radio, films

Online: Facebook, Instagram, X, YouTube

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wat is Big Data?

A
  • 2011: Eerste publicatie van onderzoek op basis van big data (als zodanig vermeld)
  • 2014: Meer dan 1600 publicaties
  • 2014 – nu: Sterke groei gebruik big data in sociologie en business-gerelateerde praktijk
    → Toenemend aanbod Data Science bachelor- en masterprogramma’s

Kenmerken:
* Digitaal verzamelde data (vaak automatisch) – bijv. NS, apps, cookies

  • Extreem grote datasets met enorm veel variabelen
  • Welke variabelen?
  • Hoe te interpreteren?
  • Hoe te gebruiken in onderzoek?
  • Gebruik van geavanceerde rekenmethodes om te analyseren
  • Veel programmeren en data modeling en - visualisatie
  • Big Data (achtergrond, ALLE data) ≠ Massamedia (zichbaar, kleine schaal)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wat bedoelen we met fysieke bronnen en non-verbale bronnen?

A
  • Kunst, kleding, huishouditems
  • Zelden gebruikt in sociaal wetenschappelijk onderzoek
  • Forensisch onderzoek
  • Archeologie / Culturele antropologie
  • Gedrag in het (verre) verleden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

3 uitdagingen bij zoeken, vinden en toegang

A
  • Onderzoeksvraag (en hypotheses) als leidraad
    → Ook als de data al beschikbaar is!
  • Zoek naar bestaande studies over het onderwerp
    → Bijv. in OSF, en vraag auteurs hun data met je te delen
  • Toegang tot vertrouwelijke informatie (bijv. patiëntbestanden, bedrijfsdocumenten)
    → Gaat vaak veel tijd overheen!
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Uitdagingen bij meten van concepten

A
  • Onvolledige informatie over te meten concepten
  • Vaak bij surveydata (bijv. GSS (US) en ESS (Europa))

    Regelmatig incomplete of suboptimale maten voor concepten
    → Wees volhardend en creatief! (m.a.w., beter iets suboptimaals dan helemaal niets)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Uitdagingen bij evalueren van kwaliteit

A
  • Kwaliteitscriteria (HC2 & HC4) blijven gelden!

Uitdagingen
*Hoe is de data verzameld?
Bijv. survey-data

*Accuraatheid en consistentie?
Bijv. openbare documenten

  • Interpretatie?
    Bijv. survey-data en privé-documenten
  • Authenticiteit?
    Bijv. Fysieke bronnen en historische documenten

➢ Eventueel verschillende bronnen vergelijken! (= triangulatie)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Uitdagingen bij (on)volledigheid

A
  • Hoe adequaat is de data voor jouw onderzoek?
  • Populatie & soort steekproef? > generaliseerbaarheid

Bijv. Survey-data uit data-archieven

  • Selectieve overleving (selective survival)
  • Selectieve verdwijning (selective deposit)
    Bijv. historische documenten & privé-documenten
  • Volledige dekking & overrepresentatie
    Bijv. Big data
How well did you know this?
1
Not at all
2
3
4
5
Perfectly