Introduction Flashcards

1
Q

wat is data science

A

werken met en analyseren van ‘data’, gegevens

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

wat is data

A

informatie in ruwe of ongeorganiseerde vorm die verwijst naar objecten, ideeën of condities

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

wat betekent data driven

A

verzamelen en analyseren van data ligt aan basis bedrijfsstrategie en van dagelijkse besluitvorming

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

waarom wordt data opgedeeld

A

om overzicht te behouden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

welke indelingen zijn er

A
  1. op basis van data type
  2. op basis waarvoor data binnen bedrijf gebruikt word
  3. indeling, aard en manier van opslaan van data
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

3 soorten data types:

A

master data, transactionele data en analytische data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

master data

A

data die niet vaak verandert en wordt door business steeds op zelfde manier gebruikt (bv klantnummer), ‘normale data’

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

transactionele data

A

verandert voortdurend en betreft dagelijkse businessativiteiten, beschrijft gebeurtenis (bv bestellingen, bitcoins), vooral financieel

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

analytische data

A

data betreffende performantie van business (bv marktaandeel, solvabiliteitsratio’s), data van analyses

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

manier van opslaan (2):

A

gestructureerd, ongestructureerd

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

gestructureerde data

A

sterk georganiseerde data die volgens voorgedefinieerd data model wordt opgeslagen, op eenvoudige manier toegankelijk en kan gemakkelijk zonder bijkomende inspanningen gebruikt worden in analyses (bv data relationele databanken)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

ongestructureerde data

A

niet opgeslagen volgens voorgedefinieerd data model en wordt op samenhangende en verspreide manier bijgehouden, moeilijk toegankelijk en vereist bijkomende preprocessing voor gebruikt te worden in analyse (bv data in meeting verslagen, rapporten)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

alternatieve opdelingen:

A
  1. op basis van doel van data output (purpose data ouptut)
  2. streaming data versus static data
  3. indeling volgens attitudinal, behavioural of demographic data
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

2 doelen van data output:

A
  1. schema-then-capture, eerst bepalen welke data nodig is voor analyse en dan verzamelen
  2. capture-first-ask-questions-later, data verzamelen en nadien kijken welke vragen/ analyses men met data kan beantwoorden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

attitudinal data

A

hoe voelt een klant zich, weerspiegelen belang dat klant hecht aan bepaalde eigenschappen van aangeboden producten en diensten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

behavioural data

A

wat doet een klant, omvat koopgedrag en merkvoorkeur van consumenten en wordt gebruikt om promotiecampagne uit te werken

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

demographic data

A

wie is klant, data die sociaaleconomisch van aard is (bv populatie, ras, inkomen), die specifieke geografische locaties vertegenwoordigen en vaak geassocieerd met tijd

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

eigenschappen van big data

A

1) hoge data velocity
2) groot volume
3) grote variety

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

velocity

A

snelheid waaraan data gegenereerd, gecapteerd en/of afgeleverd wordt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

variety

A

diversiteit, data komt van vele verschillende bronnen en zit in meerdere databanken in niet uniforme vormen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

2 extra eigenschappen big data

A

1) variability

2) veracity

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

veracity

A

waarheidsgetrouwheid, kwaliteit van data

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

proces van big data naar smart data

A

selectie (verzamelen), opkuisen/zuiveren (verfiëren, valideren), verwerking (classificeren) en voorbereiding (in juiste formaat zetten)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

waar zorgt selectie voor

A

relevante data

25
Q

waar zorgt opkuisen/zuiveren voor

A

correcte data

26
Q

waar zorgt verwerken/voorbereiden voor

A

computer verwerkbare data

27
Q

wat zijn meetschalen/ meetniveau’s

A

zegt wat je met data kan doen

28
Q

2 soorten meetschalen

A

1) kwalitatief

2) kwantitatief

29
Q

kwalitatieve data

A

getallen maar niet om mee te rekenen, bepaalt meestal categorie, bv geslacht

30
Q

kwantitatieve data

A

getallen, bv temperatuur, leeftijd, afstand

31
Q

2 types binnen kwalitatieve data

A

1) nominaal

2) ordinaal

32
Q

nominaal

A

iedere waarde is string, opsomming, bv tomaat appel peer

33
Q

ordinaal

A

iedere waarde is string, volgorde, bv tevredenheidsscores

34
Q

2 types binnen kwantitatieve data

A

1) interval

2) ratio

35
Q

interval

A

verschillen tussen waardes, bv temperatuur in °C, tijdstip, datum

36
Q

ratio

A

verhoudingen, temperatuur in Kelvin, # liter wijn, 1/4 van klas is gebuisd

37
Q

karakteristieken meetniveau

A
  1. onderscheidingsvermogen
  2. grootteorde-karakteristiek
  3. meeteenheid
  4. absoluut nulpunt
38
Q

cardinalisering

A

wanneer waarden van eigenschap niet numeriek zijn en men ze vervangt door getallen

39
Q

discriminantanalyse

A

techniek waarbij men berekeningen maakt met waargenomen waarden van meerdere eigenschappen van bv zelfde personen

40
Q

multicriteria analyse

A

keuze maken tussen verschillende alternatieven, rekening houdend met meerdere doelstellingen

41
Q

continue variabele

A

alle waarden zijn kommagetallen, eender welke waarden tussen 2 grenzen

42
Q

discrete variabele

A

enkel bepaalde waarden, bv gehele

43
Q

betrouwbaarheid

A

iets dat weinig invloed heeft van buitenaf, levert meetinstrument onder identieke omstandigheden zelfde waarden?

44
Q

validiteit

A

meet meetinstrument wat beweert te meten?, wat is bruikbaarheid en wat is juistheid

45
Q

hypothese

A

mogelijke uitkomst, wat je denkt, bewering/veronderstelling

46
Q

operationaliseren

A

iets meetbaar maken

47
Q

dikw-piramide

A

Data, Information, Knowlegde, Wisdom

48
Q

verschillende onderzoeksfasen van klassiek (statisch) onderzoek

A
  1. formuleren van vraagstelling, probleem, theorie
  2. meetbaar maken, operationaliseren
  3. steekproefopzet
  4. verrichten van metingen, verzamelen van gegevens
  5. beschrijven van gegevens
  6. formuleren van statische conclusies
  7. verband tussen resultaten en theorie
49
Q

BI

A

business intelligence, stelt model op om specifiek gekende businessvragen te kunnen beantwoorden

50
Q

OLAP

A

Online Analytical Processing

51
Q

4 vormen data analytics

A

1) descriptive analytics (what happened)
2) diagnostic analytics (why did it happen)
3) predictive analytics (what will happen)
4) prescriptive analytics (how can we make it happen)

52
Q

analyseren van data (3 delen)

A
  1. data mining
  2. machine learning
  3. statistiek
53
Q

data mining

A

betreft zoeken van bruikbare patronen, verbanden en associaties in data door data te beschrijven, samen te vatten, te groeperen

54
Q

machine learning

A

computer programma ‘leert’ uit aangeboden data en past geleerde data toe op nieuwe data

55
Q

statistiek

A

betreft verzamelen, bewerken, interpreteren en presenteren van gegevens

56
Q

populatie

A

groep waar je testen op uitvoert

57
Q

steekproef

A

doen van metingen

58
Q

aselect

A

willekeurig

59
Q

beschrijvende statistiek

A

info uit data halen