Hoofdstuk 8 Flashcards

1
Q

Wat is een in-memory database?

A

Opslag van gegevens in het interne geheugen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wat is Appliance?

A

Een combinati van soft- en hardware voor DWH opslag.

Een soort blackbox van het DWH.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Welke 2 soorten Appliances zijn er?

A
  1. DWH - Appliance:

Gericht op datawarehousing
Dus op het laten zien van grote hoeveelheden data die niet veranderd

  1. Database - Appliance:

Gericht op het optimaal beheren van databases

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wat is een Hadoop?

A

Een open-source spftware voor gedistribueerde opslag en verwerking van grote hoeveelheden gegevens

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wat is een Hadoop-cluster?

A

Een verzameling van verschillende computers voor snelle verwerking van grote hoeveelheden data.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Leg Map/Reduce uit

A

Data verwerking verspreiden over meerdere computers en het resultaat uiteindelijk weer samenvoegen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wat is MDX (Multidimensional expressions)?:

A

Een van SQL afgeleide query taal voor online analytical processing (OLAP). Met behulp van een database beheer systeem

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wat is het verschil tussen SQL en MDX?

A

MDX is multi dimensional, SQL kan maar 1 dimensie gebruiken. B.v. het weergeven van maar 1 rij of kolom

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wat is een Datavault?

A

Een speciaal voor DWH’s ontworpen opslag structuur voor data uit verschillende bronnen met verschillende definities en betrouwbaarheden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wat zijn de 3 soorten tabellen van een Datavault?

A
  1. Hub
  2. Satelite
  3. Link
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wat bevat een Hub?

A

Identificerende kenmerken van entiteiten die in het primaire proces een belangrijke rol spelen.

B.v.: Klant, Product, Medewerkers

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wat is een Satelite?

A

Bij een grote hub kan info worden ondergebracht in satelites. De satelite wordt via een referentie nummer in de hub gelinkt aan de hub.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wat is een Link?

A

Links leggen de relatie tussen hubs. Ze bevatten feiten zoals orders, transacties en processen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wat zijn de voor- en nadelen van een Datavault?

A

Voordelen:

  • Transparantie en compliance
  • Ondersteunt inzichten over data governance
  • Snel laad proces (Alleen inserts, geen wijzigingen)

Nadelen:

  • Het uiteindelijke model wordt heel groot
  • Meer werk: Complexer om te maken
  • Meer kennis nodig, er komt een 3e modelleringstechniek bij
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wat is een SCD (Slowly Changing Dimension) en haar types?

A

Type 1: Geen historie, records worden alleen geupdate.

Type 2: Beperkte historie, er is een actuele waarde + de waarde er voor opgeslagen. Meer niet.

Type 3: Historie van historie (geen historie gaat verloren)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wat is een Total Recall Database (SCD type 3)?

A

Hier in deze Database gaat geen enkele waarde / attributuur verloren.