Hoofdstuk 8 Flashcards
Wat is een in-memory database?
Opslag van gegevens in het interne geheugen
Wat is Appliance?
Een combinati van soft- en hardware voor DWH opslag.
Een soort blackbox van het DWH.
Welke 2 soorten Appliances zijn er?
- DWH - Appliance:
Gericht op datawarehousing
Dus op het laten zien van grote hoeveelheden data die niet veranderd
- Database - Appliance:
Gericht op het optimaal beheren van databases
Wat is een Hadoop?
Een open-source spftware voor gedistribueerde opslag en verwerking van grote hoeveelheden gegevens
Wat is een Hadoop-cluster?
Een verzameling van verschillende computers voor snelle verwerking van grote hoeveelheden data.
Leg Map/Reduce uit
Data verwerking verspreiden over meerdere computers en het resultaat uiteindelijk weer samenvoegen
Wat is MDX (Multidimensional expressions)?:
Een van SQL afgeleide query taal voor online analytical processing (OLAP). Met behulp van een database beheer systeem
Wat is het verschil tussen SQL en MDX?
MDX is multi dimensional, SQL kan maar 1 dimensie gebruiken. B.v. het weergeven van maar 1 rij of kolom
Wat is een Datavault?
Een speciaal voor DWH’s ontworpen opslag structuur voor data uit verschillende bronnen met verschillende definities en betrouwbaarheden.
Wat zijn de 3 soorten tabellen van een Datavault?
- Hub
- Satelite
- Link
Wat bevat een Hub?
Identificerende kenmerken van entiteiten die in het primaire proces een belangrijke rol spelen.
B.v.: Klant, Product, Medewerkers
Wat is een Satelite?
Bij een grote hub kan info worden ondergebracht in satelites. De satelite wordt via een referentie nummer in de hub gelinkt aan de hub.
Wat is een Link?
Links leggen de relatie tussen hubs. Ze bevatten feiten zoals orders, transacties en processen.
Wat zijn de voor- en nadelen van een Datavault?
Voordelen:
- Transparantie en compliance
- Ondersteunt inzichten over data governance
- Snel laad proces (Alleen inserts, geen wijzigingen)
Nadelen:
- Het uiteindelijke model wordt heel groot
- Meer werk: Complexer om te maken
- Meer kennis nodig, er komt een 3e modelleringstechniek bij
Wat is een SCD (Slowly Changing Dimension) en haar types?
Type 1: Geen historie, records worden alleen geupdate.
Type 2: Beperkte historie, er is een actuele waarde + de waarde er voor opgeslagen. Meer niet.
Type 3: Historie van historie (geen historie gaat verloren)