Teil4 - EBI - Data Vault Modelling Flashcards
Data-Vault-Modellierung
Bei der Data-Vault-Modellierung werden alle zu einem Geschäftskonzept (wie Kunde oder Produkt) gehörenden Informationen in drei Kategorien eingeteilt und entsprechend in drei verschiedenen Typen von Datenbanktabellen abgelegt
Stärken und Schwächen von Data Vault Modeling
Stärken:
- größere Stabilität, da neue Daten eingefügt werden können, ohne die Datenstruktur zu verändern
- erweiterbar: es können neue Bereiche einfach ergänzt werden, ohne bestehende Bereiche zu beeinflussen
- Einfachheit: wurde das Modellierungskonzept verstanden, kann das Konzept mit den vorgegebenen standards theoretisch einfach und konsistent über das gesamte Code DWH angewendet werden
Schwächen:
- unbedingte Einhaltung der Standards
- Umsetzung erfordert viel Erfahrung, für die optimale Umsetzung
- Lesbarkeit
In welchen Bereich eines DWH macht Data-Vault-Modellierung Sinn?
Einsatz von Data-Vault-Modellierung im Storage Layer des Data-Warehouse sinnvoll, da sich Data Vault um das Thema Datenintegration dreht
Da die Daten meist stark normalisiert abgelegt sind ist eine Zusammenführung der Daten als Star-Schema zur Auswertung vorteilhaft ist.
Data Vault Modellierungsobjekte nennen und die Rollen erklären
- Hub
- Kernobjekt der Geschäftslogik
- enthält Informationen, die ein Objekt eindeutig beschreiben, d. h. seine Identität
- Verknüpfungselement / Link
- stellt Beziehungen zwischen den Objekten dar
- Satellitenentitäten
- hier werden alle Informationen gespeichert, die den Hub oder Link beschreiben
Beschreiben Sie, wo und wie in einem Data-Vault-Modell die für DWH-Systeme wichtige Historisierung von Daten umgesetzt wird!
Ausschließlich in den Satellites bzw. den Satellite-Entitäten
Durch einen Vergleich der Attribute der neusten Datenlieferung mit letzter Version
In den Satellites werden sich oft änderte Daten und konstante Daten getrennt voneinander in unterschiedlichen Tabellen gespeichert. So kann Speicherplatz gespart werden.
In einem einem Projekt, in dem Sie als Experte für die Datenmodellierung in einem Data Warehouse engagiert sind, streiten zwei Mitarbeiter darüber, ob ein Data-Vault-Modell die dritte Normalform erfüllt. Können Sie den Streit schlichten?
Der Data Vault ist ein detailorientierter, historischer Verfolgungs- und einzigartig verknüpfter Satz von normalisierten Tabellen, die einen oder mehrere funktionale Geschäftsbereiche unterstützen.
Es ist ein hybrider Ansatz, der die beste Rasse zwischen der 3. Normalform (3NF) und dem Sternschema umfasst.
Das Design ist flexibel, skalierbar, konsistent und an die Bedürfnisse des Unternehmens anpassbar.
Es handelt sich um ein Datenmodell, das speziell auf die Anforderungen heutiger Data Warehouses in Unternehmen zugeschnitten ist.