Teil3 - EBI - DWH Architekturen Flashcards
DWH Referenzarchitekturvarianten
DWH
- ohne Data Marts
- mit unabhängigen Data Marts
- mit abhängigen Data Marts
Hybrides DWH
Bevorzugte Variante: Datenquellen werden in ein zentrales DWH geschrieben und an die verschiedenen DM verteilt
Button Up Vor- und Nachteile
Vorteile:
- atomare Daten werden in DM gespeichert
- konzentriert sich auf die Erstellung benutzerfreundlicher, flexibler Datenstrukturen
Nachteile:
- Änderung der Struktur sehr schwierig
- nicht zur Unterstützung beliebiger Datenspeicher oder betrieblicher Reporting Datenstrukturen oder Prozesse vorgesehen
Top Down Vor- und Nachteile
Vorteile:
- Erzwingt eine flexible Unternehmensarchitektur
- Einmal gebaut, minimiert die Möglichkeit von abtrünnigen unabhängigen Data Marts
- Data Warehouse eliminiert redundante Auszüge
Nachteile:
- Erfordert das Erstellen und Verwalten mehrerer Datenspeicher und Plattformen
- Möglicherweise müssen Detaildaten auch in Data Marts gespeichert werden
Lassen sich Aspekte beider Ansätze kombinieren?
Ja, beide Ansätze lassen sich zu einem hybriden Ansatz kombinieren
Hybrid: DW befüllen xWochen später erstes DM Core DWH befüllen und nach und nach Data Marts
Unterschied zwischen Top-Down und Button-Up
Top Down
- erstelle zuerst das Core DWH, danach fülle ich die Data Marts mit den Daten daraus
- Analyse der Gesamtwirtschaft, Märkte und/oder Branchenlage bei den Investmentenscheidungen stehen im Vordergrund (Analyse von “oben nach unten”)
Buttom Up
- ich habe zuerst die Data Marts und befühle dann das DWH mit den Daten aus den DMs
- Analyse einzelner Unternehmen stehen im Vordergrund (Analyse von “unten nach oben”)
Bill Inmon bezeichnet Zeitbezug als wesentliche Eigenschaft. Erläutern sie Bedeutung und nennen sie Vorteile, die sich bei der Datennutzung ergeben.
- In operativen Systemen ist der aktuelle Datenbestand gespeichert. Dieser kann jederzeit geändert werden.
- Data Warehouse enthält ganze Historie von Daten
- Data Warehouse-Daten sind mit Bezug zu einem bestimmten Zeitpunkt gültig.
- Gültigkeitszeitraum ist bei Daten vermerkt (Data Warehouse: 5-10 Jahre)
Vorteile: Vergleich der Daten über Dimension Zeit möglich.