Architektur von Data-Warehouse-Systemen Flashcards
Architektur von Data-Warehouse-Systemen (3)
- (Präsentation)
- Datenbereitstellung
- Datenhaltung
- Datenerfassung
- (Datenquellen)
Verteilte Data-Marts
- Spezifische Ausrichtung auf heterogene Informationsbedarfe unterschiedlicher Bereiche
- Lokales Berechtigungskonzept
- Lokal integrierte Data-Warehouses mit Datenschemata geringerer Komplexität
- Einfache Zusammenführung und Konsolidierung der Daten
- Mehrere, ggf. teilweise redundante ETL-Prozesse
Zentrales Data-Warehouse mit verteilten Data-Marts
- Spezifische Ausrichtung auf heterogene Informationsbedarfe unterschiedlicher Bereiche.
- Lokales Berechtigungskonzept
- Global integriertes Data-Warehouse mit komplexem Datenschema; Ableitung lokaler Datenschemata aus dem globalen Datenschema; redundante Datenhaltung.
- Aufwändige Zusammenführung und Konsolidierung der Daten.
- Vereinheitlichter ETL-Prozess.
Generischer Rahmen für das Schichtenmodell (6)
- Präsentationsschicht
- Datenbereitstellungsschicht
- Historisierungsschicht
- Integrationsschicht
- Extraktionsschicht
- Datenquellen
Virtuelles DWH-System
Die Softwareschichten des DWH-Systems selbst verfügen über keine persistente Datenhaltung. Alle Datenbestände werden temporär bei der Anfrage an das DWH-System erzeugt.
Prinzipiell widerspricht die Architektur auch der Definition eines DWH, welche eine eigenständige physische Datenhaltung als kennzeichnendes Merkmal vorsieht.
Zentrales DWH-System
- “Single Point of Truth”
- Nur verschiedene Datenquellen
Vorteile:
• Zentrale Datenbereitstellungsschicht.
• Homogenes Begriffssystem für Kennzahlen und Dimensionen.
Nachteile:
• Hoher Aufwand der Koordination der spezifischen Anforderungen einzelner Unternehmensbereiche; diese sind ggf. nicht hinreichend abbildbar.
• Geringe Flexibilität, hoher Anpassungsaufwand.
Hub-and-Spoke-Architektur
- „Corporate Information Factory“
- Ab Datenbereitstellungsschicht unabhängig
- Gemeinsame Datenbasis
Data-Mart-Bus-Architektur
Die Konsistenz zwischen den Data-Marts wird stattdessen auf der Grundlage eines zentralen Metadaten-Repository durch den Austausch gemeinsamer Dimensionsdaten und Kennzahlen (conformed dimensions, conformed facts) über einen logischen Bus realisiert.
Föderiertes DWH-System
Föderierte DWH-Systeme folgen dem Konzept föderierter Datenbanksysteme. Dabei werden ausgewählte Daten von Data-Marts (im Beispiel Data-Marts A und B) gezielt für eine Föderation (Data-Mart C) zur Verfügung gestellt. Die konsolidierte Sicht wird lediglich virtuell erzeugt.
Hierarchisches
DWH-System
Im Gegensatz zu föderierten DWH-Systemen werden die Datenbestände aus den unterschiedlichen Data-Marts in einer separaten Datenbasis (persistente Datenbereitstellungsschicht) zusammengeführt. Auf diese Weise können auch weitere Datenquellen eingebunden werden.
Terminologie
Informationen zur Verwaltung von Fachbegriffen (eindeutige Begriffsbenennung, Definition und Ursprung des Fachbegriffs, Begriffsbeziehungen, Synonyme, Homonyme, Verantwortliche für den Fachbegriff).
Datenstruktur und Datensemantik
Metadaten zur Beschreibung von Datenstrukturen (Name, Beschreibung, (strukturierter) Datentyp mit Typkonstruktoren und Wertebereichen).
Datentransformation
Angaben über Datentransformationsprozesse (Datenquellen und -ziele, Transformationsschritte).
Datenqualität
Qualitätsmerkmale für Datenschema und Datenwerte (Semantik, Identifizierbarkeit, Vollständigkeit).
Organisationsbezug
Metadaten über die datenproduzierenden und -konsumierenden Organisationseinheiten (Datenproduzent, Datenkonsument, Berechtigungen, Entstehungs- und Verwendungskontext).