Zusammenfassung2 EBI - DWH Architekturen Flashcards
Was ist ein DWH
Ein Data Warehouse ist eine von den operationalen DV-Systemen isolierte Datenbank, die als unternehmensweite Datenbasis für Management-Unterstützungssysteme dient
Vorteil:
- globale Sicht auf Daten aus unterschiedlichen Datenbeständen entsteht
- Gleichzeitig vereinfacht sich der Zugriff auf die Daten für Anwender, da sie in einer zentralen Datenbank konsistent und strukturiert bereitgestellt sind.
Den nachgelagerten Anwendungen bietet das Data Warehouse spezifisch erstellte Auszüge, die sogenannten Data Marts:
- Data Warehouse ist zentrales Repository für alle Daten einer Organisation
- Ziel eines Data Mart ist es jedoch, die besonderen Anforderungen einer bestimmten Gruppe von Benutzern innerhalb der Organisation zu erfüllen.
- Im Allgemeinen sind die Data Marts Teilmengen des Data Warehouses einer Organisation.
Was sind Meta Daten
- Metadaten sind Daten über Daten und Prozesse.
Metadaten beschreiben Struktur und Zusammenhänge im System. - Metadaten helfen bei Auffinden und Verstehen von Daten.
- Durch Metadaten werden Daten zu Informationen.
- Metadaten sind wichtig für alle Phasen des Data Warehousing:
– Analyse, Entwurf, Konstruktion, Einführung und Benutzung, z.B.
– Bedeutung und Verwendung der operativen/externen Daten,
– Bedeutung und Verwendung der gespeicherten Daten,
– Vertrauen in Datenqualität (Konsistenz, Zuverlässigkeit, Integrität)
Welche DHW-Architekturvarianten kennen Sie und wodurch zeichnen sich diese aus?
Stove-Pipe-Ansatz: ist oftmals historisch bedingt und liefert keine Integration, sondern isolierte Data Marts.
Data Marts mit abgestimmten Datenmodellen: Hier erfolgt eine Erleichterung der Gewährleistung von Konsistenz und Integrität der dispositiven Daten.
Core Data Warehouse: In einem Core Data Warehouse erfolgt die Speicherung dispositiver Daten nach ersten Transformationsschritten der Bereinigung und Harmonisierung für unterschiedlichste Auswertungszwecke.
Hub-and-Spoke-Architektur: Hier dient das Core Data Warehouse als Hub und erfüllt die Aufgabe der Integration, Qualitätssicherung und Datenverteilung an die Data Marts als Spokes.
Data-Mart-Busarchitektur nach Kimball: Hier sind alle Modelle dimensional strukturiert, insbesondere auch das Core Data Warehouse als zentrales granulares Repository.
Corporate Information Factory nach Inmon: Hie kommt die dimensionale Modellierung nur für die Data Marts zum Einsatz. Das Data Warehouse ist normalisiert modelliert und soll eine möglichst flexibel granulare Basis darstellen.
Unterschied zwischen operativen und analytischen Informationssystemen hinsichtlich Verarbeitung und Verwendung der Datenbestände?
Operative Systeme: Unterstützung des operative Geschäfts
- Kurze Transaktionen mit wenig Datenzugriffen
- Viele Änderungsoperationen
- Daten müssen schnell, detailliert und zeitlich aktuell vorliegen
- Keine historischen Daten
- Große Zahl von Benutzern erfordert hohe Verfügbarkeit
Analytische Systeme: Unterstützung der Managementaufgaben
- Sehr große Datenmengen, meist historische, verdichtete Daten
- Daten sind wohl strukturiert, integriert und konsolidiert
- Überblick über relevante Unternehmensdaten
- Komplexe, oft heuristische Ad-hoc-Anfragen
- Wenige Transaktionen mit hohe Anzahl an Datenzugriffen
- Keine Änderungsoperationen
Nenne typische Probleme, die auftreten können, wenn BI-Anwendungen direkt auf die Datenbestände operativer Informationssysteme zugreifen?
Ineffizienz der Datenbeschaffung:
- DV-Strukturen mit unterschiedlichen Datenbanken machen übergreifende Auswertung schwierig und aufwändig
Performanzbeeinträchtigung
- durch aufwändige Datenzugriffe
Mangelnde Glaubwürdigkeit:
- Frühere Auswertungen können zu späteren Zeitpunkten oft nicht nachvollzogen werden aufgrund von Änderungsoperationen bzw. Fehlender historischer Daten.