Teil 5 - EBI - Dimensionale Modellierung Flashcards
Was versteht man unter OLAP
Online Analytical Processing
- ist ein effizientes Instrument zur analytischen Bearbeitung von multidimensional aufbereiteten sehr großen Datenmengen, die aus Data Marts, aus dem DWH oder auch aus operativen Systemen stammen können
Erkläre das dimensionale Datenbank Management System
Multidimensional Online Analytical Processing
- ein Ansatz, der es Anwendern auf einfache Art und Weise ermöglichen soll, Daten aus verschiedenen Perspektiven zu betrachten
- Ziel: Multidimensionale Sicht auf die Daten zu erhalten und damit die Kennzahlen in Abhängigkeit von Dimensionen zu erkennen
Warum wird Woche und Saison nicht einem Jahr zugeordnet?
- weil es keinen konsistenten Bezug gibt
- Beispiel: erste Woche des Jahres fängt nicht mit dem ersten Tag des Jahres an
- Folge: es können inkonsistente Daten entstehen
Drill Down, Drill Up, Slice, Dice, Drill Through und OLAP Join erklären (OLAP Operationen)
Drill Down: Erhöhung des Detailgrades > zb. von Monate auf Tage wechseln
Drill Up: Verringerung des Detailgrades > zb. von Produkt auf Produktkategorie
Slice: Herausschneiden einzelner Scheiben oder Schichten
Dice: Herausschneiden einzelner Unterwürfel
Drill Through: Wechsel von einem Würfel zu einem anderen
OLAP Join: Verknüpfung von Würfeln. Braucht mind. ein gemeinsames Attribut
Wie kann man ein Dimensionales Modell in ein relationales Datenbankmodell überführen?
Relationale DB Modelle sind normalisiert (3NF)
Dimensionale Modelle im Star-Schema sind denormalisiert
- können aber als Snowflake-Schema modelliert werden, das ebenfalls in 3NF normalisiert ist
Somit ist es möglich ein dimensionales Modell in ein Relationales Modell zu überführen
Wo und warum das Star-Schema zu redundanten Daten führt
- Beim Star-Schema sind meist mehrere Datensätze betroffen, wenn die Attribute einer Dimension geändert werden
- Beim Snowflake-Schema ist nur ein Datensatz betroffen
Vor- und Nachteil der Modellierungsvarianten (Star)
Vorteile
- Dimensionsrelation ist im Vergleich zu Faktenrelation sehr klein
- Eignet sich gut für die Kommunikation zwischen Fachbereichen und IT > Dimensionen sind denormalisiert
Nachteile
- Dimensionsrelationen nicht in 3NF
- enthält Redundanzen
- Meist mehrere Datensätze betroffen bei Attributänderungen einer Dimension
Vor- und Nachteil der Modellierungsvarianten (Snowflake)
Vorteile
- Weniger Speicherplatz > keine Redundanzen
- Nur ein Datensatz betroffen bei Attributänderungen einer Dimension
- Faktenrelationen sind in 3NF
Nachteile
- Zusätzlich künstliche Schlüssel müssen gespeichert werden
- Faktenrelation ist sehr groß im Vergleich zu Dimensionenrelation