Das multidimensionale Datenmodell Flashcards
Wie erfolgt bei operativen Anwendungssystemen meist die Darstellung der Daten?
Bei operativen Anwendungssystemen erfolgt die Darstellung der Daten meist in relationaler Form. Die zugehörige Metapher ist die einer zweidimensionalen Tabelle. Die Zeilen der Tabelle stellen Entities dar (z.B. Kunden), die Spalten enthalten die Werte dieser Entities bezüglich ihrer einzelnen Attribute (z.B. Name)
Wie erfolgt bei DWHS meist die Darstellung der Daten?
Die Darstellung eines Data-Warehouse erfolgt in multidimensionaler Form. Die zugehörige Metapher ist die eines mehrdimensionalen Kubus (Hypercube), dessen Elemente Werte einer bestimmten entscheidungsrelevanten Kennzahl (auch Kenngröße, Maßzahl,
Variable, Fakt oder Metrik genannt; z.B. Umsatz) darstellen. Die Werte der Kennzahl sind entlang der Dimensionen des Hypercube klassifiziert (z.B. Produkt, Geographie, Zeit).
Jeder im Hypercube auftretende Wert der Kennzahl ist jeder Dimension eindeutig zugeordnet (z.B. Umsatz: € 63,92; Produkt: Software-Paket A; Filiale: München-Süd; Tag: 2002-07-16). Dimensionen können hierarchisch aggregiert sein. Zum Beispiel stellt Tag-Monat-Jahr eine zulässige Dimensionshierarchie dar. Tag-Kalenderwoche-Monat ist
hingegen nicht zulässig, da eine Kalenderwoche in zwei Monate fallen kann und damit eine hierarchische Aggregation nicht möglich ist.
Wann kann ein bzw. müssen mehrere Hypercubes verwendet werden?
Im Allgemeinen sind mehrere Kennzahlen entscheidungsrelevant. Besitzen diese Kennzahlen identische Dimensionen, so können die zugehörigen Werte gemeinsam in einem Hypercube verwaltet werden.
Unterscheiden sich die Dimensionen, so müssen mehrere Hypercubes aufgebaut werden.
Welche Meta-Ebenen gibt es beim Multidimensionales Datenmodell?
Metaebene 2: Metamodell des multidimensionalen Datenmodells
Metaebene 1: Multidimensionales Datenschema
Metaebene 0: Multidimensionale Datenstruktur
Was umfasst das Metamodell des multidimensionalen Datenmodells?
Das Metamodell des multidimensionalen Datenmodells (Metaebene 2) umfasst die Meta-Objekttypen Kennzahl sowie Dimension, Attribut und Dimensionshierarchie.
Was umfasst das Multidimensionales Datenschema?
Das multidimensionale Datenschema (Metaebene 1) umfasst die Kennzahl sowie Dimensionen mit ihren zugehörigen Attributen und Dimensionshierarchien. z.B. Umsatz und Geographie_: Filiale -> Ort -> Land
Was umfasst die Multidimensionale Datenstruktur?
Die multidimensionale Datenstruktur (Metaebene 0) enthält die Ausprägungen der Kennzahl Umsatz (Umsatzwerte) sowie die Ausprägungen der einzelnen Attribute.
Wie erfolgt die Standardisierung von Metamodellen für multidimensionale Datenstrukturen?
Die Standardisierung von Metamodellen für multidimensionale Datenstrukturen wird u.a. von der OMG (Object Management Group) im Rahmen des CWM (Common Warehouse Metamodel) betrieben (siehe www.omg.org).
Was machen die Operatoren: Drill Down und Roll Up?
Die Operatoren Drill Down und Roll Up dienen zum Navigieren innerhalb einer Dimensionshierarchie.
Drill Down navigiert eine Ebene nach unten (z.B. von Umsätzen je
Produktkategorie zu Umsätzen je Produkthauptgruppe oder von Monatsumsätzen zu Tagesumsätzen). Roll Up navigiert umgekehrt eine Ebene nach oben.
Was ist die Aggregationsstufe Gesamt?
Befindet man sich bezüglich aller Dimensionshierarchien auf der Aggregationsstufe Gesamt, so erscheint der Hypercube in Form eines einzigen Wertes einer Kennzahl.
Durch Navigation entlang der Dimensionshierarchien nach unten (rot gekennzeichnet) wird der Hypercube schrittweise disaggregiert bis hin zu den elementaren Kennzahlwerten.
Sind alle Attribute aggregierbar?
Es sei darauf hingewiesen, dass nicht alle Kennzahlen aggregierbar sind bzw. ihre Aggregation sinnvoll interpretiert werden kann.
Zum Beispiel ist das Attribut Semester eines Data-Warehouse zur Studentenverwaltung nicht sinnvoll aggregierbar. Eine
Summenbildung der Studierendenzahlen über mehrere Semester hinweg liefert keinen interpretierbaren Wert, da z.B. die Mehrzahl der im Wintersemester 2008/09 eingeschriebenen Studierenden auch im Sommersemester 2009 eingeschrieben ist und somit Studierende mehrfach erfasst würden.
Was machen die Operatoren Selection und die Spezialisierungen Slice und Dice?
Die hier dargestellten Operatoren dienen der Selektion von Daten aus einem Hypercube.
Der Operator Selection ermöglicht eine Auswahl von Kennzahlwerten oder Attributen anhand vorgegebener Kriterien (z.B. finde die drei Produktgruppen mit den höchsten Monatsumsätzen im Jahr 2008; finde die Filiale mit dem höchsten Tagesumsatz im Monat 07/2008).
Slice und Dice stellen Spezialisierungen des Operators Selection dar.
Slice ermöglicht das „Herausschneiden einer Scheibe“ aus dem Hypercube (z.B. alle Umsätze in den Dimensionen Geographie und Zeit für das Produkt „Softwarepaket A“). Das Anfrageergebnis weist dabei eine gegenüber dem Hypercube um eins reduzierte Anzahl
an Dimensionen auf (z.B. wird aus einem dreidimensionalen Würfel eine zweidimensionale Tabelle selektiert).
Der Operator Dice selektiert einen Teilwürfel des Hypercube; die
Anzahl der Dimensionen bleibt dabei unverändert (z.B. Umsätze aller deutschen Filialen im Jahre 2002 in einer bestimmten Produktkategorie
Was macht der Operator Rotate?
Der Operator Rotate dreht den Hypercube durch Vertauschen von zwei Dimensionen (z.B. Vertauschen der Dimensionen Zeit und Produkt). Dadurch ergibt sich eine veränderte Sicht auf die Datenstruktur, die quantitativen Daten selbst bleiben dabei unverändert. Der Operator ist insbesondere bei der Gestaltung der Anordnung von Werten in Kreuztabellen nützlich.
Welche Operatoren gibt es?
Drill Down
Roll Up
Selection
Slice
Dice
Rotate
Welche Realisierungsformen des multidimensionalen DM gibt es?
MOLAP: Multidimensionales OLAP
ROLAP: Relationales OLAP
HOLAP: Hybrides OLAP