Klausurvorbereitung Flashcards
Was ist Big Data?
verfolgt das Ziel, qualitative und unterschiedlich struktierte Daten zu verbinden und in ein Geschäftsnutzen zu verwandeln
lässt sich anhand der “3-Vs” beschreiben
aus sicht der Wirtschaftsinformatik kommt Value dazu
Volume - Datenmengen (z.B. Zetabye)
Velocity - Geschwindigkeit
Vareity - Datenvielfallt (z.B. Strukturierte Daten - ERP-System; Unstrukturierte Daten - Facebook/Sensoren; Semi-Strukturierte Daten - E-Mail)
Value - Gewinn/Nutzen
Herrausforderungen sowie zukünftige Trends im Kontext zu BI
Big Data: Große Datenmengen, Geschwindigkeit der Daten, hoher Informationsgehalt - dimensionalisierung = Digitalisierung des Alltags
Datenheterogenität: Daten aus Externen (z.B. Facebook)
Erfassungs-, Mess-, Veränderungsgeschwindigkeit der Daten
Mobile BI: Zugriff auf mobile Endgeräte
Predictive Analysis: Prognose von Zukunftswerten
Self BI: User holen sich aufbereittete Daten aus DB
In-Memory: Speichertechnologie, Daten befinden sich direkt im Speicher, Enorme Aufbereitung und Ausgabe Geschwindigkeit
BI as a Service: Cloud basierte BI Lösung
Risiken im Kontext mit BI
Datenkraken
Datenschutz
Gläsener Mensch
Konflikt zwischen technisch möglich und Ethnischer Sicht
Kommerzieller Nutzen der Daten
Qualität der Analysemethoden bzw. Datenbasis
Was ist ein Data Warehouse?
für Analysezwecke Optimierte Datenbank, die Daten aus mehreren i.a. heterogenen Quellen zusammenführt und verdichtet (Integration und Transformation)
Umfasst:
den GP, der Datenbeschaffung aus internen und externen zugänglichen Quellen
die Datentransofrmation und -aufbereitung gemäß der Quell- und Zieldatenbankschemata
die Datenqualitätssicherung und die Speicherung im (zentralen) DW bzw. (dezentralen) Data Marts benutzersichten)
die auf OLAP basiernde Datenanalyse
Was ist eine Data Warehouse Architektur?
Als DW Architektur wird der planvolle, fachkonzeptionelle Strukturentwurf des Data Warehouse Systems und dessen Enbettung in sein reales Umfeld bezeichnet.
Data Warehouse Zeichnung
Siehe BP Datawarehouse Architektur
Star Schema Architektur Erklären inklusive Vor und Nachteile
Star Schema:
Relationale Speicherung
- Faktentabelle bildet Zentrum des Star-Schemas und enthält die Detail-Daten mit analysiernden Kennzahlen
- 1 Dimensionstabelle pro Dimension, die nur mit Faktentabelle verknüpft ist (-> sternförmige Anordnung der Tabellen)
+ Einfache Datenmodelle -> intuitiv
+ Geringe Anzahl von Join-Operationen
+ Geringe Anzahl physischer DW-Tabellen
+ Geringer Aufwand im Rahmen der DW-Wartung
- Bei sehr großen Dimensionstabellen hohe Antwortzeit
- Redundanz innerhalb der Dimensionstabellen durch das mehrfache Verwenden identischer Fakten
Snowflake Schema Zeichnen inklusive Vor und Nachteile
Siehe BP
+ Beseitigung der Redundanzen in den Dimensionstabellen
+ -> Beseitigung verbundenen Probleme wie z. B. UpdateAnomalien
+ Ist in der 3. Normalform
- Für eine Abfrage sind mehrere Joins notwendig
- Größere Anzahl der Joint-Operationen die die abhängigen Dimensionstabellen verbinden müssen
Was wird bei der Modellierung multidimensionaler Datenräume unter einem Star-Schema verstanden? Beschreiben Sie das Star-Schema anhand seiner wesentlichen Charakteristika. Wie könnte eine Beispielabfrage auf ein StarSchema lauten?
Welcher Umsatz wurde im Januar 2020 in der Region West mit dem Produkt 320 bei dem Kundentyp Geschäftskunden erzielt?
- Fakten sind betriebswirtschaftliche Kennzahlen und repräsentieren monetäre Werte oder Mengen Bsp.: Umsatz, Absatz, Einzelkosten, Personalbestand etc.
- Dimensionen sind deskriptiv und ermöglichen eine Gruppierung der Fakten zur Analyse Bsp.: Tage, Produkte, Kunden etc.
- Hierarchisierungen ermöglichen die Betrachtung unterschiedlicher Konsolidierungsstufen der Fakten Bsp.: Filiale > Region > Land > Gesamt
Beschreiben Sie das in der Vorlesung kennengelernte FASMI-Prinzip. (5 Punkte) FASMI = Fast Analysis of Shared Multidimensional Information
- Fast: stabile, schnelle Antwortzeiten
- Analysis: Beherrschung beliebiger Businesslogik und statistischer Analysen wie “What-If”- & “How to achieve”- Betrachtungen
- Shared: Mehrbenutzerbetrieb, implementiert Sicherheitsanforderungen für Datenschutz
- Multidimensional: Unterstützung multidimensionaler konzeptioneller Sichten auf Daten, ermöglicht Hierarchien
- Information: Zugriff auf alle benötigten Daten und abgeleitete Informationen, Verarbeitung großer Datenvolumina
Was wird unter den Begriffen „OLTP“ und „OLAP“ verstanden? Grenzen Sie die beiden Konzepte in Bezug auf Anfragen ab. (7 Punkte)
OnLine Transaction Processing:
• transaktionale Prozesse mit operativen Daten
• klassische operative Informationssysteme
• Erfassung und Verwaltung von Daten
• kurze Schreib- und Lesezugriffe auf wenige Daten
OnLine Analytical Processing:
• Analyse im Mittelpunkt
• lange Lesetransaktionen auf viele Datensätze
• Integration, Aggregation und Konsolidierung von Daten
Nennen Sie sechs Operatoren zur Navigation in multidimensionalen Datenstrukturen multidimensionaler Datenmodelle. (6 Punkte)
Pivoting, Slicing, Dicing, Drill Down, Roll Up, Split
ETL-Prozess + Zeichen
Siehe PB
-Extraktion
-Transformation
– Filterung
o Auswahl der geeigneten Datenbestände
o Bereinigung von syntaktischen und semantischen Mängeln
– Harmonisierung
o Integration der Teilschemata der Datenquellen zum Data-Warehouse-Schema
o Abstimmung von Kodierungen, Synonymen und Homonymen
– Aggregation
o Bildung von Hierarchien und daraus resultierenden Aggregationen
o Beispielhierarchie: Produkt – Produktgruppe - Gesamt
–Anreicherung
o Berechnung von betriebswirtschaftlichen Kennzahlen
-Laden
Erläutern Sie, warum BI nicht als Produkt käuflich, sondern unternehmensspezifisch individuell zu implementieren ist. Ein Beispiel (4P)
Veraltete Einzelsysteme reichen nicht mehr aus, um die gesamten Informationen, die in einem Unternehmen generiert werden, adäquat zu speichern, analysieren und zu verteilen -> Integrierte und unternehmensspezifische Gesamtansatz notwendig!
Was ist Pivoting
Rotation des Datenwürfels durch Drehen oder Kippen, um eine andere Perspektive auf die Daten zu ermöglichen