1. Definieren Sie den Begriff „Business Intelligence“ wie in der Vorlesung kennengelernt.

- Business Intelligence ist ein integrierter, unternehmensspezifischer, IT-basierter Gesamtansatz zur betrieblichen Entscheidungsunterstützung. - Gesamtheit aller Werkzeuge und Anwendungen mit entscheidungsunterstützendem Charakter, die zur besseren Einsicht in das eigene Geschäft verhilft. - Begriffliche Klammer, die eine Vielzahl unterschiedlicher Ansätze zur Analyse geschäftsrelevanter Daten zu bündeln versucht (kein neues Produkt)

3. Welche Bereiche Spielen in Business Intelligence Zentrale Rollen?

- Reporting - Analytics - Data Mining - OLAP - Big Data - Unternehmenssteuerung - Data Warehousing

4. Der sogenannte „Schwanzlutscher“ Gluchowsky hat komische Sichten auf BI, nennen und erklären Sie 3 Verständnisse der BI

- Enges BI-Verständnis Kernapplikationen die Entscheidungsfindung unterstützen (OLAP, MIS) - Analyseorientiertes BI-Verständnis Alle Anwendungen mit denen der Entscheider im System arbeitet (CRM) - Weites BI-Verständnis Alle Anwendungen die direkt und indirekt mit Entscheidungsunterstützung arbeiten (Anw. Zur Datenauswertung, -präsentation, - aufbereitung und -speicherung

- Datenkraken - Datenschutz - gläserner Mensch - Konflikt zwischen technisch möglich und Ethnischer Sicht - Kommerzieller Nutzen der Daten - Qualität der Analysemethoden bzw. Datenbasis

9. William H. Inmon stellt in seiner Data-Warehouse-Definition vier Merkmale in den Mittelpunkt. Nennen und beschreiben Sie jedes Merkmal.

1. Themenorientierung (subject-oriented): - Zweck nicht Erfüllung dedizierter Aufgabe, sondern Unterstützung übergreifender Auswertungsmöglichkeiten aus verschiedenen Perspektiven. - Alle Daten - unternehmensweit - über ein Subjekt (z.B Kunde) und nicht "versteckt" in versch. Anewendungen 2. Integrierte Datenbasis (integrated): - Daten aus mehreren versch. Datenquellen - Vereinheitlichung der Daten aus den operativen Systemen - Benennung, Skalierung und Kodierung 3. Historische Daten (time-variant): - Vergleich der Daten über Zeit möglich (Zeitreihenanalyse) - Speicherung über längeren Zeitraum - Bereitstellung von Zeitreihendaten über längere Zeiträume 4. Nicht-flüchtige Datenbasis (non-volatile): - Daten im DW werden i.a. nicht mehr geändert - Stabile, persistente Datenbasis - Bereitstellung von Zeitreihendaten über längere Zeiträume

10. 4 Vorteile eines Zentralen Data Warehouse im Gegensatz zu reinen Data Marts

integrierte Sichtweise auf das Gesamtunternehmen zentrale Datenverwaltung geringere Datenredundanz kein Transformations- bzw. Implementierungsaufwand

12. Nennen Sie jeweils zwei unterschiedliche Beispiele für Fälle, in denen die folgenden Arten von Bereinigungsaktivitäten notwendig sind.

- Automatische Erkennung und Korrektur: Komma durch Punkt ersetzen, "€" durch "EUR" ersetzen, Umformatierung von Datumsangaben - Automatisierbare Erkennung und manuelle Korrektur: Unzulässige Zeichen, Ausreisen in Daten, unübliche Altersangabe oder Umsatzauswertung - Manuelle Erkennung und Korrektur: Tippfehler, Manipulation (bewusste Falscheingabe)

14. Was wird bei der Modellierung multidimensionaler Datenräume unter einem Star-Schema verstanden? Beschreiben Sie das Star-Schema anhand seiner wesentlichen Charakteristika. Wie könnte eine Beispielabfrage auf ein Star Schema lauten?

Welcher Umsatz wurde im Januar 2020 in der Region West mit dem Produkt 320 bei dem Kundentyp Geschäftskunden erzielt? - Fakten sind betriebswirtschaftliche Kennzahlen und repräsentieren monetäre Werte oder Mengen Bsp.: Umsatz, Absatz, Einzelkosten, Personalbestand etc. - Dimensionen sind deskriptiv und ermöglichen eine Gruppierung der Fakten zur Analyse Bsp.: Tage, Produkte, Kunden etc. - Hierarchisierungen ermöglichen die Betrachtung unterschiedlicher Konsolidierungsstufen der Fakten Bsp.: Filiale > Region > Land > Gesamt

15. Beschreiben Sie das in der Vorlesung kennengelernte FASMI-Prinzip.

Fast: stabile, schnelle Antwortzeiten Analysis: Beherrschung beliebiger Businesslogik und statistischer Analysen wie “What-If”- & “How to achieve”- Betrachtungen Shared: Mehrbenutzerbetrieb, implementiert Sicherheitsanforderungen für Datenschutz Multidimensional: Unterstützung multidimensionaler konzeptioneller Sichten auf Daten, ermöglicht Hierarchien Information: Zugriff auf alle benötigten Daten und abgeleitete Informationen, Verarbeitung großer Datenvolumina

Prüfungsfragen Flashcards by Niclas E

Definieren Sie den Begriff „Business Intelligence“ wie in der Vorlesung kennengelernt.

Business Intelligence ist ein integrierter, unternehmensspezifischer, IT-basierter Gesamtansatz zur betrieblichen Entscheidungsunterstützung.
Gesamtheit aller Werkzeuge und Anwendungen mit entscheidungsunterstützendem Charakter, die zur besseren Einsicht in das eigene Geschäft verhilft.
Begriffliche Klammer, die eine Vielzahl unterschiedlicher Ansätze zur Analyse geschäftsrelevanter Daten zu bündeln versucht (kein neues Produkt)

How well did you know this?

Not at all

Perfectly

Definieren Sie den Begriff „Big Data“ anhand der 4 “Vs” Vorlesung kennengelernt.

verfolgt das Ziel, qualitative und unterschiedlich struktierte Daten zu verbinden und in ein Geschäftsnutzen zu verwandeln
- lässt sich anhand der “3-Vs” beschreiben
- aus Sicht der Wirtschaftsinformatik kommt Value dazu
o Volume - Datenmengen (z.B. Zettabye)
o Velocity – Geschwindigkeit
o Variety - Datenvielfallt (z.B. Strukturierte Daten - ERP-System; Unstrukturierte Daten - Facebook/Sensoren; Semi-Strukturierte Daten - E-Mail)
o Value - Gewinn/Nutzen

How well did you know this?

Not at all

Perfectly

Welche Bereiche Spielen in Business Intelligence Zentrale Rollen?

Reporting
Analytics
Data Mining
OLAP
Big Data
Unternehmenssteuerung
Data Warehousing

How well did you know this?

Not at all

Perfectly

Der sogenannte „Schwanzlutscher“ Gluchowsky hat komische Sichten auf BI, nennen und erklären Sie 3 Verständnisse der BI

Enges BI-Verständnis Kernapplikationen die Entscheidungsfindung unterstützen (OLAP, MIS)
Analyseorientiertes BI-Verständnis Alle Anwendungen mit denen der Entscheider im System arbeitet (CRM)
Weites BI-Verständnis Alle Anwendungen die direkt und indirekt mit Entscheidungsunterstützung arbeiten (Anw. Zur Datenauswertung, -präsentation, - aufbereitung und -speicherung

How well did you know this?

Not at all

Perfectly

Risiken von BI

Datenkraken
Datenschutz
gläserner Mensch
Konflikt zwischen technisch möglich und Ethnischer Sicht
Kommerzieller Nutzen der Daten
Qualität der Analysemethoden bzw. Datenbasis

How well did you know this?

Not at all

Perfectly

4 Zukünftige Herausforderung und Trends im Kontext mit BI

Big Data: Große Datenmengen, Geschwindigkeit der Daten, hoher Informationsgehalt - dimensionalisierung = Digitalisierung des Alltags
Datenheterogenität: Daten aus Externen (z.B. Facebook)
Erfassungs-, Mess-, Veränderungsgeschwindigkeit der Daten
Mobile BI: Zugriff auf mobile Endgeräte
Predictive Analysis: Prognose von Zukunftswerten
Self BI: User holen sich aufbereittete Daten aus DB
In-Memory: Speichertechnologie, Daten befinden sich direkt im Speicher, Enorme Aufbereitung und Ausgabe Geschwindigkeit
BI as a Service: Cloud basierte BI Lösung

How well did you know this?

Not at all

Perfectly

Welche der folgenden Systeme sind Ihrer Ansicht nach üblicherweise keine BI-Anwendungssysteme?

Siehe B2PBIF Aufgabe 7

How well did you know this?

Not at all

Perfectly

Definition von Data Warehouse

für Analysezwecke Optimierte Datenbank, die Daten aus mehreren i.a. heterogenen Quellen zusammenführt und verdichtet (Integration und Transformation)
Umfasst:
- den GP, der Datenbeschaffung aus internen und externen zugänglichen Quellen
- die Datentransformation und -aufbereitung gemäß der Quell- und Zieldatenbankschemata
- die Datenqualitätssicherung und die Speicherung im (zentralen) DW bzw. (dezentralen) Data Marts benutzersichten)
- die auf OLAP basierende Datenanalyse

How well did you know this?

Not at all

Perfectly

William H. Inmon stellt in seiner Data-Warehouse-Definition vier Merkmale in den Mittelpunkt. Nennen und beschreiben Sie jedes Merkmal.

Themenorientierung (subject-oriented):
- Zweck nicht Erfüllung dedizierter Aufgabe, sondern Unterstützung übergreifender Auswertungsmöglichkeiten aus verschiedenen Perspektiven.
- Alle Daten - unternehmensweit - über ein Subjekt (z.B Kunde) und nicht “versteckt” in versch. Anewendungen
Integrierte Datenbasis (integrated):
- Daten aus mehreren versch. Datenquellen
- Vereinheitlichung der Daten aus den operativen Systemen
- Benennung, Skalierung und Kodierung
Historische Daten (time-variant):
- Vergleich der Daten über Zeit möglich (Zeitreihenanalyse)
- Speicherung über längeren Zeitraum
- Bereitstellung von Zeitreihendaten über längere Zeiträume
Nicht-flüchtige Datenbasis (non-volatile):
- Daten im DW werden i.a. nicht mehr geändert
- Stabile, persistente Datenbasis
- Bereitstellung von Zeitreihendaten über längere Zeiträume

How well did you know this?

Not at all

Perfectly

4 Vorteile eines Zentralen Data Warehouse im Gegensatz zu reinen Data Marts

integrierte Sichtweise auf das Gesamtunternehmen
zentrale Datenverwaltung
geringere Datenredundanz
kein Transformations- bzw. Implementierungsaufwand

How well did you know this?

Not at all

Perfectly

Beschreiben Sie die in der Veranstaltung vorgestellte Architektur eines Data Warehouse-Systems mit seinen relevanten Schichten und Komponenten. Gehen Sie dabei auf die einzelnen Schichten und Komponenten detailliert ein. Verdeutlichen Sie Ihre Antwort darüber hinaus durch eine geeignete Abbildung.

Siehe B2PBIF Aufgabe 11

How well did you know this?

Not at all

Perfectly

Nennen Sie jeweils zwei unterschiedliche Beispiele für Fälle, in denen die folgenden Arten von Bereinigungsaktivitäten notwendig sind.

Automatische Erkennung und Korrektur:
Komma durch Punkt ersetzen, “€” durch “EUR” ersetzen, Umformatierung von Datumsangaben
Automatisierbare Erkennung und manuelle Korrektur:
Unzulässige Zeichen, Ausreisen in Daten, unübliche Altersangabe oder Umsatzauswertung
Manuelle Erkennung und Korrektur:
Tippfehler, Manipulation (bewusste Falscheingabe)

How well did you know this?

Not at all

Perfectly

Erörtern Sie die Unterschiede zwischen operativen und dispositiven Daten. Verdeutlichen Sie Ihre Ausführungen anhand von selbst gewählten Beispielen?

•	Operative Daten: 
stammen meist nur aus einer Datenquelle
nur aktuelle Daten
häufige Aktualisierung
Zugriff auf einzelne Datensätze
z.B. Umsatz von Kunde X am 12.2.2010 in der Filiale Hamburg.

• Dispositive Daten:
sind aus mehreren Datenquellen aggregiert
sowohl aktuelle, als auch historische Daten
große Datenmengen
Zugriff auf gruppierte Daten
z.B. Umsatz aller Filialen in Bayern im Monat März

How well did you know this?

Not at all

Perfectly

Was wird bei der Modellierung multidimensionaler Datenräume unter einem Star-Schema verstanden? Beschreiben Sie das Star-Schema anhand seiner wesentlichen Charakteristika. Wie könnte eine Beispielabfrage auf ein Star Schema lauten?

Welcher Umsatz wurde im Januar 2020 in der Region West mit dem Produkt 320 bei dem Kundentyp Geschäftskunden erzielt?

Fakten sind betriebswirtschaftliche Kennzahlen und repräsentieren monetäre Werte oder Mengen Bsp.: Umsatz, Absatz, Einzelkosten, Personalbestand etc.
Dimensionen sind deskriptiv und ermöglichen eine Gruppierung der Fakten zur Analyse Bsp.: Tage, Produkte, Kunden etc.
Hierarchisierungen ermöglichen die Betrachtung unterschiedlicher Konsolidierungsstufen der Fakten Bsp.: Filiale > Region > Land > Gesamt

How well did you know this?

Not at all

Perfectly

Beschreiben Sie das in der Vorlesung kennengelernte FASMI-Prinzip.

Fast: stabile, schnelle Antwortzeiten
Analysis: Beherrschung beliebiger Businesslogik und statistischer Analysen wie “What-If”- & “How to achieve”- Betrachtungen
Shared: Mehrbenutzerbetrieb, implementiert Sicherheitsanforderungen für Datenschutz
Multidimensional: Unterstützung multidimensionaler konzeptioneller Sichten auf Daten, ermöglicht Hierarchien
Information: Zugriff auf alle benötigten Daten und abgeleitete Informationen, Verarbeitung großer Datenvolumina

How well did you know this?

Not at all

Perfectly

Beschreiben Sie das in der Vorlesung kennengelernte HICHERT-Regeln

SAY: Botschaften klar vermitteln
UNIFY: Bedeutung vereinheitlichen
CONDENSE: Information verdichten
CHECK: Qualität sicherstellen
ENABLE: Konzept verwirklichen
SIMPLIFY: Rausche. Redundanz und Details weglassen
STRUCTURE: Inhalt richtig gliedern

Was wird unter den Begriffen „OLTP“ und „OLAP“ verstanden? Grenzen Sie die beiden Konzepte in Bezug auf Anfragen ab

OnLine Transaction Processing:
• transaktionale Prozesse mit operativen Daten
• klassische operative Informationssysteme
• Erfassung und Verwaltung von Daten
• kurze Schreib- und Lesezugriffe auf wenige Daten

OnLine Analytical Processing:
• Analyse im Mittelpunkt
• lange Lesetransaktionen auf viele Datensätze
• Integration, Aggregation und Konsolidierung von Daten

Nennen Sie sechs Operatoren zur Navigation in multidimensionalen Datenstrukturen multidimensionaler Datenmodelle. (DW denkt in Würfeln)

Pivoting - Rotieren des Datenwürfels durch Drehen oder Kippen (Perspektivwechsel)

Slicing - Ausschnitt im 2D Raum (nur eine Dimension für z. B. alle Produkte zum Zeitpunkt)
Dicing - Verkleinerter ausschnitt Würfel des gesamten Würfels (aus allen Dimensionen)
Drill Down - von Grob nach Fein (Produktgruppe -> Produkt)
Roll Up - von Fein nach Grob (Produkt -> Produktgruppe -> Produkte Gesamt)
Drill-Across - von einem Würfel zum anderen

Beschreiben Sie den Knowledge Discovery in Databases Prozess. Unterstützen Sie Ihre Erläuterungen durch eine grafische Darstellung des Prozesses. Gehen Sie auf die einzelnen Schritte im Detail ein.

Selektion:
• Auswahl der für die Fragestellung relevanten Daten
Vorverarbeitung:
• Beseitigung von Datenqualitätsproblemen
• z.B. Missing Values und Imputation, Dubletten, Outliers, fehlerhaft Werte
Transformation:
• Daten werden in einen für das Datamining-Verfahren geeigneten Datentyp umgewandelt
ML: / Datamining:
• ML: / Datamining wird auf Daten angewandt (Mustererkennung)
• Ergebnis: Modell mit Mustern, Auffälligkeiten, Abhängigkeiten etc.
Interpretation und Evaluation
• Modell und Einsetzbarkeit des Modells werden bewertet
• Aufbereitung der Ergebnisse für die Entscheidungsfindung

Zeichnung B2PBIF Aufgabe 19

Definieren Sie Data Warehouse Architektur.

Als DW Architektur wird der planvolle, fachkonzeptionelle Strukturentwurf des Data Warehouse Systems und dessen Einbettung in sein reales Umfeld bezeichnet.

Was ist ein Star Schema? + / - nennen

Relationale Speicherung

Faktentabelle bildet Zentrum des Star-Schemas und enthält die Detail-Daten mit analysiernden Kennzahlen
1 Dimensionstabelle pro Dimension, die nur mit Faktentabelle verknüpft ist (-> sternförmige Anordnung der Tabellen)

+ Einfache Datenmodelle -> intuitiv
+ Geringe Anzahl von Join-Operationen
+ Geringe Anzahl physischer DW-Tabellen
+ Geringer Aufwand im Rahmen der DW-Wartung
- Bei sehr großen Dimensionstabellen hohe Antwortzeit
- Redundanz innerhalb der Dimensionstabellen durch das mehrfache Verwenden identischer Fakten

Welche Vor- und Nachteile hat das Snowflake Schema?

+ Beseitigung der Redundanzen in den Dimensionstabellen
+ -> Beseitigung verbundenen Probleme wie z. B. Update-Anomalien
+ Ist in der 3. Normalform
- Für eine Abfrage sind mehrere Joins notwendig
- Größere Anzahl der Joint-Operationen die die abhängigen Dimensionstabellen verbinden müssen

Zeichnen und erläutern Sie den ETL Prozess (Welche Schritte werden im Rahmen der Transformation von operativen in dispositive Daten notwendig. Nennen und beschreiben Sie die einzelnen Schritte)

-Extraktion

-Transformation
– Filterung
o Auswahl der geeigneten Datenbestände
o Bereinigung von syntaktischen und semantischen Mängeln
– Harmonisierung
o Integration der Teilschemata der Datenquellen zum Data-Warehouse-Schema
o Abstimmung von Kodierungen, Synonymen und Homonymen
– Aggregation
o Bildung von Hierarchien und daraus resultierenden Aggregationen
o Beispielhierarchie: Produkt – Produktgruppe - Gesamt
–Anreicherung
o Berechnung von betriebswirtschaftlichen Kennzahlen
-Laden

Zeichnung Siehe B2PBIF Aufgaeb 23

Erläutern Sie, warum BI nicht als Produkt käuflich, sondern unternehmensspezifisch individuell zu implementieren ist. Nennen Sie ein Beispiel.

Veraltete Einzelsysteme reichen nicht mehr aus, um die gesamten Informationen, die in einem Unternehmen generiert werden, adäquat zu speichern, analysieren und zu verteilen -> Integrierte und unternehmensspezifische Gesamtansatz notwendig!

25. Zeigen Sie die physikalische Umsetzung von R-OLAP, M-OLAP und H-OLAP + Vor und Nachteile

Siehe B2PBIF Aufgabe 25

26. Zeichnen Sie das Du-Pont Schema

Siehe B2PBIF Aufgabe 26

27. Perspektiven nach Kaplan / Norton (BSC) je Ziel und Kennzahl, Situation aus Fallbeispiel erfolgversprechend? Begründung?

Siehe B2PBIF Aufgabe 27

28. Zwei Elemente von multidimensionalen Datenstrukturen nennen.

Fakten, Dimensionen

29. Erklären Sie die Datenqualität nach Hinrichs

Glaubwürdigkeit - Korrektheit - Zuverlässigkeit - Konsistenz Interpretierbarkeit - Einheitlichkeit - Eindeutigkeit - Verständlichkeit Nützlichkeit - Vollständigkeit - Genauigkeit - Zeitnähe - Redundanzfreiheit - Relevanz Schlüsselintegrität - Schlüsseleindeutigkeit - Referentielle Integrität

30. Welche Architekturen haben wir in der Vorlesung kennen gelernt, zeichnen Sie diese, nutzen Sie diese mächtigen Grafiken

Siehe B2PBIF Aufgabe 30

31. Was ist ein Data Warehouse – In Memory, nennen Sie die Merkmale dieser

Sind DBMS, die im Gegensatz zu herkömmlichen DBMS nicht Festplattenlaufwerke, sondern den Arbeitsspeicher zur Datenspeicherung nutzen. Merkmale: - Daten werden in den Arbeitsspeicher geladen - Lange Zugriffszeiten klassischer Massenspeicher (z.B. Festplatten) entfallen - Auswertung können innerhalb Sekunden oder gar Sekundenbruchteilen erstellt werden

32. Es sind 8 Probleme bei der Transformation gegeben. Diese den Fehlerarten zuordnen.

Siehe B2PBIF Aufgabe 32

33. Nennen und beschreiben Sie die 3 schwerwiegenden Probleme, die bei einem direkten Zugriff Management unterstützender Anwendungen auf die Datenbestände operativer Transaktionssysteme auftreten können. Unterstützten Sie ihre Beschreibung durch passende Beispiele.

34. Nennen Sie 4 unterschiedliche Berichtsmethoden

- Ist-Ist-Vergleiche - Plan-Plan-Vergleiche - Benchmarks - Plan-Ist-Vergleiche

35. Nennen und beschreiben Sie 4 Data-Mining Anwendungen und geben Sie ein Beispiel

- Kundensegmentierung für Marketing o Gruppierung von Kunden mit ähnlichen Kaufverhalten - Warenkorbanalyse o Produkt-Platzierung im Supermarkt, Preisoptimierung - Bestimmung der Kreditwürdigkeit von Kunden o Elektronische Vergabe von Kreditkarten - Text Mining o Inhaltliche Gruppierung von Dokumenten