Prüfungsfragen Flashcards

1
Q
  1. Definieren Sie den Begriff „Business Intelligence“ wie in der Vorlesung kennengelernt.
A
  • Business Intelligence ist ein integrierter, unternehmensspezifischer, IT-basierter Gesamtansatz zur betrieblichen Entscheidungsunterstützung.
  • Gesamtheit aller Werkzeuge und Anwendungen mit entscheidungsunterstützendem Charakter, die zur besseren Einsicht in das eigene Geschäft verhilft.
  • Begriffliche Klammer, die eine Vielzahl unterschiedlicher Ansätze zur Analyse geschäftsrelevanter Daten zu bündeln versucht (kein neues Produkt)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q
  1. Definieren Sie den Begriff „Big Data“ anhand der 4 “Vs” Vorlesung kennengelernt.
A

verfolgt das Ziel, qualitative und unterschiedlich struktierte Daten zu verbinden und in ein Geschäftsnutzen zu verwandeln
- lässt sich anhand der “3-Vs” beschreiben
- aus Sicht der Wirtschaftsinformatik kommt Value dazu
o Volume - Datenmengen (z.B. Zettabye)
o Velocity – Geschwindigkeit
o Variety - Datenvielfallt (z.B. Strukturierte Daten - ERP-System; Unstrukturierte Daten - Facebook/Sensoren; Semi-Strukturierte Daten - E-Mail)
o Value - Gewinn/Nutzen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q
  1. Welche Bereiche Spielen in Business Intelligence Zentrale Rollen?
A
  • Reporting
  • Analytics
  • Data Mining
  • OLAP
  • Big Data
  • Unternehmenssteuerung
  • Data Warehousing
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q
  1. Der sogenannte „Schwanzlutscher“ Gluchowsky hat komische Sichten auf BI, nennen und erklären Sie 3 Verständnisse der BI
A
  • Enges BI-Verständnis Kernapplikationen die Entscheidungsfindung unterstützen (OLAP, MIS)
  • Analyseorientiertes BI-Verständnis Alle Anwendungen mit denen der Entscheider im System arbeitet (CRM)
  • Weites BI-Verständnis Alle Anwendungen die direkt und indirekt mit Entscheidungsunterstützung arbeiten (Anw. Zur Datenauswertung, -präsentation, - aufbereitung und -speicherung
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q
  1. Risiken von BI
A
  • Datenkraken
  • Datenschutz
  • gläserner Mensch
  • Konflikt zwischen technisch möglich und Ethnischer Sicht
  • Kommerzieller Nutzen der Daten
  • Qualität der Analysemethoden bzw. Datenbasis
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q
  1. 4 Zukünftige Herausforderung und Trends im Kontext mit BI
A

Big Data: Große Datenmengen, Geschwindigkeit der Daten, hoher Informationsgehalt - dimensionalisierung = Digitalisierung des Alltags
Datenheterogenität: Daten aus Externen (z.B. Facebook)
Erfassungs-, Mess-, Veränderungsgeschwindigkeit der Daten
Mobile BI: Zugriff auf mobile Endgeräte
Predictive Analysis: Prognose von Zukunftswerten
Self BI: User holen sich aufbereittete Daten aus DB
In-Memory: Speichertechnologie, Daten befinden sich direkt im Speicher, Enorme Aufbereitung und Ausgabe Geschwindigkeit
BI as a Service: Cloud basierte BI Lösung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q
  1. Welche der folgenden Systeme sind Ihrer Ansicht nach üblicherweise keine BI-Anwendungssysteme?
A

Siehe B2PBIF Aufgabe 7

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q
  1. Definition von Data Warehouse
A

für Analysezwecke Optimierte Datenbank, die Daten aus mehreren i.a. heterogenen Quellen zusammenführt und verdichtet (Integration und Transformation)
Umfasst:
- den GP, der Datenbeschaffung aus internen und externen zugänglichen Quellen
- die Datentransformation und -aufbereitung gemäß der Quell- und Zieldatenbankschemata
- die Datenqualitätssicherung und die Speicherung im (zentralen) DW bzw. (dezentralen) Data Marts benutzersichten)
- die auf OLAP basierende Datenanalyse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q
  1. William H. Inmon stellt in seiner Data-Warehouse-Definition vier Merkmale in den Mittelpunkt. Nennen und beschreiben Sie jedes Merkmal.
A
  1. Themenorientierung (subject-oriented):
    - Zweck nicht Erfüllung dedizierter Aufgabe, sondern Unterstützung übergreifender Auswertungsmöglichkeiten aus verschiedenen Perspektiven.
    - Alle Daten - unternehmensweit - über ein Subjekt (z.B Kunde) und nicht “versteckt” in versch. Anewendungen
  2. Integrierte Datenbasis (integrated):
    - Daten aus mehreren versch. Datenquellen
    - Vereinheitlichung der Daten aus den operativen Systemen
    - Benennung, Skalierung und Kodierung
  3. Historische Daten (time-variant):
    - Vergleich der Daten über Zeit möglich (Zeitreihenanalyse)
    - Speicherung über längeren Zeitraum
    - Bereitstellung von Zeitreihendaten über längere Zeiträume
  4. Nicht-flüchtige Datenbasis (non-volatile):
    - Daten im DW werden i.a. nicht mehr geändert
    - Stabile, persistente Datenbasis
    - Bereitstellung von Zeitreihendaten über längere Zeiträume
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q
  1. 4 Vorteile eines Zentralen Data Warehouse im Gegensatz zu reinen Data Marts
A
  • integrierte Sichtweise auf das Gesamtunternehmen
  • zentrale Datenverwaltung
  • geringere Datenredundanz
  • kein Transformations- bzw. Implementierungsaufwand
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q
  1. Beschreiben Sie die in der Veranstaltung vorgestellte Architektur eines Data Warehouse-Systems mit seinen relevanten Schichten und Komponenten. Gehen Sie dabei auf die einzelnen Schichten und Komponenten detailliert ein. Verdeutlichen Sie Ihre Antwort darüber hinaus durch eine geeignete Abbildung.
A

Siehe B2PBIF Aufgabe 11

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q
  1. Nennen Sie jeweils zwei unterschiedliche Beispiele für Fälle, in denen die folgenden Arten von Bereinigungsaktivitäten notwendig sind.
A
  • Automatische Erkennung und Korrektur:
    Komma durch Punkt ersetzen, “€” durch “EUR” ersetzen, Umformatierung von Datumsangaben
  • Automatisierbare Erkennung und manuelle Korrektur:
    Unzulässige Zeichen, Ausreisen in Daten, unübliche Altersangabe oder Umsatzauswertung
  • Manuelle Erkennung und Korrektur:
    Tippfehler, Manipulation (bewusste Falscheingabe)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q
  1. Erörtern Sie die Unterschiede zwischen operativen und dispositiven Daten. Verdeutlichen Sie Ihre Ausführungen anhand von selbst gewählten Beispielen?
A
•	Operative Daten: 
stammen meist nur aus einer Datenquelle
nur aktuelle Daten
häufige Aktualisierung
Zugriff auf einzelne Datensätze
z.B. Umsatz von Kunde X am 12.2.2010 in der Filiale Hamburg. 

• Dispositive Daten:
sind aus mehreren Datenquellen aggregiert
sowohl aktuelle, als auch historische Daten
große Datenmengen
Zugriff auf gruppierte Daten
z.B. Umsatz aller Filialen in Bayern im Monat März

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q
  1. Was wird bei der Modellierung multidimensionaler Datenräume unter einem Star-Schema verstanden? Beschreiben Sie das Star-Schema anhand seiner wesentlichen Charakteristika. Wie könnte eine Beispielabfrage auf ein Star Schema lauten?
A

Welcher Umsatz wurde im Januar 2020 in der Region West mit dem Produkt 320 bei dem Kundentyp Geschäftskunden erzielt?

  • Fakten sind betriebswirtschaftliche Kennzahlen und repräsentieren monetäre Werte oder Mengen Bsp.: Umsatz, Absatz, Einzelkosten, Personalbestand etc.
  • Dimensionen sind deskriptiv und ermöglichen eine Gruppierung der Fakten zur Analyse Bsp.: Tage, Produkte, Kunden etc.
  • Hierarchisierungen ermöglichen die Betrachtung unterschiedlicher Konsolidierungsstufen der Fakten Bsp.: Filiale > Region > Land > Gesamt
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q
  1. Beschreiben Sie das in der Vorlesung kennengelernte FASMI-Prinzip.
A
  • Fast: stabile, schnelle Antwortzeiten
  • Analysis: Beherrschung beliebiger Businesslogik und statistischer Analysen wie “What-If”- & “How to achieve”- Betrachtungen
  • Shared: Mehrbenutzerbetrieb, implementiert Sicherheitsanforderungen für Datenschutz
  • Multidimensional: Unterstützung multidimensionaler konzeptioneller Sichten auf Daten, ermöglicht Hierarchien
  • Information: Zugriff auf alle benötigten Daten und abgeleitete Informationen, Verarbeitung großer Datenvolumina
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q
  1. Beschreiben Sie das in der Vorlesung kennengelernte HICHERT-Regeln
A
SAY: Botschaften klar vermitteln
UNIFY: Bedeutung vereinheitlichen
CONDENSE: Information verdichten
CHECK: Qualität sicherstellen
ENABLE: Konzept verwirklichen
SIMPLIFY: Rausche. Redundanz und Details weglassen
STRUCTURE: Inhalt richtig gliedern
17
Q
  1. Was wird unter den Begriffen „OLTP“ und „OLAP“ verstanden? Grenzen Sie die beiden Konzepte in Bezug auf Anfragen ab
A

OnLine Transaction Processing:
• transaktionale Prozesse mit operativen Daten
• klassische operative Informationssysteme
• Erfassung und Verwaltung von Daten
• kurze Schreib- und Lesezugriffe auf wenige Daten

OnLine Analytical Processing:
• Analyse im Mittelpunkt
• lange Lesetransaktionen auf viele Datensätze
• Integration, Aggregation und Konsolidierung von Daten

18
Q
  1. Nennen Sie sechs Operatoren zur Navigation in multidimensionalen Datenstrukturen multidimensionaler Datenmodelle. (DW denkt in Würfeln)
A

Pivoting - Rotieren des Datenwürfels durch Drehen oder Kippen (Perspektivwechsel)

  • Slicing - Ausschnitt im 2D Raum (nur eine Dimension für z. B. alle Produkte zum Zeitpunkt)
  • Dicing - Verkleinerter ausschnitt Würfel des gesamten Würfels (aus allen Dimensionen)
  • Drill Down - von Grob nach Fein (Produktgruppe -> Produkt)
  • Roll Up - von Fein nach Grob (Produkt -> Produktgruppe -> Produkte Gesamt)
  • Drill-Across - von einem Würfel zum anderen
19
Q
  1. Beschreiben Sie den Knowledge Discovery in Databases Prozess. Unterstützen Sie Ihre Erläuterungen durch eine grafische Darstellung des Prozesses. Gehen Sie auf die einzelnen Schritte im Detail ein.
A
  1. Selektion:
    • Auswahl der für die Fragestellung relevanten Daten
  2. Vorverarbeitung:
    • Beseitigung von Datenqualitätsproblemen
    • z.B. Missing Values und Imputation, Dubletten, Outliers, fehlerhaft Werte
  3. Transformation:
    • Daten werden in einen für das Datamining-Verfahren geeigneten Datentyp umgewandelt
  4. ML: / Datamining:
    • ML: / Datamining wird auf Daten angewandt (Mustererkennung)
    • Ergebnis: Modell mit Mustern, Auffälligkeiten, Abhängigkeiten etc.
  5. Interpretation und Evaluation
    • Modell und Einsetzbarkeit des Modells werden bewertet
    • Aufbereitung der Ergebnisse für die Entscheidungsfindung

Zeichnung B2PBIF Aufgabe 19

20
Q
  1. Definieren Sie Data Warehouse Architektur.
A

Als DW Architektur wird der planvolle, fachkonzeptionelle Strukturentwurf des Data Warehouse Systems und dessen Einbettung in sein reales Umfeld bezeichnet.

21
Q
  1. Was ist ein Star Schema? + / - nennen
A

Relationale Speicherung

  • Faktentabelle bildet Zentrum des Star-Schemas und enthält die Detail-Daten mit analysiernden Kennzahlen
  • 1 Dimensionstabelle pro Dimension, die nur mit Faktentabelle verknüpft ist (-> sternförmige Anordnung der Tabellen)

+ Einfache Datenmodelle -> intuitiv
+ Geringe Anzahl von Join-Operationen
+ Geringe Anzahl physischer DW-Tabellen
+ Geringer Aufwand im Rahmen der DW-Wartung
- Bei sehr großen Dimensionstabellen hohe Antwortzeit
- Redundanz innerhalb der Dimensionstabellen durch das mehrfache Verwenden identischer Fakten

22
Q
  1. Welche Vor- und Nachteile hat das Snowflake Schema?
A

+ Beseitigung der Redundanzen in den Dimensionstabellen
+ -> Beseitigung verbundenen Probleme wie z. B. Update-Anomalien
+ Ist in der 3. Normalform
- Für eine Abfrage sind mehrere Joins notwendig
- Größere Anzahl der Joint-Operationen die die abhängigen Dimensionstabellen verbinden müssen

23
Q
  1. Zeichnen und erläutern Sie den ETL Prozess (Welche Schritte werden im Rahmen der Transformation von operativen in dispositive Daten notwendig. Nennen und beschreiben Sie die einzelnen Schritte)
A

-Extraktion

-Transformation
– Filterung
o Auswahl der geeigneten Datenbestände
o Bereinigung von syntaktischen und semantischen Mängeln
– Harmonisierung
o Integration der Teilschemata der Datenquellen zum Data-Warehouse-Schema
o Abstimmung von Kodierungen, Synonymen und Homonymen
– Aggregation
o Bildung von Hierarchien und daraus resultierenden Aggregationen
o Beispielhierarchie: Produkt – Produktgruppe - Gesamt
–Anreicherung
o Berechnung von betriebswirtschaftlichen Kennzahlen
-Laden

Zeichnung Siehe B2PBIF Aufgaeb 23

24
Q
  1. Erläutern Sie, warum BI nicht als Produkt käuflich, sondern unternehmensspezifisch individuell zu implementieren ist. Nennen Sie ein Beispiel.
A

Veraltete Einzelsysteme reichen nicht mehr aus, um die gesamten Informationen, die in einem Unternehmen generiert werden, adäquat zu speichern, analysieren und zu verteilen -> Integrierte und unternehmensspezifische Gesamtansatz notwendig!

25
Q
  1. Zeigen Sie die physikalische Umsetzung von R-OLAP, M-OLAP und H-OLAP + Vor und Nachteile
A

Siehe B2PBIF Aufgabe 25

26
Q
  1. Zeichnen Sie das Du-Pont Schema
A

Siehe B2PBIF Aufgabe 26

27
Q
  1. Perspektiven nach Kaplan / Norton (BSC) je Ziel und Kennzahl, Situation aus Fallbeispiel erfolgversprechend? Begründung?
A

Siehe B2PBIF Aufgabe 27

28
Q
  1. Zwei Elemente von multidimensionalen Datenstrukturen nennen.
A

Fakten, Dimensionen

29
Q
  1. Erklären Sie die Datenqualität nach Hinrichs
A

Glaubwürdigkeit

  • Korrektheit
  • Zuverlässigkeit
  • Konsistenz

Interpretierbarkeit

  • Einheitlichkeit
  • Eindeutigkeit
  • Verständlichkeit

Nützlichkeit

  • Vollständigkeit
  • Genauigkeit
  • Zeitnähe
  • Redundanzfreiheit
  • Relevanz

Schlüsselintegrität

  • Schlüsseleindeutigkeit
  • Referentielle Integrität
30
Q
  1. Welche Architekturen haben wir in der Vorlesung kennen gelernt, zeichnen Sie diese, nutzen Sie diese mächtigen Grafiken
A

Siehe B2PBIF Aufgabe 30

31
Q
  1. Was ist ein Data Warehouse – In Memory, nennen Sie die Merkmale dieser
A

Sind DBMS, die im Gegensatz zu herkömmlichen DBMS nicht Festplattenlaufwerke, sondern den Arbeitsspeicher zur Datenspeicherung nutzen.

Merkmale:

  • Daten werden in den Arbeitsspeicher geladen
  • Lange Zugriffszeiten klassischer Massenspeicher (z.B. Festplatten) entfallen
  • Auswertung können innerhalb Sekunden oder gar Sekundenbruchteilen erstellt werden
32
Q
  1. Es sind 8 Probleme bei der Transformation gegeben. Diese den Fehlerarten zuordnen.
A

Siehe B2PBIF Aufgabe 32

33
Q
  1. Nennen und beschreiben Sie die 3 schwerwiegenden Probleme, die bei einem direkten Zugriff Management unterstützender Anwendungen auf die Datenbestände operativer Transaktionssysteme auftreten können. Unterstützten Sie ihre Beschreibung durch passende Beispiele.
A

KP

34
Q
  1. Nennen Sie 4 unterschiedliche Berichtsmethoden
A
  • Ist-Ist-Vergleiche
  • Plan-Plan-Vergleiche
  • Benchmarks
  • Plan-Ist-Vergleiche
35
Q
  1. Nennen und beschreiben Sie 4 Data-Mining Anwendungen und geben Sie ein Beispiel
A
  • Kundensegmentierung für Marketing
    o Gruppierung von Kunden mit ähnlichen Kaufverhalten
  • Warenkorbanalyse
    o Produkt-Platzierung im Supermarkt, Preisoptimierung
  • Bestimmung der Kreditwürdigkeit von Kunden
    o Elektronische Vergabe von Kreditkarten
  • Text Mining
    o Inhaltliche Gruppierung von Dokumenten