Prüfungsfragen Flashcards
- Definieren Sie den Begriff „Business Intelligence“ wie in der Vorlesung kennengelernt.
- Business Intelligence ist ein integrierter, unternehmensspezifischer, IT-basierter Gesamtansatz zur betrieblichen Entscheidungsunterstützung.
- Gesamtheit aller Werkzeuge und Anwendungen mit entscheidungsunterstützendem Charakter, die zur besseren Einsicht in das eigene Geschäft verhilft.
- Begriffliche Klammer, die eine Vielzahl unterschiedlicher Ansätze zur Analyse geschäftsrelevanter Daten zu bündeln versucht (kein neues Produkt)
- Definieren Sie den Begriff „Big Data“ anhand der 4 “Vs” Vorlesung kennengelernt.
verfolgt das Ziel, qualitative und unterschiedlich struktierte Daten zu verbinden und in ein Geschäftsnutzen zu verwandeln
- lässt sich anhand der “3-Vs” beschreiben
- aus Sicht der Wirtschaftsinformatik kommt Value dazu
o Volume - Datenmengen (z.B. Zettabye)
o Velocity – Geschwindigkeit
o Variety - Datenvielfallt (z.B. Strukturierte Daten - ERP-System; Unstrukturierte Daten - Facebook/Sensoren; Semi-Strukturierte Daten - E-Mail)
o Value - Gewinn/Nutzen
- Welche Bereiche Spielen in Business Intelligence Zentrale Rollen?
- Reporting
- Analytics
- Data Mining
- OLAP
- Big Data
- Unternehmenssteuerung
- Data Warehousing
- Der sogenannte „Schwanzlutscher“ Gluchowsky hat komische Sichten auf BI, nennen und erklären Sie 3 Verständnisse der BI
- Enges BI-Verständnis Kernapplikationen die Entscheidungsfindung unterstützen (OLAP, MIS)
- Analyseorientiertes BI-Verständnis Alle Anwendungen mit denen der Entscheider im System arbeitet (CRM)
- Weites BI-Verständnis Alle Anwendungen die direkt und indirekt mit Entscheidungsunterstützung arbeiten (Anw. Zur Datenauswertung, -präsentation, - aufbereitung und -speicherung
- Risiken von BI
- Datenkraken
- Datenschutz
- gläserner Mensch
- Konflikt zwischen technisch möglich und Ethnischer Sicht
- Kommerzieller Nutzen der Daten
- Qualität der Analysemethoden bzw. Datenbasis
- 4 Zukünftige Herausforderung und Trends im Kontext mit BI
Big Data: Große Datenmengen, Geschwindigkeit der Daten, hoher Informationsgehalt - dimensionalisierung = Digitalisierung des Alltags
Datenheterogenität: Daten aus Externen (z.B. Facebook)
Erfassungs-, Mess-, Veränderungsgeschwindigkeit der Daten
Mobile BI: Zugriff auf mobile Endgeräte
Predictive Analysis: Prognose von Zukunftswerten
Self BI: User holen sich aufbereittete Daten aus DB
In-Memory: Speichertechnologie, Daten befinden sich direkt im Speicher, Enorme Aufbereitung und Ausgabe Geschwindigkeit
BI as a Service: Cloud basierte BI Lösung
- Welche der folgenden Systeme sind Ihrer Ansicht nach üblicherweise keine BI-Anwendungssysteme?
Siehe B2PBIF Aufgabe 7
- Definition von Data Warehouse
für Analysezwecke Optimierte Datenbank, die Daten aus mehreren i.a. heterogenen Quellen zusammenführt und verdichtet (Integration und Transformation)
Umfasst:
- den GP, der Datenbeschaffung aus internen und externen zugänglichen Quellen
- die Datentransformation und -aufbereitung gemäß der Quell- und Zieldatenbankschemata
- die Datenqualitätssicherung und die Speicherung im (zentralen) DW bzw. (dezentralen) Data Marts benutzersichten)
- die auf OLAP basierende Datenanalyse
- William H. Inmon stellt in seiner Data-Warehouse-Definition vier Merkmale in den Mittelpunkt. Nennen und beschreiben Sie jedes Merkmal.
- Themenorientierung (subject-oriented):
- Zweck nicht Erfüllung dedizierter Aufgabe, sondern Unterstützung übergreifender Auswertungsmöglichkeiten aus verschiedenen Perspektiven.
- Alle Daten - unternehmensweit - über ein Subjekt (z.B Kunde) und nicht “versteckt” in versch. Anewendungen - Integrierte Datenbasis (integrated):
- Daten aus mehreren versch. Datenquellen
- Vereinheitlichung der Daten aus den operativen Systemen
- Benennung, Skalierung und Kodierung - Historische Daten (time-variant):
- Vergleich der Daten über Zeit möglich (Zeitreihenanalyse)
- Speicherung über längeren Zeitraum
- Bereitstellung von Zeitreihendaten über längere Zeiträume - Nicht-flüchtige Datenbasis (non-volatile):
- Daten im DW werden i.a. nicht mehr geändert
- Stabile, persistente Datenbasis
- Bereitstellung von Zeitreihendaten über längere Zeiträume
- 4 Vorteile eines Zentralen Data Warehouse im Gegensatz zu reinen Data Marts
- integrierte Sichtweise auf das Gesamtunternehmen
- zentrale Datenverwaltung
- geringere Datenredundanz
- kein Transformations- bzw. Implementierungsaufwand
- Beschreiben Sie die in der Veranstaltung vorgestellte Architektur eines Data Warehouse-Systems mit seinen relevanten Schichten und Komponenten. Gehen Sie dabei auf die einzelnen Schichten und Komponenten detailliert ein. Verdeutlichen Sie Ihre Antwort darüber hinaus durch eine geeignete Abbildung.
Siehe B2PBIF Aufgabe 11
- Nennen Sie jeweils zwei unterschiedliche Beispiele für Fälle, in denen die folgenden Arten von Bereinigungsaktivitäten notwendig sind.
- Automatische Erkennung und Korrektur:
Komma durch Punkt ersetzen, “€” durch “EUR” ersetzen, Umformatierung von Datumsangaben - Automatisierbare Erkennung und manuelle Korrektur:
Unzulässige Zeichen, Ausreisen in Daten, unübliche Altersangabe oder Umsatzauswertung - Manuelle Erkennung und Korrektur:
Tippfehler, Manipulation (bewusste Falscheingabe)
- Erörtern Sie die Unterschiede zwischen operativen und dispositiven Daten. Verdeutlichen Sie Ihre Ausführungen anhand von selbst gewählten Beispielen?
• Operative Daten: stammen meist nur aus einer Datenquelle nur aktuelle Daten häufige Aktualisierung Zugriff auf einzelne Datensätze z.B. Umsatz von Kunde X am 12.2.2010 in der Filiale Hamburg.
• Dispositive Daten:
sind aus mehreren Datenquellen aggregiert
sowohl aktuelle, als auch historische Daten
große Datenmengen
Zugriff auf gruppierte Daten
z.B. Umsatz aller Filialen in Bayern im Monat März
- Was wird bei der Modellierung multidimensionaler Datenräume unter einem Star-Schema verstanden? Beschreiben Sie das Star-Schema anhand seiner wesentlichen Charakteristika. Wie könnte eine Beispielabfrage auf ein Star Schema lauten?
Welcher Umsatz wurde im Januar 2020 in der Region West mit dem Produkt 320 bei dem Kundentyp Geschäftskunden erzielt?
- Fakten sind betriebswirtschaftliche Kennzahlen und repräsentieren monetäre Werte oder Mengen Bsp.: Umsatz, Absatz, Einzelkosten, Personalbestand etc.
- Dimensionen sind deskriptiv und ermöglichen eine Gruppierung der Fakten zur Analyse Bsp.: Tage, Produkte, Kunden etc.
- Hierarchisierungen ermöglichen die Betrachtung unterschiedlicher Konsolidierungsstufen der Fakten Bsp.: Filiale > Region > Land > Gesamt
- Beschreiben Sie das in der Vorlesung kennengelernte FASMI-Prinzip.
- Fast: stabile, schnelle Antwortzeiten
- Analysis: Beherrschung beliebiger Businesslogik und statistischer Analysen wie “What-If”- & “How to achieve”- Betrachtungen
- Shared: Mehrbenutzerbetrieb, implementiert Sicherheitsanforderungen für Datenschutz
- Multidimensional: Unterstützung multidimensionaler konzeptioneller Sichten auf Daten, ermöglicht Hierarchien
- Information: Zugriff auf alle benötigten Daten und abgeleitete Informationen, Verarbeitung großer Datenvolumina