Prüfungsfragen Flashcards
- Definieren Sie den Begriff „Business Intelligence“ wie in der Vorlesung kennengelernt.
- Business Intelligence ist ein integrierter, unternehmensspezifischer, IT-basierter Gesamtansatz zur betrieblichen Entscheidungsunterstützung.
- Gesamtheit aller Werkzeuge und Anwendungen mit entscheidungsunterstützendem Charakter, die zur besseren Einsicht in das eigene Geschäft verhilft.
- Begriffliche Klammer, die eine Vielzahl unterschiedlicher Ansätze zur Analyse geschäftsrelevanter Daten zu bündeln versucht (kein neues Produkt)
- Definieren Sie den Begriff „Big Data“ anhand der 4 “Vs” Vorlesung kennengelernt.
verfolgt das Ziel, qualitative und unterschiedlich struktierte Daten zu verbinden und in ein Geschäftsnutzen zu verwandeln
- lässt sich anhand der “3-Vs” beschreiben
- aus Sicht der Wirtschaftsinformatik kommt Value dazu
o Volume - Datenmengen (z.B. Zettabye)
o Velocity – Geschwindigkeit
o Variety - Datenvielfallt (z.B. Strukturierte Daten - ERP-System; Unstrukturierte Daten - Facebook/Sensoren; Semi-Strukturierte Daten - E-Mail)
o Value - Gewinn/Nutzen
- Welche Bereiche Spielen in Business Intelligence Zentrale Rollen?
- Reporting
- Analytics
- Data Mining
- OLAP
- Big Data
- Unternehmenssteuerung
- Data Warehousing
- Der sogenannte „Schwanzlutscher“ Gluchowsky hat komische Sichten auf BI, nennen und erklären Sie 3 Verständnisse der BI
- Enges BI-Verständnis Kernapplikationen die Entscheidungsfindung unterstützen (OLAP, MIS)
- Analyseorientiertes BI-Verständnis Alle Anwendungen mit denen der Entscheider im System arbeitet (CRM)
- Weites BI-Verständnis Alle Anwendungen die direkt und indirekt mit Entscheidungsunterstützung arbeiten (Anw. Zur Datenauswertung, -präsentation, - aufbereitung und -speicherung
- Risiken von BI
- Datenkraken
- Datenschutz
- gläserner Mensch
- Konflikt zwischen technisch möglich und Ethnischer Sicht
- Kommerzieller Nutzen der Daten
- Qualität der Analysemethoden bzw. Datenbasis
- 4 Zukünftige Herausforderung und Trends im Kontext mit BI
Big Data: Große Datenmengen, Geschwindigkeit der Daten, hoher Informationsgehalt - dimensionalisierung = Digitalisierung des Alltags
Datenheterogenität: Daten aus Externen (z.B. Facebook)
Erfassungs-, Mess-, Veränderungsgeschwindigkeit der Daten
Mobile BI: Zugriff auf mobile Endgeräte
Predictive Analysis: Prognose von Zukunftswerten
Self BI: User holen sich aufbereittete Daten aus DB
In-Memory: Speichertechnologie, Daten befinden sich direkt im Speicher, Enorme Aufbereitung und Ausgabe Geschwindigkeit
BI as a Service: Cloud basierte BI Lösung
- Welche der folgenden Systeme sind Ihrer Ansicht nach üblicherweise keine BI-Anwendungssysteme?
Siehe B2PBIF Aufgabe 7
- Definition von Data Warehouse
für Analysezwecke Optimierte Datenbank, die Daten aus mehreren i.a. heterogenen Quellen zusammenführt und verdichtet (Integration und Transformation)
Umfasst:
- den GP, der Datenbeschaffung aus internen und externen zugänglichen Quellen
- die Datentransformation und -aufbereitung gemäß der Quell- und Zieldatenbankschemata
- die Datenqualitätssicherung und die Speicherung im (zentralen) DW bzw. (dezentralen) Data Marts benutzersichten)
- die auf OLAP basierende Datenanalyse
- William H. Inmon stellt in seiner Data-Warehouse-Definition vier Merkmale in den Mittelpunkt. Nennen und beschreiben Sie jedes Merkmal.
- Themenorientierung (subject-oriented):
- Zweck nicht Erfüllung dedizierter Aufgabe, sondern Unterstützung übergreifender Auswertungsmöglichkeiten aus verschiedenen Perspektiven.
- Alle Daten - unternehmensweit - über ein Subjekt (z.B Kunde) und nicht “versteckt” in versch. Anewendungen - Integrierte Datenbasis (integrated):
- Daten aus mehreren versch. Datenquellen
- Vereinheitlichung der Daten aus den operativen Systemen
- Benennung, Skalierung und Kodierung - Historische Daten (time-variant):
- Vergleich der Daten über Zeit möglich (Zeitreihenanalyse)
- Speicherung über längeren Zeitraum
- Bereitstellung von Zeitreihendaten über längere Zeiträume - Nicht-flüchtige Datenbasis (non-volatile):
- Daten im DW werden i.a. nicht mehr geändert
- Stabile, persistente Datenbasis
- Bereitstellung von Zeitreihendaten über längere Zeiträume
- 4 Vorteile eines Zentralen Data Warehouse im Gegensatz zu reinen Data Marts
- integrierte Sichtweise auf das Gesamtunternehmen
- zentrale Datenverwaltung
- geringere Datenredundanz
- kein Transformations- bzw. Implementierungsaufwand
- Beschreiben Sie die in der Veranstaltung vorgestellte Architektur eines Data Warehouse-Systems mit seinen relevanten Schichten und Komponenten. Gehen Sie dabei auf die einzelnen Schichten und Komponenten detailliert ein. Verdeutlichen Sie Ihre Antwort darüber hinaus durch eine geeignete Abbildung.
Siehe B2PBIF Aufgabe 11
- Nennen Sie jeweils zwei unterschiedliche Beispiele für Fälle, in denen die folgenden Arten von Bereinigungsaktivitäten notwendig sind.
- Automatische Erkennung und Korrektur:
Komma durch Punkt ersetzen, “€” durch “EUR” ersetzen, Umformatierung von Datumsangaben - Automatisierbare Erkennung und manuelle Korrektur:
Unzulässige Zeichen, Ausreisen in Daten, unübliche Altersangabe oder Umsatzauswertung - Manuelle Erkennung und Korrektur:
Tippfehler, Manipulation (bewusste Falscheingabe)
- Erörtern Sie die Unterschiede zwischen operativen und dispositiven Daten. Verdeutlichen Sie Ihre Ausführungen anhand von selbst gewählten Beispielen?
• Operative Daten: stammen meist nur aus einer Datenquelle nur aktuelle Daten häufige Aktualisierung Zugriff auf einzelne Datensätze z.B. Umsatz von Kunde X am 12.2.2010 in der Filiale Hamburg.
• Dispositive Daten:
sind aus mehreren Datenquellen aggregiert
sowohl aktuelle, als auch historische Daten
große Datenmengen
Zugriff auf gruppierte Daten
z.B. Umsatz aller Filialen in Bayern im Monat März
- Was wird bei der Modellierung multidimensionaler Datenräume unter einem Star-Schema verstanden? Beschreiben Sie das Star-Schema anhand seiner wesentlichen Charakteristika. Wie könnte eine Beispielabfrage auf ein Star Schema lauten?
Welcher Umsatz wurde im Januar 2020 in der Region West mit dem Produkt 320 bei dem Kundentyp Geschäftskunden erzielt?
- Fakten sind betriebswirtschaftliche Kennzahlen und repräsentieren monetäre Werte oder Mengen Bsp.: Umsatz, Absatz, Einzelkosten, Personalbestand etc.
- Dimensionen sind deskriptiv und ermöglichen eine Gruppierung der Fakten zur Analyse Bsp.: Tage, Produkte, Kunden etc.
- Hierarchisierungen ermöglichen die Betrachtung unterschiedlicher Konsolidierungsstufen der Fakten Bsp.: Filiale > Region > Land > Gesamt
- Beschreiben Sie das in der Vorlesung kennengelernte FASMI-Prinzip.
- Fast: stabile, schnelle Antwortzeiten
- Analysis: Beherrschung beliebiger Businesslogik und statistischer Analysen wie “What-If”- & “How to achieve”- Betrachtungen
- Shared: Mehrbenutzerbetrieb, implementiert Sicherheitsanforderungen für Datenschutz
- Multidimensional: Unterstützung multidimensionaler konzeptioneller Sichten auf Daten, ermöglicht Hierarchien
- Information: Zugriff auf alle benötigten Daten und abgeleitete Informationen, Verarbeitung großer Datenvolumina
- Beschreiben Sie das in der Vorlesung kennengelernte HICHERT-Regeln
SAY: Botschaften klar vermitteln UNIFY: Bedeutung vereinheitlichen CONDENSE: Information verdichten CHECK: Qualität sicherstellen ENABLE: Konzept verwirklichen SIMPLIFY: Rausche. Redundanz und Details weglassen STRUCTURE: Inhalt richtig gliedern
- Was wird unter den Begriffen „OLTP“ und „OLAP“ verstanden? Grenzen Sie die beiden Konzepte in Bezug auf Anfragen ab
OnLine Transaction Processing:
• transaktionale Prozesse mit operativen Daten
• klassische operative Informationssysteme
• Erfassung und Verwaltung von Daten
• kurze Schreib- und Lesezugriffe auf wenige Daten
OnLine Analytical Processing:
• Analyse im Mittelpunkt
• lange Lesetransaktionen auf viele Datensätze
• Integration, Aggregation und Konsolidierung von Daten
- Nennen Sie sechs Operatoren zur Navigation in multidimensionalen Datenstrukturen multidimensionaler Datenmodelle. (DW denkt in Würfeln)
Pivoting - Rotieren des Datenwürfels durch Drehen oder Kippen (Perspektivwechsel)
- Slicing - Ausschnitt im 2D Raum (nur eine Dimension für z. B. alle Produkte zum Zeitpunkt)
- Dicing - Verkleinerter ausschnitt Würfel des gesamten Würfels (aus allen Dimensionen)
- Drill Down - von Grob nach Fein (Produktgruppe -> Produkt)
- Roll Up - von Fein nach Grob (Produkt -> Produktgruppe -> Produkte Gesamt)
- Drill-Across - von einem Würfel zum anderen
- Beschreiben Sie den Knowledge Discovery in Databases Prozess. Unterstützen Sie Ihre Erläuterungen durch eine grafische Darstellung des Prozesses. Gehen Sie auf die einzelnen Schritte im Detail ein.
- Selektion:
• Auswahl der für die Fragestellung relevanten Daten - Vorverarbeitung:
• Beseitigung von Datenqualitätsproblemen
• z.B. Missing Values und Imputation, Dubletten, Outliers, fehlerhaft Werte - Transformation:
• Daten werden in einen für das Datamining-Verfahren geeigneten Datentyp umgewandelt - ML: / Datamining:
• ML: / Datamining wird auf Daten angewandt (Mustererkennung)
• Ergebnis: Modell mit Mustern, Auffälligkeiten, Abhängigkeiten etc. - Interpretation und Evaluation
• Modell und Einsetzbarkeit des Modells werden bewertet
• Aufbereitung der Ergebnisse für die Entscheidungsfindung
Zeichnung B2PBIF Aufgabe 19
- Definieren Sie Data Warehouse Architektur.
Als DW Architektur wird der planvolle, fachkonzeptionelle Strukturentwurf des Data Warehouse Systems und dessen Einbettung in sein reales Umfeld bezeichnet.
- Was ist ein Star Schema? + / - nennen
Relationale Speicherung
- Faktentabelle bildet Zentrum des Star-Schemas und enthält die Detail-Daten mit analysiernden Kennzahlen
- 1 Dimensionstabelle pro Dimension, die nur mit Faktentabelle verknüpft ist (-> sternförmige Anordnung der Tabellen)
+ Einfache Datenmodelle -> intuitiv
+ Geringe Anzahl von Join-Operationen
+ Geringe Anzahl physischer DW-Tabellen
+ Geringer Aufwand im Rahmen der DW-Wartung
- Bei sehr großen Dimensionstabellen hohe Antwortzeit
- Redundanz innerhalb der Dimensionstabellen durch das mehrfache Verwenden identischer Fakten
- Welche Vor- und Nachteile hat das Snowflake Schema?
+ Beseitigung der Redundanzen in den Dimensionstabellen
+ -> Beseitigung verbundenen Probleme wie z. B. Update-Anomalien
+ Ist in der 3. Normalform
- Für eine Abfrage sind mehrere Joins notwendig
- Größere Anzahl der Joint-Operationen die die abhängigen Dimensionstabellen verbinden müssen
- Zeichnen und erläutern Sie den ETL Prozess (Welche Schritte werden im Rahmen der Transformation von operativen in dispositive Daten notwendig. Nennen und beschreiben Sie die einzelnen Schritte)
-Extraktion
-Transformation
– Filterung
o Auswahl der geeigneten Datenbestände
o Bereinigung von syntaktischen und semantischen Mängeln
– Harmonisierung
o Integration der Teilschemata der Datenquellen zum Data-Warehouse-Schema
o Abstimmung von Kodierungen, Synonymen und Homonymen
– Aggregation
o Bildung von Hierarchien und daraus resultierenden Aggregationen
o Beispielhierarchie: Produkt – Produktgruppe - Gesamt
–Anreicherung
o Berechnung von betriebswirtschaftlichen Kennzahlen
-Laden
Zeichnung Siehe B2PBIF Aufgaeb 23
- Erläutern Sie, warum BI nicht als Produkt käuflich, sondern unternehmensspezifisch individuell zu implementieren ist. Nennen Sie ein Beispiel.
Veraltete Einzelsysteme reichen nicht mehr aus, um die gesamten Informationen, die in einem Unternehmen generiert werden, adäquat zu speichern, analysieren und zu verteilen -> Integrierte und unternehmensspezifische Gesamtansatz notwendig!
- Zeigen Sie die physikalische Umsetzung von R-OLAP, M-OLAP und H-OLAP + Vor und Nachteile
Siehe B2PBIF Aufgabe 25
- Zeichnen Sie das Du-Pont Schema
Siehe B2PBIF Aufgabe 26
- Perspektiven nach Kaplan / Norton (BSC) je Ziel und Kennzahl, Situation aus Fallbeispiel erfolgversprechend? Begründung?
Siehe B2PBIF Aufgabe 27
- Zwei Elemente von multidimensionalen Datenstrukturen nennen.
Fakten, Dimensionen
- Erklären Sie die Datenqualität nach Hinrichs
Glaubwürdigkeit
- Korrektheit
- Zuverlässigkeit
- Konsistenz
Interpretierbarkeit
- Einheitlichkeit
- Eindeutigkeit
- Verständlichkeit
Nützlichkeit
- Vollständigkeit
- Genauigkeit
- Zeitnähe
- Redundanzfreiheit
- Relevanz
Schlüsselintegrität
- Schlüsseleindeutigkeit
- Referentielle Integrität
- Welche Architekturen haben wir in der Vorlesung kennen gelernt, zeichnen Sie diese, nutzen Sie diese mächtigen Grafiken
Siehe B2PBIF Aufgabe 30
- Was ist ein Data Warehouse – In Memory, nennen Sie die Merkmale dieser
Sind DBMS, die im Gegensatz zu herkömmlichen DBMS nicht Festplattenlaufwerke, sondern den Arbeitsspeicher zur Datenspeicherung nutzen.
Merkmale:
- Daten werden in den Arbeitsspeicher geladen
- Lange Zugriffszeiten klassischer Massenspeicher (z.B. Festplatten) entfallen
- Auswertung können innerhalb Sekunden oder gar Sekundenbruchteilen erstellt werden
- Es sind 8 Probleme bei der Transformation gegeben. Diese den Fehlerarten zuordnen.
Siehe B2PBIF Aufgabe 32
- Nennen und beschreiben Sie die 3 schwerwiegenden Probleme, die bei einem direkten Zugriff Management unterstützender Anwendungen auf die Datenbestände operativer Transaktionssysteme auftreten können. Unterstützten Sie ihre Beschreibung durch passende Beispiele.
KP
- Nennen Sie 4 unterschiedliche Berichtsmethoden
- Ist-Ist-Vergleiche
- Plan-Plan-Vergleiche
- Benchmarks
- Plan-Ist-Vergleiche
- Nennen und beschreiben Sie 4 Data-Mining Anwendungen und geben Sie ein Beispiel
- Kundensegmentierung für Marketing
o Gruppierung von Kunden mit ähnlichen Kaufverhalten - Warenkorbanalyse
o Produkt-Platzierung im Supermarkt, Preisoptimierung - Bestimmung der Kreditwürdigkeit von Kunden
o Elektronische Vergabe von Kreditkarten - Text Mining
o Inhaltliche Gruppierung von Dokumenten