BI All Flashcards

1
Q

Wie grenzt man ein Data Warehouse von einem Business intelligence System ab?

A

Data Warehouse sorgt für das sammeln der Daten, BI führt gesammelte Daten zusammen und wertet sie aus.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Aus welchen Komponenten besteht ein DW?

A

Arbeitsbereich, Basisdatenbank (Core), Ableitungsdatenbank, Auswertungsdatenbank, Metadaten, Datawarehouse Manager

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Welche Aufgaben?

A

Extract, Transform, Load (ETL)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Mit welchen Datenqualitätsproblemen sieht man sich konfrontiert und wie lassen sich diese beheben?

A

Konsistenz, Zuverlässigkeit, Granularität, Dokumentation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

additive Kennzahlen

A

-Optimalfall
-(additive) Berechnung zwischen allen
Konsolidierungsebenen der Dimensionen möglich
-D.h. Standard-Aggregationsmethode „Summation“
ist über alle Dimensionen hinweg sinnvoll
-Flussgrößen wie Umsätze oder Kosten sind
im Normalfall vollständig additiv
-Können z.B. über den Zeitverlauf und über
verschiedene Regionen hinweg addiert werden
-z.B. Einkaufswert, Bestellmenge eines Artikel pro Tag

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Semi-additive Kennzahlen

A

-(additive) Berechnung nur für ausgewählte Menge
von Hierarchieebenen
-D.h. Bestandsgrößen sind meistens über alle
Dimensionen außer der Zeit additiv aggregierbar
-z.B. Lagerbestand, Kontostand, Einwohnerzahl pro Stadt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Nicht-additive Kennzahlen

A
additive Berechnung nach keiner denkbaren
Dimension sinnvoll möglich
-Im Allgemeinen Durchschnitts- oder
prozentuale Werte
-Beispiele
 gemessene Temperatur im Zeitverlauf
oder über Orte hinweg aufzusummieren
 Noten können ebenfalls nicht sinnvoll addiert werden
 Wechselkurs
 Steuersatz
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Hub and Spoke

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Standard SQL Abfrage

A

SELECT: Welche Attribute
FROM: Welche Tabellen
WHERE: Bedingungen
GROUB BY: Gruppierung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

QUBE Syntax

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

RollUp Syntax

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Slicing

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Dicing

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Drill up and drill down

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Pivoting

A
19
Q

Nicht volatilität

A

Nicht-Volatilität: Daten im DWH werden dauerhaft abgelegt und für die Analyse zur Verfügung gestellt. DWH-Daten werden somit in der Regel nicht mehr geändert, überschrieben oder entfernt.

20
Q

ME/R Diagram

A
21
Q

Star Schema

A
22
Q

Geben Sie an, was man unter einer Referenzarchitektur versteht und
erläutern Sie deren Ziele.

A

Ein Referenzmodell stellt ein Modellmuster dar,
das als idealtypisches Modell für die Klasse der
zu modellierenden Sachverhalte angesehen wird.

  • Unterstützung des Vergleichs
  • Planungserleichterung für konkrete DWH-Implementierung
  • Erhöhung der Übersicht und Komplexitätsverringerung
  • Visualisierung und Homogenisierung von Begriffen
23
Q

Aus welchen Stufen besteht die vierstufige DW-Grundarchitektur? Erläutern
Sie deren einzelnen Komponenten und die zugehörigen Transformationsschritte.

A

• Quellsystem -> Staging Area
o Zugriff über View Layer für Unabhängigkeit von Strukturänderungen
• Staging Area
o Daten werden gespeichert, wie sie ausgeliefert werden
• Staging Area -> Cleansing Area:
o Filtern von fehlerhaften Daten
 Korrigieren oder Defaultwerte
o Form vereinheitlichen
• Cleansing Area
• Cleaning Area -> Core
o Versionierung der Stammdaten
o Laufend neue Daten
o Gleiche Detaillierungsstufe wie geliefert
o Keine Aggregation
• Core
o Speichern über langen Zeitraum
o Themenspezifisch strukturiert
o Historische Daten
o Keine direkten Zugriffe
• Core -> Mart
o Fachliche Aufbereitung der Daten in gewünschte Hierarchiestufen
o Aggregation der Bewegungsdaten
• Data Mart
o Teilmengen der Daten
o Für die jeweilige Anwendung relevant
• ETL-Prozesse: Die Datenflüsse. Extrahieren, Transformieren, Laden
• Metadaten: Fachlich und technisch. „Daten über Daten“

24
Q

Geben Sie verschiedene Monitoring-Strategien an und erläutern Sie diese.

A
	Trigger-
	Replikations-
	Log-
	Zeitstempel-
	Snapshot-basiert
25
Q

Was versteht man unter einem Data Mart? Grenzen Sie es zum DWH ab.
Welche Formen von Data Marts existieren?

A

Data Warehouse: Sammeln der Daten
Data Mart: Auswertung

o	Abhängige Data Mart
	Hub and Spoke
	Informationen aus der Ableitungsdatenbank
o	Unabhängige Data Mart
	Unabhängige kleine DWH
26
Q

Erläutern Sie den ETL-Prozess beim Data Warehousing.

A

• Extraktion
o Übertragen von Daten aus Datenquellen in den Arbeitsbereich
• Transformation
o Integration: Vorbereiten und Anpassen der Daten für das Laden
o Harmonisierung: Überführung aller Daten in ein einheitliches internes Format
o Datenbereinigung: Beseitigung von fehlerhaften Werten
• Laden
o Übertragung der Transformierten Daten in die Basis, Ableitungs- und Auswertungsdatenbanken

27
Q

Welche Schritte können eine Transformation erfordern?

A

o Integration: Vorbereiten und Anpassen der Daten für das Laden
o Harmonisierung: Überführung aller Daten in ein einheitliches internes Format
o Datenbereinigung: Beseitigung von fehlerhaften Werten

28
Q

Welche Arten von Berichten/Analysen soll ein DW unterstützen?

A

-Planungsberichte (als Grundlage und Ergebnis der
strategischen und operativen Planung)
 Abweichungsberichte (z.B. Monats- und Quartalsberichte)
 Statusberichte (z.B. Geschäftsberichte)

29
Q

Nennen Sie 3 mögliche Data-Mining Methoden und BeispielAnwendungen?

A
  • Klassifikation: Zuordnen von Daten zu vorgegebenen Klassen
  • Segmentierung: Clusterbildung, d.h. Daten werden bzgl. ihrer
    Merkmalsausprägung zu Gruppen zusammengefasst
  • Assoziationsanalyse: Entdecken von Regeln, die gemeinsam
    auftretende Elemente des Datenbestands beschreiben
30
Q

Was ist ein InfoObject

A
31
Q

Was ist ein aDSO

A
Das advancedDSO (aDSO) ist der neue Allrounder des SAP BW und gilt als zentraler (gar einziger) InfoProvider der
Modellierung in der SAP Version BW/4HANA. Das aDSO kann nur über die BW-Modellierungswerkzeuge im SAP HANA Studio bzw. in Eclipse angelegt und bearbeitet werden.
32
Q

Erläutern Sie anhand je eines Anwendungsbeispiels die OLAP-Operationenp

A
  • Drill-Across
  • Pivotierung
  • Drill-Down, Roll-Up
  • Data Slicing
  • Data Dicing
33
Q

. Welche Ziele verfolgen die 12 OLAP-Regeln nach Codd?

A

 Rot: Intuitiver, schneller, direkter Zugriff auf alle Daten
 Grün: Flexibles Reporting
 Blau: Performante und skalierbare Infrastruktur

34
Q

Erläutern Sie, was man unter FASMI im Kontext von OLAP versteht.

A

Fast Analysis of Shared Multidimensional Information

35
Q

Vergleichen Sie OLTP- und OLAP-Systeme in Hinblick auf die Daten-,
Anfrage- und Anwendersicht.

A
36
Q

Welche Ziele werden mit den Data-Mining-Verfahren verfolgt?

A
37
Q

Erläutern Sie die Zielsetzung einer Clusteranalyse.

A
38
Q

Was ist das Ziel einer ABC-Klassifikation?

A
39
Q

Assoziationsanalyse

A
40
Q

Erläutern Sie den Aufbau von Entscheidungsbäumen im Rahmen der
Klassifikation. Geben Sie ein Beispiel für einen Entscheidungsbaum an.

A
41
Q

Geben Sie für jede der vorgestellten Verfahrensklasse ein Anwendungsszenario an.

A

Klassifikation: Kreditwürdigkeit

42
Q

Wie berechnet man Support, Konfidenz und Lift bei der Assoziationsanalyse? Was bedeuten diese Werte und ist ein größerer/kleinerer Wert
besser?

A
43
Q

Was ist KDD und welche Schritte sind hier nötig?

A

Knowledge Discovery (in Databases)

Auswahl-Aufbereitung-Transformation-Data Mining-Interpretation