Definitionen und Wissen Flashcards

1
Q

Was ist ein Unternehmen?

A

Ein sozio-technisches System:

sozio: Mensch,
technisch: Computer/Maschinen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Welche Arten von Tätigkeiten gibt es in einem Unternehmen?

A

Es gibt operative und dispositive Tätigkeiten.

  • dispositiv
    • strategische Tätigkeiten
    • steuernde Tätigkeiten
    • planende Tätigkeiten
    • lenkende Tätigkeiten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Welche Arten von Entscheidungen gibt es?

A

Strukturierte und unstruktierte Entscheidungen.

  • strukturiert: Routinemäßige Entscheidungen. Häufig.
    • Standardisierte Vorgehensweise
    • Beschreibbare Ziele
    • Vollständige Beschreibung der Ein- und Ausgabedaten ist gegeben
  • unstrukturiert: Kein einheitliches Verfahren.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

In welchem Zusammenhang stehen: Wissen, Information, Daten?

A
  • Daten: Grundbestandteile. z.B: 2x”S”, 1x”O”
  • Information: Daten + Semantik. z.B: “SOS”
  • Wissen: Vernetzung von Informationen, bezogen auf einen vorgegebenen Kontext. z.B: “Hilfe holen”
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was sind analytische Informationssysteme?

A

Anwendungssysteme, die Bestandteil eines übergeordneten Konzepts (BI) sind und generell dispositive Tätigkeiten unterstützen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was ist CPM?

Wie sieht die “CPM-8” aus?

A

Steht für Corporate Performance Management.

Ist ein Prozess zur zielgerichteten Umsetzung von Unternehmensstrategien.

  • Umfasst alle
    • Methodologien (z.B: BSC)
    • Prozesse (z.B: Planungsprozesse)
    • Metriken (z.B: Performance-Kennzahlen)
    • Systeme (z.B: BI)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was ist Business Intelligence?

A

Ein integrierter, unternehmensspezifischer, IT-basierter, Gesamtansatz zur betrieblichen Entscheidungsunterstützung.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist ein Data Warehouse?

A

Ein von operativen Datenbeständen physikalisch getrenntes, dispositives Datenhaltungssystem.

Es dient der unternehmensweiten, einheitlichen, konsistenten Datenbasis.

= single point of truth.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was sind die 4 Eigenschaften eines Data Warehouses?

A
  • Themenorientiert / Fachbezogen
  • Integriert (einheitliche Sicht auf heterogene Quellen)
  • Zeitraumbezug
  • Nichtvolatil
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was sind die unterschiedlichen Charakteristika von operativen und dispostiven Anforderungen bzgl. Anfragen?

A
  • operativ:
    • Fokus: CRUD
    • Transaktionsdauer: Kurse Lese-/Schreibaktionen
    • Struktur: Einfach strukturiert
    • Datenvolumen pro Anfrage: Wenige Datensätze
    • Datenmodell: Anfrageflexibel
  • dispositiv:
    • Fokus: Lesen, period. Hinzufügen
    • Transaktionsdauer: Lange Leseaktionen
    • Struktur: Komplex
    • Datenvolumen: Viele Datensätze
    • Datenmodell: Analysebezogen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was sind die unterschiedlichen Charakteristika von operativen und dispostiven Anforderungen bzgl. Daten?

A
  • operativ
    • Zweck: Abwicklung der GP
    • Inhalt: Granulare GP-Vorfalldaten
    • Zeitbezug: Aktuell, zeitpunktbezogen
  • dispositiv
    • Zweck: Informationen für das Management
    • Inhalt: Verdichtete Daten, Metadaten
    • Zeitbezug: Zeitraumbezogen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was ist ein Core Data Warehouse?

A

Ein zentrales Data Warehouse, welches alle Daten speichert.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was ist ein Data Mart und welche Arten gibt es?

A

“Kleinere” Data Warehouses, in denen jeweils nur bestimmte (applikationsbezogene) Daten gespeichert werden.

Ausprägungen

  • abhängig
    • Jeweils direkt an ein C-DWH angeschlossen und nicht an die operativen Datenquellen = “Hub and Spoke”.
  • unabhängig
    • Jeweils direkte Anbindung an die operativen Datenquellen.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was ist Data Warehousing?

A

Alle Prozesse zur Planung, Implementierung, Betrieb eines Data Warehouse, sowie darauf basierende Datenauswertungen und Analysen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was sind “freie Datenrecherchen”?

A

Bestimmung, Auswahl und Darstellung von Teilmengen der gespeicherten, dispositiven Daten ohne vorgegebenen Programmrahmen.

Sprachen: SQL, MDX

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was ist “OLAP”?

Was sind die Eigenschaften “FASMI”?

A

Online Analytical Processing

Fast Analysis of Shared Multidimensional Information

  • Fast: Schnelle Beantwortung der Anfragen (5-20s)
  • Analysis: Anwenderfreundliche, intuitive Analyse
  • Shared: Mehrbenutzerfähigkeit
  • Multidimensional: Konzeptuelle Sicht, unabhängig von DBMS
  • Information: Skalierbarkeit, keine Volumenbegrenzung
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Welche OLAP-Operationen gibt es (7) ?

A
  • Pivotieren: Drehen des Würfels entlang einer Achse
  • Roll-Up: Aggregation der Daten entlang eines Konsolidierungspfads
  • Drill-Down: Navigation von Aggregationen zu Detaildaten entlang eines Konsolidierungspfads
  • Drill-Across: Wechsel (horz.) von einem Würfel zu einem Anderen
  • Drill-Through: Wechsel (vert.) von einem Würfel zu einem Anderen
  • Slice: Herausschneiden von “Scheiben” - Verringerung der Dimensionalität
  • Dice: Herausschneiden eines (kleineren) “Teilwürfels” - Erhaltung der Dimensionalität
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Was ist “Data Mining”?

A

Prozess zur effizienten Erforschung und Analyse großer Datenmengen durch halbautomatische Verfahren im Hinblick auf noch nicht bekannte, verwertbare und wertvolle Muster und Regeln.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Was sind Metadaten?

A

Jede Art von Information, die für den Entwurf, die Konstruktion und die Benutzung eines Informationssystems benötigt wird.

z.B: Hierachien bei OLAP-Cubes

20
Q

Wofür steht “ETL”?

Was passiert in den einzelnen Schritten?

Welche Tätigkeiten gibt es noch (4)?

A

Extraction, Transformation and Loading

  • Extraction: Selektion eines Ausschnitts der Daten aus den Quellen und Bereitstellung in der Staging Area
  • Transformation: Anpassung der Daten an vorgegebene Schema und Qualitätsanforderungen
  • Loading: Physisches EInbringen der Daten aus der Staging Area in das DWH, zuerst in den ODS, einschließlich ggf. notwendiger Aggregationen
  1. Filtern
  2. Harmonisieren
  3. Aggregation
  4. Anreichung (mit berechneten Kennzahlen)
21
Q

Was ist ein Snapshot?

A

Ausschnitt aus einem System zu einem bestimmten Zeitpunkt.

22
Q

Was ist “Data Cleaning”?

A

Prozess der Identifikation und Beseitigung von Fehlern, Inkonsistenzen und (unerwünschten) Redundanzen in den in das DWH zu übernehmenden (oder schon übernommenen) Daten.

23
Q

Was unterscheidet “domänenabhängiges” von “domänenunabhängigem” Data Cleaning?

A

Bei domänenabhängigen Data Cleaning wird neben den statistisch-mathematischen Methoden des domänenunabhängigen DCs auch Fachwissen aus dem Bereich (der Domäne) eingebracht.

Es ist generell vorzuziehen!

24
Q

Welche Aspekte besitzt die “Datenqualität”?

A
  • Glaubwürdigkeit
  • Nützlichkeit
  • Interpretierbarkeit
  • Schlüsselintegrität
25
Q

Was besagt das Recall-Precision-Dilemma?

A

Ein Verbessern der Precision hat eine Verschlechterung des Recalls zur Folge und vice versa.

  • Hoher Recall: Es werden möglicherweise zu viele Duplikate gefunden (auch falsche)
  • Hohe Precision: Es werden mglwse nicht alle Duplikate gefunden
26
Q

Was ist eine Dimension?

A

Beschreibt eine mögliche Sicht auf eine Kennzahl.

  • Endliche Anzahl von Elementen mit semantischen Beziehung
  • Dient der othogonalen Strukturierung des Datenraums
27
Q

Was sind Kennzahlen?

A

Verdichtete Maßzahlen, die in konzentrierter Form über einen quantitativen Sachverhalt berichten. (absolut oder relativ)

28
Q

Wozu dient die Historisierung von Hierachien?

A

Zur Rekonstruierbarkeit von Änderungen.

29
Q

Was ist “Predictive Analytics”?

A

Eine Form der Datenauswertung zur zukunftsorientierten strategischen Unternehmenssteuerung.

30
Q

Welche Methoden gibt es im Bereich “Predictive Analytics” (9)?

A
  • Lineare Regressionen
  • Entscheidungsbäume
  • Clusteranalysen
  • Zeitreihenmodelle
  • Logische Regressionen
  • Neuronale Netze
  • Assoziationsanalysen
  • Naive Bayes
  • Support Vector Machines
31
Q

Was besagt der “Lift”?

A

Die Verbesserung eines Vorhersagemodells gegenüber dem Zufall.

32
Q

Was ist die Motivation für Data Mining?

A

Der Bedarf nach der automatisierten Gewinnung von Erkenntnissen aus großen Datenmengen.

33
Q

Wofür steht “CRISP-DM”?

A

Cross Industry Standard Process for Data Mining

34
Q

Was ist die “PCA”

A

Principal Component Analysis

Eine Technik der Dimensionsreduktion. Besteht eine Ausgangsdatenmenge aus n Attributen, so ist es das Ziel der PCA, m neue (künstliche) Attribute zu finden mit m < n, die die Daten ebenso beschreiben.

35
Q

Was ist ein “Proximitätsmaß”?

A

Ein Maß, das eine Quantifizierung der Ähnlichkeit oder der Distanz (Unähnlichkeit) zwischen Objekten erlaubt.

36
Q

Wie lautet das allgemeine Vorgehen zum Entwerfen eines Star-Schemas?

A
  1. Identifikation von betriebswirtschaftlichen Ereignissen, denen Fakten zugeordneten werden können. FT
  2. Identifikation der möglichen Dimensionen zur Beschreibung von 1.
  3. Konkretisierung
37
Q

Wie lautet das Vorgehen, um mit ADAPT ein System zu modellieren?

Welche Besonderheit ist bei der Dimension “Zeit” zu berücksichtigen?

A
  1. Aus den Anforderungen (einzeln) die beteiligten Dimensionen, Kennzahlen und ggf. Aggregationen ableiten
  2. Dimesionen und Kennzahlen aus 1. zusammentragen
  3. Ableiten von Hierachien
  4. Modellieren

Zeit kann einmal in einer Kalendar-Hierachie und einmal als Fiskaljahr-Hierachie dargestellt werden!

38
Q

Was gibt der Gartner Hype Cycle an und wie sieht er aus?

A

Der Gartner Hype Cycle stellt die Reife einer Technologie ihrer Sichtbarkeit in den Medien (“Hype”) gegenüber

39
Q

Wie ist das Unternehmensmodell aus Sicht der IT aufgebaut?

A
40
Q

Nennen Sie Beispiele für

a) Interne Kaufbezogene Informationen
b) Interne Nicht-Kaufbezogene Informationen

c) Externe Kaufbezogene Informationen
d) Externe Nicht-Kaufbezogene Informationen

A
41
Q

Beschreiben Sie den BI-Ordnungsrahmen und die 3 Schichten dieses Modells!

A
42
Q

Beschreiben Sie die Arten von Latenzzeiten der Daten und die verschiedenen DWH-Arten

A
43
Q

Beschreiben Sie den Ordnungsrahmen für Analysesysteme!

A
44
Q

Beschreiben Sie die Data-Warehouse Referenzarchitektur!

A
45
Q

Beschreiben Sie das Snowflake-Schema!

A
  • Jede Klassifikationsstufe wird in einer eigenen Tabelle gespeichert
    • Immer mit FK zur höheren Klassifikationsstufe
  • Fakten (Kennzahlen) werden in einer eigenen Tabelle gespeichert
    • Enthält die FK der jeweils niedrigsten Klassifikationsstufe
    • Alle FK bilden den PK für die Faktentabelle
46
Q

Beschreiben Sie das Star-Schema!

A
  • Jede Dimesion wird in einer eigenen Tabelle gespeichert
    • Alle zur Dimension gehörenden Daten inkl. Hierachien werden in einer einzigen nicht normalisierten Tabelle gespeichert
  • Faktentablle wie bei Snowflake
47
Q

Erklären Sie das erweiterte Star-Schema der SAP AG

A