2. Datenbereitstellung und -modellierung Flashcards

1
Q

Was ist das Differential Snapshot Problem?

A

Viele Quellen liefern immer den vollen Datenbestand

  • Ständiges Übertragen aller Daten ist jedoch ineffizient
  • Duplikate müssen erkannt werden!
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was ist die Aufgabe des Transformationsprozess? In welche vier Bereiche lässt er sich unterteilen?

A

Prüfung und Modifikation der in das DWH zu übertragenden Daten, sodass die Anforderungen des DWH Konzeptes und der Anwender erfullt werden.

  • Verknüpfung der Datensätze aus versch. Vorsystemen
  • Harmonisierung der Quellbestände
  • Zuordnung von Quell- zu Zieldatenobjekten
  • Bereinigung der Daten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Auf welchen Gesichtspunkten liegt der Fokus des Transformationsprozesses?

A
  • Daten
  • Schemata
  • Datenqualität
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was ist bei der Verknüpfung der Datensätze aus Vorsystemen zu beachten? (3 Punkte)

A
  • Semantik
    • z.B. Abkürzungen, Synonyme, fehlender Kontext
  • Datenmodellintegration
    • Unterschiedliche Ausdrucksmächtigkeit von Datenmodellen (z.B. relational, objektorientiert, XML, semistrukturiert).
  • Harmonisierung
    • z.B. Datentypkonversion, Kodierung, Aggregierung etc.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wie lautet die Definition von Data Cleansing?

A

Data Cleansing ist der Prozess der Identifikation und Beseitigung von Fehlern, Inkonsistenzen und (unerwünschten) Redundanzen in den in das DWH zu übernehmenden und schon übernommenen Daten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wie lauten die „8 rights“ der Datenqualität?

A
  1. Die richtigen Daten,
    • Daten, die der Anwender benötigt
  2. mit der richtigen Vollständigkeit,
    • Die Gesamtheit, der Daten, die der Anwender benötigt
  3. im richtigen Zusammenhang,
    • Die Daten, deren Bedeutung der Anwender kennt
  4. mit der richtigen Korrektheit,
    • Daten, denen der Anwender trauen kann
  5. in der richtigen Darstellung,
    • Die Darstellung, die der Anwender leicht nutzen kann
  6. zum richtigen Zeitpunkt,
    • Dann, wenn der Anwender die Daten braucht
  7. am richtigen Ort,
    • Wo der Anwender sie braucht
  8. für den richtigen Zweck!
    • Daten, mit denen er seine Ziele erfüllen kann
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was erhöht neben Data Cleansing die Datenqualität?

A

Einhaltung definierter Qualitätsstandards beim Entstehen, Eingeben und Verarbeiten der Daten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly