Skript 6 Flashcards

1
Q

Data Warehouse Referenzarchitektur

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Wie läuft das Data Warehousing ab

A
  1. ETL Prozess, Extraktion, Transformation, Laden (Monitoren auf Veränderungen, die in temporären Arbeitsbereich kopieren, Transformation(Bereinigung, INntegration)laden in integrierte Basisdatenbank (anwendungsabhänging modelliert, Daten Schemaintegration verschiedener Quellen liegen vor)
  2. Laden der Daten in Anwendungspezifsiches Warehouse
  3. Eventuell Bereitstellung von Data Marts
  4. Analysen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Welche zwei Sichtweisen gibt es beim Data Warehousing

A

Statische Sicht (die wir auch gelenr thaben mit den Systemkompononten)

Dynamische Sicht(Ablauf)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Welche Kriterien sollten Daten erfüllen?

Welche Ansprüche gibt es an Daten im Data Warehouse

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wofür wird der Datawarehouse Manager benötgit

Aufgaben des Data warehouse Manger

A

Steuerungs und Kontrollkomponente

Doku von Fehlern

Wiederanlaufmechanismen

Steuerung des Ablaufs

Paramter der Komponenten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Aufgabe von Monitoren im Datawarehouse Manager

A

Entdeckung von Datenupdates in Datenquelle, gibt Hinweise zur Änderung weiter

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wann wird ein Monitor ausgelöst

A

Es gibt die Möglichkeiten

  • trigger basiert
  • log basiert
  • Zeitstempelbasiert
  • Snapshot basiert
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Aufgabe des Arbeitsbereiches

A

Zwischenspeicher zur späteren Integration

Ausführung der Transformationen auf Zwischenspeicher

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Welche Komponenten gehören zum ETL Prozess

A

Extraktion, Transformation, Laden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Extraktion, welche Zugriffsmöglichkeiten auf die Daten gibt es?

A

3

  1. Direkter Zugriff auf Datenquelle
  2. Export /Import
  3. Direkte Integration
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was ist Data Scrubbing

A

Ausnutzen von domänenspezifischen Wissen zum Erekennen von Verunreinigungen, z. B. Redundanzen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was ist Data Auditing

A
  • Anwedung von Data Mining Verfahrne zum Aufdecken von Regeln
  • Aufspüren von Abweichungen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Welche Art von Integrationskonflikten gibt es?

A
  1. Semantische Konfolikte
  2. Beschreibungskonflikte
  3. Heterogenitätskonflikte
  4. Strukturelle Konflikte
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was sind semantische Konflikte?

A

Gleiche Objekte werden utnerschiedlich vin verschiedenen Quellen gespeichert

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was sind Beschreibungskonflkte

A

Das gleiche, aber unterschiedliche mit verschiedenen Attributen beschrieben

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was sind Heterogenitätskonflikte

A

Unterschiedliche Datenmodelle

17
Q

Was sind Strukturelle Konflikte

A

unterschiedliche Modellierung

18
Q

Welche Eigesnchaften muss ein integrietes Schema erfüllen

A
  1. Vollständigkeit (was in lokal beschreiben auch in global)
  2. Korrektheit (Semantisch, keine Widersprüche)
  3. Minimalität(keine Redundanzen)
  4. Verständlichkeit(Dok der Vorgänge)
19
Q

Aus welchen Phasen besteht der SChmeaangleich

A
  1. pre integration
  2. schema comparions
  3. schema conforming
  4. schema merging and restructuting
20
Q

Aus welchen Komponenten besteht ein Data Warehouse

A
  • Datenbeschaffungsbereich
  • Analyskomponenten
  • Metadatenamanger
  • Date-Warehouse Manager
  • Datenbanken
21
Q

ETL Prozess, kritische SChritte Allgemein und in er Logik

A

Allgemein

Lade Prozess kann Datenbank blockieren

Transformation sollte effizien gestatlet sein

Logik

  • Erkennen von Duplikaten
  • Erkennen von Fehlern
  • Metriken zur datenqualität
22
Q

Was macht das Repository

A

Speichert die Meta Daten des DWH