Datenintegration Flashcards

1
Q

Beispiele für Datenintegration

A
  • Bereitstellen von Kundendaten für Mitarbeiter am Schalter

- Daten aus unterschiedlichen Quellen für Analyse in einem Data Warehouse zusammenbringen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Prozess zur Integration von Daten

A
  1. periodisch Daten transportieren und Konflikte erkennen
  2. Daten bereinigen
  3. Konsistenz prüfen und ggf. wiederherstellen + Daten in Quellen zurückführen
  4. Daten synchronisieren
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Intension eines Informationssystems

A

Menge der Schemainformationen und deren Semantik (Datenschemata und Metadaten)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Extension eines Informationsystems

A

Menge der in ihm gespeicherten Daten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Klassen von Integrationskonflikten

A

Konflikte im Datenmodell
-Unterschiedliche Struktur Beschreibung
-Unterschiedliche Ausdrucksmächtigkeit
-Unterschiedliche Integritätsbedingungen
Konflikte im Schema
-Modellierungskonflikte
->Strukturelle Konflikte
->Beschreibungskonflikte
Datenkonflikte
-Veraltete Einträge mit unterschiedlichen Schema
Details und Integritätsbedingungen
-Gleiche Repräsentation, aber unterschiedliche
Semantik
-Gleicht Repräsentation und Semantik, aber
unterschiedliche Details
-Dubletten mit unterschiedlichen Informationen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Arten von Beschreibungskonflikten

A
  • Unterschiedliche Attribute
  • Homonyme
  • Synonyme
  • unterschiedliche Datentypen
  • Skalierungen
  • Genauigkeit
  • Integritätsbedingungen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qualitätseigenschaften von Daten

A
  • Korrektheit
  • Konsistenz
  • Zuverlässigkeit
  • Vollständigkeit
  • Genauigkeit
  • Aktualität
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Schema on Write

A

-Beim Eintragen von Daten in eine relationale Datenbank haben Daten bereits ein festgelegtes Schema (vorher angelegt)

+schnelle Queries
-nicht flexibel
+strukturiert (leicht lesbar)
-SQL

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Schema on Read

A

-Beim Eintragen von Daten in eine NoSQL-Datenbank sind diese schemalos (Struktur wird erst beim Lesen aus der DB erstellt)

-langsamere Queries
+sehr flexibel
-unstrukturiert
-NoSQL

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Top-Down Ansatz für Zielschemata

A
  • man hat bereits ein Zielschema, das abgebildet werden soll

- Anwendungen können sich ändern

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Bottom-Up Ansatz für Zielschemata

A
  • unterschiedlich strukturierte Datenmodelle, die man zusammenführt
  • Beachten von Geschäftsobjekten
  • Daten bleiben stabil und Änderungen sind nicht zu erwarten (aber Erweiterung möglich)
  • Mehrere Quellen integriert abfragen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

ETL-Prozess

A

Extract-Transform-Load
-Daten werden aus unterschiedlichen Datenquellen herausgelesen und extrahiert
(synchron vs. asynchron (periodisch vs.
ereignisgesteuert))
-Herausgelesene Daten werden validiert, transformiert und Redundanzen entfernt/gefiltert/ergänzt
-Bereinigte Daten werden ins Data Warehouse oder zugehörige DB hochgeladen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly