VL 1.4 E-CommerceDataManagement Flashcards

1
Q

Warum ist Schema-Evolution nicht optimal?

A

Keine gute Idee, denn nachträgliche Hinzunahme von Attributen ist beispielsweise bei Standardimplementierung von Relationalen Datenbanken extrem aufwändig!

  • Schema-Evolution ist möglichst zu vermeiden –> praktisch wichtig
  • –> Umsetzung aufwendig Z.b Darstellung/Anordnung im Speicher

–> Tupel müssen versetzt werden bzw “neuer Speicherplatz für neues Atribut eingefügt werden” (informell)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was ist Sparsity?

A

Relation ist “dünn besetzt”, d.h. viele NULL-Werte

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was tritt häufig bei E-Commerce-Daten auf?

A

Schema-Evolution in Verbindung mit Sparsity

Zum Beispiel Produktdaten bei Elektronikbauteilen 2000 Produktkategorien,

  • insgesamt > 5000 Attribute über alle Kategorien
  • –> ständig neue Teile - mit neuen Attributen –> manche Hersteller haben Attribute als “Alleinstellungsmerkmal”. Andere haben dieses A. nicht, daher haben sie dort NULL-Werte ==

⇒ diese Schema-Evolution ist aufwändig und Sparsity ist störend (vergeudeter Speicherplatz)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Welche Lösung gibt es für Sparsity?

A

**Alternative Möglichkeiten der physischen Repräsentation**

  • (1)Vertikale Repräsentation // Tupel der Vertikalen Repräsentation sind schlank -> NULL_werte nicht dabei –> Einem Datenobjekt == ggf. mehrere Tupel der Relation Tupel (Vertikal) = (Objekt_id, Key(=Attribut(Bezeichnung)), VAL(Attribut-wert)) Vertikale Darstellung trifft man häufig im Web Kontext an
  • (2)Binär
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was kann das Problem der alternativen Repräsentation sein (Vertikal oder Binär) ?

A

Anwender erwartet weiterhin horizontale Repräsentation// ihm wird auch weiterhin die horizontale Sicht angezeigt, obwohl die physische Darstellung möglicherweise vertikal ist - SQL Abfrage machen Probleme.

⇒ D.h. Anfragen müssen in der Art umgestaltet werden, dass sie auf vertikaler Repräsentation arbeiten!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was ist der pathologische Fall bei Sparsity?

A

Ein Tupel hat außer der ID nur NULL-Werte (zb Oid=5, A1=NULL, A2=NULL etc)

wie sieht die vertikale Darstellung aus? Möglichkeiten des Umgangs

  • (1) Wir lassen die Null-Werte in der Vertikalen Darstellung zu (nochmal checken)
  • (2) Darstellung in separater Relation, die nur für die pathologische Fälle dient
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Von welchem Attribut-Typ ist das “Val”-Attribut der vertikalen Repräsentation? Wie kann man mit verschiedenen Typen umgehen?

A

Das generischste, dass wir im “Keller” haben

⇒ Also, das was am meisten zulässt! Dieser Typ muss alles umfassen Randnotiz:

Möglichkeit –>

  • Pro Datentyp eine vertikale Relation –> dann kein “Kampf der Datentypen” –> auch besser zur Suche / Indices für Typ integer und Typ String beispielsweise
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Unterschied logischer Entwurf und Physischer Entwurf

A
  • LE = Wir überlegen uns: Was haben wir für Relationen und welche Attribute haben wir –> Logischer Entwurf hat bereits bei der Horizontalen Darstellung stattgefunden
  • PE = Welche Indizes und Sichten haben wir –> Physischer Entwurf wie kann ich den effizienten Betrieb meiner Datenbank sicherstellen, wie werden die Daten letztendlich im Speicher abgelegt
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Erläutern Sie kurz den in der LV vorgestellten Ansatz zur Speicherung von E-Commerce Daten (ohne Details zur Implementierung der einzelnen Operatoren).

A

Vertikale Darstellung und Binäre Darstellung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

(Zur Erlangung einer guten bis sehr guten Note:) Erläutern Sie die Implementierung der diversen der LV besprochenen Algebra-Operatoren.

Gebe auch die Formeln an!

A

Mit v2h und h2v –> zuhilfenahme von Join-Operatoren insbesondere Left-Outer-Join wg. hinzunhame der NULL-Werte

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was ist Higher-Order View? Enablement Layer? Query Processing

A

Atribute plötzlich teil des Inhalts. –> D.h. Schema plötzlich teil des Inhalts beim Übergang von horizontaler zu vertikaler Darstellung Führt zu neuen Erfordernissen bezüglich der Anfragesprache

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wie ist das Verhältnis von Schema der horizontalen Darstellung zum Inhalt der vertikalen Darstellung?

A

Das was auf der im horizontalen Fall auf der Schema-Ebene auftaucht (bsp. Attribute) ist im vertikalen Fall Inhalt der Relation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was ist ein Column-Store?

A

Binär –> für jede Spalte aus horizontal eine eigene Relation vertikal Weitere Bedingung: Null-Werte beibehalten und alle Tupel stets die gleiche Reihenfolge haben –> dann hat man die Repräsentationsform “Column-Store” Idee: Abspeicherung der Atrtributwerte spaltenweise –> Abfrage bei bestimmten Informationsbedürfnissen deutlich schneller als mit der herkömmlichen horzontaler Darstellung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Wie werden Anfragen bezüglich vertikaler und horizontaler Repräsentation gehandhabt?

A

Umtransponierung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wo knirscht es beim konvertieren von h2v bzw. v2h? hier v2h!!!!

A

(1) k muss auch generiert werden (wieviele Attribute gibt es überhaupt) –> Also Möglichkeit die Anzahl der Attribute abzufragen (2)Attributbezeichnung muss erst konstruiert werden (A1,A2,A3,Ai) indem man –> i in String konvertieren und an (Groß) A anhängen Aber: Möglichkeit der String-Manipulation nicht Bestandteil der relationalen Algebra (3) Attributbezeichnungen müssen stets unterschiedlich sein es würden doppelte im Zuge des Joins erzeugt werden (oid, val, val) siehe Folie Outerjoin Schritte (Folie 15) Spalten heißen alle ‘Val’. Es gibt Operator für Umbenennung in relationaler Algebra (Beta). Jedoch nicht mit Datenbank-Inhalt als Argument. –>–> Herkömmliche Systeme unterstützen das ganze nicht (1)(2)(3) –> erweiterungen erforderlich für Überführung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Unterschied herkömmlicher Operatoren (Join) zu neuen

A

Herkömmlicher Join – Tupel der Argumentrelation, die keinen „Joinpartner“ gefunden haben, gehen verloren. Outer Join ( ) – auch ‚partnerlose‘ Tupel weren gerettet. Left Outer Join ( ) – Tupel der linken Argumentrelation bleiben stets erhalten.

17
Q

Lassen sich “automatische” Umformungen zwischen den beiden Darstellungsmöglichkeiten (horizontal/vertikal) mir relationaler Algebra realisieren

A

Nein nur durch Erweiterungen möglich siehe –> Laufindex k, Ai mit String i, Attributkennzeichnungen ggf. doppelt Erweiterung, die gemeint sind: semi-strukturierte Datenmodelle –> XML