K5 Die Standardsprache SQL Flashcards

Question

Anfragen: **Prädikate über Nullwerten**

Answer 1

**Attributspezifikation**: Es kann für jedes Attribut festgelegt werden, ob NULL-Werte zugelassen sind oder nicht **Verschiedene Bedeutungen von Nullwerten:** * Datenwert ist momentan nicht bekannt * Attributwert existiert nicht für ein Tupel

Answer 2

Häufige genutzte Alternativen zu Nullwerten * Defaultwerte (Risiko: Eingabe eines falschen Wertes) * Leere Zeichenkette, „None“, „Unbekannt“ oder spezielle Symbole wie „-“ oder „#“ bei Stringwerten * „- 1“ bei Attributen mit positiven Zahlen wie z.B. Alter, Gehalt * Untypische Werte wie „01.01.0000“ bei Datumsangaben Generelle Aspekte: * Welche Auswirkungen haben solche Alternativwerte auf Wertvergleiche, Aggregationen oder Statistikanalysen? * Inkonsequente Nutzung führt zu Inkonsistenzen (Konsequente Nutzung kann aber nur begrenzt vom System kontrolliert werden) * Bis auf Defaultwerte nicht auf Fremdschlüsselattribute anwendbar

Answer 3

Verwendung eines zusätzlichen Boolschen Attributes pro optionaler Eigenschaft * Belegung mit 1 wenn Eigenschaft existiert * Belegung mit 0 wenn Eigenschaft nicht existiert * Belegung mit Nullwert falls Existenz der Eigenschaft unbekannt ist Anm.: In den beiden letzten Fällen beinhaltet das eigentl. Attribut auch einen Nullwert * **Vorteil**: Löst Konflikt zwischen den Nullwertsemantiken „unbekannt“ und „nicht existent“ * **Nachteil**: Erhöht Komplexität von Schema und Anfragen sowie den Speicherbedarf

Answer 4

* möglichst große Unabhängigkeit der DB-Anwendungen von speziellen DBS * einheitliche Sprachschnittstelle genügt nicht! * Beschreibung der gespeicherten Daten und ihrer Eigenschaften nach einheitlichen und verbindlichen Richtlinien ist genauso wichtig

Answer 5

* Mit Hilfe dieser Lösung kann die Personal-Hierarchie eines Unternehmens dargestellt werden; die referentielle Beziehung stellt hier eine partielle Funktion dar, da die „obersten“ Manager einer Hierarchie keinen Manager haben * MNR ... NOT NULL lässt sich nur realisieren, wenn die „obersten“ Manager als ihre eigenen Manager interpretiert werden; dadurch treten jedoch Referenzzyklen auf, was die Frageauswertung und die Konsistenzprüfung erschwert * Welche Beziehungsstruktur erzeugt MNR ... UNIQUE NOT NULL?

Answer 6

* Relationenmodell ‚hat‘ wertbasierte Beziehungen (im Gegensatz hierzu haben objektorientierte Datenmodelle referenzbasierte Beziehungen) * Fremdschlüssel (FS) und zugehöriger Primärschlüssel/Schlüsselkandidat (PS/SK) repräsentieren eine Beziehung (gleiche Wertebereiche!) * Alle Beziehungen (FS ↔ PS/SK) sind binär und symmetrisch * Auflösung einer Beziehung geschieht durch Suche * Es sind i. allg. k (1:n)-Beziehungen zwischen zwei Relationen möglich

Answer 7

* **Primärschlüsselbedingung**: Eindeutigkeit, keine Nullwerte! * **Fremdschlüsselbedingung**: Zugehöriger PS (SK) muss existieren

Answer 8

Operationen in der Sohn-Relation * Einfügen eines Sohn-Tupels * Ändern des FS in einem Sohn-Tupel * Löschen eines Sohn-Tupels * Welche Maßnahmen sind erforderlich? * Beim Einfügen erfolgt eine Prüfung, ob in einem Vater-Tupel ein PS/SK-Wert gleich dem FS-Wert des einzufügenden Tupels existiert * Beim Ändern eines FS-Wertes erfolgt eine analoge Prüfung * Löschen erfordert keine Maßnahme Operationen in der Vater-Relation * Löschen eines Vater-Tupels * Ändern des PS/SK in einem Vater-Tupel * Einfügen eines Vater-Tupels (unproblematisch) * Welche Reaktion ist wann möglich/sinnvoll? * Verbiete Operation * Lösche/ändere rekursiv Tupel mit zugehörigen FS-Werten * Falls Sohn-Tupel erhalten bleiben soll (nicht immer möglich, z.B. bei Existenzabhängigkeit), setze FS-Wert zu NULL oder Default Wie geht man mit NULL-Werten um? (Wdh.) * Spezielle Semantiken von NULL-Werten * Dreiwertige Logik verwirrend: T, F, ? * Setzung: NULL ≠ NULL (z. B. beim Verbund) * bei Operationen: Ignorieren von NULL-Werten

Answer 9

FOLIEN 102-109

Answer 10

Statische Schemaanalyse zur Feststellung sicherer DB-Schemata * nur bei einfach strukturierten Schemata effektiv * hohe Komplexität der Analysealgorithmen * bei wertabhängigen Konflikten zu restriktiv (konfliktträchtige Schemata) Dynamische Überwachung der Modifikationsoperationen * durchspielen aller Ausführungsreihenfolgen (können weit mehr als 2 sein!) * hoher Laufzeitaufwand * häufig unnötig, da Reihenfolgeabhängigkeiten eher selten auftreten Vorgehensweisen: 1. Falls Sicherheit eines Schemas festgestellt werden kann, ist keine Laufzeitüberwachung erforderlich 2. Alternative Möglichkeiten zur Behandlung konfliktträchtiger Schemata, nach dem die statische Schemaanalyse die Sicherheit des Schemas nicht feststellen konnte * sie werden verboten, oder * sie werden erlaubt und * die referentiellen Aktionen werden bei jeder Operation dynamisch überwacht * falls ein Konflikt erkannt wird, wird die Operation zurückgesetzt

Answer 11

Wachsender oder sich ändernder Informationsbedarf * Erzeugen/Löschen von Tabellen (und Sichten) * Hinzufügen, Ändern und Löschen von Spalten * Anlegen/Ändern von referentiellen Beziehungen * Hinzufügen, Modifikation, Wegfall von Integritätsbedingungen Hoher Grad an logischer Datenunabhängigkeit ist sehr wichtig! Zusätzliche Änderungen im DB-Schema durch veränderte Anforderungen bei der DB-Nutzung * Dynamisches Anlegen von Zugriffspfaden * Aktualisierung der Zugriffskontrollbedingungen

Answer 12

**Ziel**: Festlegung * welche Daten Benutzer wie sehen wollen (Vereinfachung, leichtere Benutzung) * welche Daten sie nicht sehen dürfen (Datenschutz) * einer zusätzlichen Abbildung (erhöhte Datenunabhängigkeit) Sicht (View) * mit Namen bezeichnete, aus Tabellen abgeleitete, virtuelle Tabelle (Anfrage) Korrespondenz zum externen Schema bei ANSI/SPARC (Benutzer sieht jedoch i. allg. mehrere Sichten (Views) und Tabellen)

Answer 13

* Sicht kann wie eine Tabelle behandelt werden * Sichtsemantik: „dynamisches Fenster“ auf zugrundeliegende Tabellen * Sichten auf Sichten sind möglich * eingeschränkte Änderungen: aktualisierbare und nicht-aktualisierbare Sichten

Answer 14

Sichten werden i. allg. nicht explizit und permanent gespeichert, sondern SichtOperationen werden in äquivalente Operationen auf Tabellen umgesetzt Vorgehen: Sichtname wird durch seine Definition (d.h. eine Anfrage) ersetzt

Answer 15

* Einfügungen und Änderungen müssen das die Sicht definierende Prädikat (WHERE-Klausel der zugehörigen CREATE-VIEW-Anweisung) erfüllen, sonst Zurückweisung * nur auf änderbaren Sichten definierbar Spezifikationsmöglichkeiten * Weglassen der CHECK-Option * WITH CASCADED CHECK OPTION oder äquivalent WITH CHECK OPTION * WITH LOCAL CHECK OPTION Annahmen * Sicht S_A mit dem die Sicht definierenden Prädikat V_A wird aktualisiert * S_I ist die höchste Sicht im Abstammungspfad von S_A, die die Option CASCADED besitzt * Oberhalb von S_I tritt keine LOCAL-Bedingung auf Aktualisierung von S_A * als Prüfbedingung wird von S_I aus an S_A“vererbt”: V = V_I ⋀ V_I-1 ⋀ . . . ⋀ V₁ * erscheint irgendeine aktualisierte Zeile von S_A nicht in S_I, so wird die Operation zurückgesetzt * Es ist möglich, dass Zeilen aufgrund von gültigen Einfüge- oder Änderungsoperationen aus S_A verschwinden Aktualisierte Sicht besitzt WITH CHECK OPTION * Default ist CASCADED * Als Prüfbedingung bei Aktualisierungen ergibt sich V = V_A ⋀ V_N ⋀ . . . ⋀ V_I ⋀ . . . ⋀ V₁ * Zeilen können jetzt aufgrund von gültigen Einfüge- oder Änderungsoperationen nicht aus SA verschwinden LOCAL hat eine undurchsichtige Semantik * wird hier nicht diskutiert * Empfehlung: nur Verwendung von CASCADED

Answer 16

* Beschleunigung der Suche: Zugriff über Spalten (Schlüsselattribute) * Kontrolle von Integritätsbedingungen (relationale Invarianten) * Zeilenzugriff in der logischen Ordnung der Schlüsselwerte * Gewährleistung der Clustereigenschaft für Tabellen * Aber auch: erhöhter Aktualisierungsaufwand und Speicherplatzbedarf

Answer 17

* Phys. Datenunabhängigkeit des Relationenmodells erlaubt ein Hinzufügen und Löschen * jederzeit möglich, um z. B. bei veränderten Benutzerprofilen das Leistungsverhalten zu optimieren * “beliebig” viele Indexstrukturen pro Tabelle und mit unterschiedlichen Spaltenkombinationen als Schlüssel möglich * Steuerung der Eindeutigkeit der Schlüsselwerte und der Clusterbildung * Freiplatzanteil (PCTFREE) in jeder Indexseite beim Anlegen erleichtert das Wachstum * Spezifikation: DBA oder Benutzer

Answer 18

(wird von meisten DBVS angeboten!) * dynamische Reorganisation durch Aufteilen (Split) und Mischen von Seiten * Wesentliche Funktionen * direkter Schlüsselzugriff auf einen indexierten Satz * sortiert sequentieller Zugriff auf alle Sätze (unterstützt Bereichsanfragen, Verbundoperation usw.) * Balancierte Struktur * unabhängig von Schlüsselmenge * unabhängig von Einfügereihenfolge

Answer 19

SQL-Anfragen * Mengenorientierte Spezifikation, verschiedene Typen von Anfragen * Vielfalt an Suchprädikaten * Auswahlmächtigkeit von SQL ist höher als die der Relationenalgebra * Erklärungsmodell für die Anfrageauswertung: Festlegung der Semantik von Anfragen mit Hilfe von Grundoperationen * Optimierung der Anfrageauswertung durch das DBS Mengenorientierte Datenmanipulation Datendefinition * CHECK-Bedingungen für Wertebereiche, Attribute und Relationen * Spezifikation des Überprüfungszeitpunktes

Answer 20

Kontrolle von Beziehungen * SQL erlaubt nur die Spezifikation von binären Beziehungen. * Referentielle Integrität von FS --\> PS/SK wird stets gewährleistet. * Rolle von PRIMARY KEY, UNIQUE, NOT NULL * Es ist nur eine eingeschränkte Nachbildung von Kardinalitätsrestriktionen möglich; insbesondere kann nicht spezifiziert werden, dass „ein Vater Söhne haben muss“. Wartung der referentiellen Integrität * SQL2/3 bietet reichhaltige Optionen für referentielle Aktionen * Es sind stets sichere Schemata anzustreben * Falls eine statische Schemaanalyse zu restriktiv für die Zulässigkeit eines Schemas ist, muss für das gewünschte Schema eine Laufzeitüberwachung der referentiellen Aktionen erfolgen.

Answer 21

Schemaevolution * Änderung/Erweiterung von Spalten, Tabellen, Integritätsbedingungen, ... Sichtenkonzept * Erhöhung der Benutzerfreundlichkeit * Flexibler Datenschutz * Erhöhte Datenunabhängigkeit * Rekursive Anwendbarkeit * Eingeschränkte Aktualisierungsmöglichkeiten Indexstrukturen als B\*-Bäume * direkter Schlüsselzugriff auf einen indexierten Satz * sortiert sequentieller Zugriff auf alle Sätze (unterstützt Bereichsanfragen, Verbundoperation usw.)