03 - Concurrency und Recovery Flashcards by Felix Hackenbruch

Definition: Recovery

Wiederherstellung von Daten bei schweren Fehlern (entweder Hardware Fehler oder Software Fehler)

How well did you know this?

Not at all

Perfectly

Backup-Strategien (3)

1) Komplett-Backups
2) Inkrementelle Backups
3) Differenzielle Backups

How well did you know this?

Not at all

Perfectly

Vorteile: Komplett-Backups (1)

1) Relativ einfaches zwischenspeichern von Backups (da Daten immer komplett vorhanden sind).

How well did you know this?

Not at all

Perfectly

Nachteile: Komplett-Backups (2)

1) Große Datenmengen, da jeder Backupstand alle Daten enthält.
2) Erstellen eines Backups dauert relativ lang –> Zeitraum zwischen 2 Backups kann nicht beliebig klein sein.

How well did you know this?

Not at all

Perfectly

Vorteile: Inkrementelle Backups (1)

1) Jeder Backup ist schnell erledigt und beansprucht keine hohen Datenmengen.

How well did you know this?

Not at all

Perfectly

Nachteile: Inkrementelle Backups (1)

1) Zurückspielen des Backups deutlich mühsamer.

How well did you know this?

Not at all

Perfectly

Definition: Komplett-Backups

Bei jedem Backup wird hier der komplette Datenstand gespeichert.

How well did you know this?

Not at all

Perfectly

Definition: Inkrementelle Backups

Es wird immer nur ein Teil der Datenbank inkrementell für jedes Backup gesichert (z.B. ein Teil pro Wochentag).

How well did you know this?

Not at all

Perfectly

Definition: Differenzielle Backups

Hier wird der Unterschied zwischen dem letzten Komplett-Backup gespeichert. Dabei wird jede Änderung in einer Logdatei Protokolliert.

How well did you know this?

Not at all

Perfectly

Definition: Metadaten

Daten, die Informationen zu und Zustände über eine Datenbank merken (z.B. Informationen zu laufenden Transaktionen).

How well did you know this?

Not at all

Perfectly

Definition: Datenbankpuffer

Änderungen in der Datenbank werden hier (im Arbeitsspeicher) zwischengespeichert und eingeschrieben, da es performanter ist. Dennoch werden die Daten asynchron aktualisiert. Jede Änderung die an den Daten vorgenommen wird, erfolgt im Datenbankpuffer, so spart man sich das ständige I/O von den zugehörigen Datenbanken.

How well did you know this?

Not at all

Perfectly

Definition: Before-Image

Ein Before-Image gibt den Zustand vor einer Transaktion wieder und bezieht sich nur auf die betroffenen Datensätze.

How well did you know this?

Not at all

Perfectly

Definition: After-Image

Ein Before-Image gibt den Zustand nach einer Transaktion wieder und bezieht sich nur auf die betroffenen Datensätze.

How well did you know this?

Not at all

Perfectly

Bestandteile: Arbeitsspeicher DBMS (2)

1) Puffer (Cache)

2) Metadaten

How well did you know this?

Not at all

Perfectly

Definition: Logdatei

Hier werden alle Datenänderungen vom Puffer festgeschrieben und persistiert (Before- und After-Images und die dazugehörigen Metadaten).

How well did you know this?

Not at all

Perfectly

Schritte: Einfache Transaktion (7)

Study These Flashcards

1) Lesen der Daten
2) Merken der Bisherigen Daten
3) Ändern der Daten
4) Merken der geänderten Daten
5) Transaktion wird durchgeführt
6) Transaktionsende COMMIT/ROLLBACK
7) Änderungen in die Datenbank/en schreiben

Vorteile: Puffering (3)

Study These Flashcards

1) Minimaler I/O Verkehr
2) Werden Daten mehrmals geändert, so müssen diese nicht jedes Mal geschrieben werden
3) Werden gelesene Daten wieder gelesen, so stehen diese bereits zur Verfügung

Nachteile: Puffering (1)

Study These Flashcards

1) Dauerhaftigkeit der Daten ist nur von den Logdateien abhängig.

Definition: Undo-Log

Study These Flashcards

Eine Logdatei, die alle Before-Images und dazügehörigen Metadaten enthält. Ein Eintrag im Undo-Log muss nur bis zum Transaktionsende aufgehoben werden.

Definition: Redo-Log

Study These Flashcards

Eine Logdatei, die alle After-Images und dazügehörigen Metadaten enthält. Ein Eintrag im Redo-Log muss bis zur nächsten Backup aufgehoben werden.

Definition: Checkpoints

Study These Flashcards

Zeitpunkte zu der alle geänderten Daten zwangsweise in die Datenbank geschrieben werden.

Nachteile: Checkpoints (2)

Study These Flashcards

1) Die hohe I/O-Last behindert alle Transaktionen

2) Bei jedem Checkpoint steigen die Antwortzeiten

Definition: Concurency

Study These Flashcards

Hier geht es um den Parallelbetrieb in Datenbanken. Concurrency arbeitet nach der Regel, dass jede Transaktion so ablaufen muss, als sei sie allein im System. Des weiteren sollte jede Transaktion Ergebnisse liefern, die unabhängig von anderen Transaktionen sind.

Concurrency Probleme (3)

Study These Flashcards

1) Problem der verlorengegangenen Änderung
2) Problem der Abhängigkeit von nicht abgeschlossenen Transaktionen
3) Problem der Inkosistenz der Daten

Grundidee zu Locks in Datenbanken

Es soll für jede Relation ein Lock geben, für die sich eine Transaktion Zugriff anfragen muss und somit das Lock belegen muss. Sobald dieses belegt ist, darf keine andere Transaktion auf die gesperrte Relation zugreifen und wird in eine Warteschlange geschickt.

Sperrgranularität in Datenbanken

Man muss sich für das DBMS entscheiden wie fein granuliert man Sperren einführen möchte. Man kann entweder eine gesamte Relation sperren, die Tupel oder nur einzelne Einträge. Dennoch sollte nicht zu viel gesperrt werden, sodass die Parallelität komplett verloren geht. In der Praxis eignet man sich oft für eine Tupelsperre.

Definition: Share-Lock

Hier wird die Sperre unter mehreren Transaktionen geteilt, und soll dafür sorgen, das diese Transaktionen lesenden Zugriff haben, aber keine Änderungen vornehmen.

Definition: Exclusive Lock

Diese Sperre ist für Änderungen (Schreiben) vorgesehen und lässt deswegen nur eine Transaktion zu einem gewissen Zeitpunkt diese Sperre belegen.

Definition: Deadlocks bei Transaktionen

Eine Verklemmung, bei der mindestens zwei Transaktionen gegenseitig auf die Freigabe eines oder mehrerer Locks warten.

Welches der 3 Probleme lösen Sperren

Sperren lösen tatsächlich nur das Problem der Abhängigkeit von nicht abgeschlossenen Transaktionen. Bei den anderen 2 hofft man einfach nicht auf Deadlocks oder man löst sie manuell.

Vorgehensweise: Deadlockauflösung

1) Wartezeiten beobachten und bei abnormalen Wartezeiten die Transaktion mit Fehler abbrechen 2) Hiernach einen Wartegraph zeichnen um zu prüfen ob ein geschlossener Graph (Transaktionen verweisen immer aufeinander) 3) Eine beliebige Transaktion im Graphen zurücksetzen bzw. neu starten 4) Jetzt können alle Locks weider freigegeben werden.

Definition: Problem der Verlorengegangenen Änderung

Zwei Transaktionen ändern (fast) gleichzeitig. Eine Änderung geht verloren da die spätere Transaktion die Änderung zu schnell überschreibt.

Definition: Problem der Abhängigkeit von nicht abgeschlossenen Transaktionen

Daten werden gelesen, die mittels Rollback zurückgesetzt werden.

Definition: Problem der Inkonsistenz der Daten

Fehlerhafte Daten werden gelesen, wenn andere Transaktionen gleichzeitig ändern

03 - Concurrency und Recovery Flashcards

(34 cards)