DBS Flashcards
Datenbanksystem
DBS
- ist die Sammlung von logisch zusammengehörigen Daten zu einem Sachgebiet
- besteht aus einer Anzahl von Datenbanken und dem DBMS
- Daten werden ausshließlich von dem DBMS der Datenbanksoftware verwaltet (also kein direkter Zugriff auf DBS)
- Daten der Datenbank bilden einen Ausschnitt aus der realen Welt ab
- auf die Daten können viele Benutzer gleichzeitig zugreifen
Datenbankmanagementsystem
DBMS
- ermöglicht: das Anlegen von Datenbanken, die Speicherung, Änderung und Löschung von Daten, das Abfragen der Datenbanken die Verwaltung von Benutzern, Zugriffen und Zugriffsrechten
- stellt die Schnittstelle zwischen der Datenbank
und deren Benutzern (z. B. den Anwendungsprogrammen) her
-gewährt einen effizienten und adäquaten Zugriff auf die Daten und sorgt dabei für eine zentrale Steuerung und Kontrolle - Schutz gegen Hard- und Softwarefehler gewährleistet (z.B bei Programm- und Systemabstürzen gehen Daten nicht verloren bzw. können wiederhergestellt werden
- verwaltet Daten und Zugriff darauf (sorgt dafür, dass dieselben Daten nicht gleichzeitig von mehreren Benutzern bearbeitet werden können)
Redundanzen
- Daten werden mehrfach gespeichert
(hohe Datenredundanz) - Änderungen aufwendig
Inkonsistenzen
- treten bedingt durch die Redundanzen auf
- Datenbestand fehleranfällig
- Änderungen von mehrfach gespeicherten Daten werden nur an einer Stelle vorgenommen
Datensatz
- zusammengehörige Informationen eine Sache betreffend
hierarchische Datenmodell
- entwickelt, um unterschiedlich lange Datensätze zu verarbeiten
- Datensätze werden so aufgeteilt, dass gleichartige Daten zu kleineren Datengruppen zusammengefasst werden; diese Gruppen bilden Knoten der Hierarchie
- für jeden Knoten wird in der Datenbank ein Datensatz angelegt
- baumartige Struktur, die stark hierarchisch geordnet ist
- jeder untergeordnete Knoten ist von seinem übergeordneten Knoten abhängig
- Struktur entspricht einer Vater-Kind-Beziehung
(V kann mehrere K haben, ein K aber nur einen V) - Struktur kann nicht ohne Wurzelknoten existieren
- heutzutaga kaum angewendet
Netzwerkdatenbanken
- beim Netzwerkmodell werden gleichartige Daten in Recordsets gespeichert, die miteinander in Beziehung stehen
- einem Record eines Recordsets können dabei mehrere Records eines anderen Recordsets zugeordnet werden
- erscheint als Pfeil in grafischer Darstellung
- durch diese Beziehung zwischen den Recordsets entsteht ein gerichteter Graph, der auch als Netzwerk bezeichnet wird
- die Beziehungen werden hier als Sets (Mengen) bezeichnet
- Sets sind in der Datenbank fest definiert
relationale Datenbanken
- am weitesten verbreitet
- Daten werden in Tabellenform gespeichert, in sogenannten Relationen
- zwischen den Relationen können Beziehungen definiert werden
- verschiedene Beziehungsarten möglich:
- unterscheiden sich durch die Anzahl der miteinander in Beziehung stehenden Datensätzen (Tabellenzeilen, Tupel)
- grafische Darstellung der Relationen und der zugehörigen Beziehungen erfolgt meist im Entity-Relationship-Modell (ERM)
f
Tupel
- eine Anzahl von geordneten Werten, die durch Kommata getrennt sind
externe Ebene
- hier erfolgt die Darstellung der Daten
- Teile der logischen werden so wiedergegeben, dass dem Benutzer nur die Daten zugänglich, mit denen er arbeiten darf
konzeptionale Ebene
- alle Daten eines Anwendungsbereichs zusammengefasst, die in der Datenbank gespeichert werden sollen
- auch die logischen zusammenhänge sowie Änderungsvorschriften für die Daten müssen beschrieben werden
interne Ebene
- ## beschreibt die Organisation der Daten auf den Speichermedien sowie die Zugriffsmöglichkeiten auf diese Daten
Data Dictionary (Komponente des DBMS)
- dient der Speicherung von Informationen über die Daten der Datenbank und deren Verwaltung (z.B Datenbankschema, die Schichten und die Zugriffsrechte auf die Datenbank
- Anwender kann darüber Informationen über die Datenbank erhalten und Leistungsanalysen durchführen lassen
Repositories (Komponente des DBMS)
- werden in größeren Datenbanken verwendet, da sie umfangreicher als Data Dictionaries sind
- enthalten zusätzlich zu den Infornationen des Dictionarys noch Informationen über die Benutzer und die Anwendungsprogramme
Der Inhalt des Data Dictionarys bzw. Repositories ist stark von DBS-Hersteller abhängig
Logbuch (Komponente des DBMS)
- Informationen über Transaktionsvorgänge sind hier verzeichnet (z.B Beginn und Ende der Transaktion und der Zustand der Daten zu Beginn der Transaktion)
- Info. des Logbuchs werden bei Systemfehlern zum Wiederherstellen der Datenbank verwendet
weitere Komponenten
-
zentralisierte DBS
- das gesamte DBMS und die Anwendungen auf einem zetralen Verwaltungsrechner/Zenralrechner (Host od. Mainframe) abgelegt
- in anderen Standorten befinden sich “dumme” Terminals, die nur der Ein- und Ausgabe dienen (wenig eigene Funktionalität)
- Datenbank ist im Vergleich zu verteilten Datenbanken relativ einfach zu administrieren
- bezüglich Antwortzeiten und Ausfallsicherheit kann es aber auf dem Zentralrechner zu Problemen kommen
- heutzutage werden als Endgeräte “intelligente” Arbeitsrechener eingesetzt; die Datenbankanwendungen und die Client-Software der DBS können zusammen auf diesem Rechner laufen, damit dem DBS ein Teil der Arbeit abgenommen werden kann (indem dort z.B. die Syntaxprüfung und die Optimierung der Abfrage durchgeführt werden)
verteilte DBS
- verteilte Datenbanken sind eine Menge von mehreren logisch zusammengehörigen (Teil-)Datenbanken, die in einem Netz auf mehreren lokal getrennten Computern gespeichert sind
- ein verteiltes DBMS besitzt Mechanismen zur Zusammenführung und Abfrage der verteilten Datenbanken
- durch die DBMS wird die Verteilung der Daten vor dem Anwender verborgen (dem Anwender erscheint es wie ein zentralisierteS DMS, da er nur auf der externen Ebene arbeitet)
- das 3-Ebenen-Modell muss erwitert werden; Aufteilung der Datenbanken auf die einzelnen Rechner muss darin deutlich werden, ebenso wie der Unterschied von homogen oder heterogen verteilten Datenbanken; Änderungen betreffen vor allem die konzeptionelle Ebene
verteilte DBS Vorteile/Nachteile
Vorteile
- lokale Anatomie (ermöglicht effektivere Anfragen, da die Daten dort gespeichert sind, wo sie gebraucht werden)
- Zuverlässigkeit und Verfügbarkeit (Ausfall eines Knotens führt nicht zum Ausfall des gesamten Systems; gezielte Redundanz erhöht die Zuverlässigkeit)
- Leistung (durch Parallelarbeit an verschiedenen Orten erhöht; Zugriffe können gleichzeitig durchgeführt werden und die Zugriffsposition besser festgelegt werden, da lokale Datenbanken kleiner sind)
- Erweiterbarkeit (des Systems, wie z.B. das Hinzufügen eines neuen Knotens, wird auf relativ einfachem Wege ermöglicht)
Nachteile
- Komplexität (der Aufgaben, z.B. Synchronisation, Bearbeitung von Anfragen usw., fast immer sehr hoch)
- dezentrale Verwaltung
- Sicherheit (ist zu gewährleisten, d.h. sowohl die Datensicherheit der lokalen Datenbanken als auch die Sicherheit im Netz, z.B. bei Datenübertragung, Zugriffen auf Daten usw.)
- Kosten (entstehen, vor allem für die Software und die Kommunikation)
- Übergang von zentralisierten auf verlteilten (verursacht Kosten durch den Umstieg auf neue Software; auch im Bereich der Hardware können Kosten entstehen, z.B. für eine neue Kommunikationsinfrastruktur; häufig ist neues Personal und deren Schulung erforderlich);
homogen verteilte DBS
- logisch zusammengehörige Datenbanken werden auf verschiedene Orte verteilt
- sie werden von derselben Datenbanksoftware verwaltet
heterogen verteilte DBS
- es sollen unterschiedliche Datenbanken, z.B. aus verschiedenen Unternehmen/-teilen/-abteilungen, zusammen verwaltet werden
- es soll auf die Daten mehrerer unterschiedlicher Datenbanken gleichzeitig zugegriffen werden
- Datenbanken können verschiedene Datenmodelle besitzen
- werden auch als Multidatenbanksysteme (MDBS) bezeichnet