Daten und Datenbanken Flashcards
Def Daten
Folge maschineller Zeichendie Objekte und Objektbeschreibungenbeschreiben und repräsentieren können,werden durch Kontext zu Informationen
Daten können klassifiziert werden nach?(+Beispiel)
- Zeichenart/Datentyp (numerisch, alphabetisch, alphanumerisch
- Erscheinungsform (akustisch, bildlich, textuell)
- Formatierung (formatiert, unformatiert (wenn wir wissen, wie die Daten aufgebaut sein müssen))
- Stellung im Verarbeitungsprozess (Ein- und Ausgabedaten)
- Verwendungszweck ( Stammdaten- stabil wie Name, Bewegungsdaten-dauernde veränderung wie Lagerbestände, Transferdaten-Daten die System verlassen)
Anforderung an Daten
ohne Redundanz gespeichert (nicht zwei mal gespeichert)
Konsistenz (Übereinstimmend, wenn es 2x da ist)
ohne Redundanz gespeichert (nicht zwei mal gespeichert)
Datei- vs. Datenbankorganisation
Dateiorganisation: unterschiedliche Programme greifen auf eigene, physisch vorhandene Dateien zu, dadurch entsteht viel Redundanz, sowie Inkonsistenz
Datenbanken lösen dieses Problem, indem Dateien zentral gespeichert werden und alle Programme auf Datenbank zugreifen
Welche Aufgabe erfüllt das DBMS in der Datenbankorganisation?
DBMS (Datenbankverwaltungssystem) stellt den Programmen die jeweils erforderlichen logischen Dateien zur Verfügung, physisch sind die Daten jedoch redundanzfrei und konsistent in der DB abgelegt
(siehe Abbildung V3/S10)
Vorteile Datenbankorganisation?
- Trennung logische Strukturierung und Physische Datenspeicherung
- Unabhängigkeit der Daten von einzelnen Programmen, die auf sie zugreifen
Die drei Ebenen Architektur
–> Abstraktionsebenen bei der Formulierung von Daten und Datenbeziehungen
Externe Sicht - Dialogbetrieb/Stapelbetrieb - QL/DML
Konzeptionelle Sicht - Logische D.-Orga - DDL
Interne Sicht - Physische Datenorganisation - DSDL
Anforderungen an Datenbanksysteme
1+2. Redundanz kleinstmöglich (though manchmal für Schnelligkeit unvermeidbar) + Konsistenz
3. Datenbankintegrität (korrektheit/Vollständigkeit)
Semantische Integrität: Vermeidung Fehleingaben
Operative Integrität: Vermeidung von Fehlern
aufgrund mehrere Anwender
- Datenschutz (verhinderung unberechtigter Verwendung)
- Datensichterheit (Verhinderung von Verfälschung, Vernichtung und unberechtigtem Zugriff)
- Ausfallsicherheit (Routinen zur Wiederherstellung der Datenkonsistenz nach Fehler im Betrieb)
Def
Datenfeld
Datensatz
Datei
Datenfeld ist die kleinste logische Dateneinheit auf die zugegriffen wird (zb Artikelnummer)
–> diese sind zusammengefasst zu Datensätzen (zb Artikelnummer+Name+Preis)
–> alle gleichartigen Datensätze werden in einer Datei gespeichert (zb. diese Infos zu mehreren Artikeln)
Def: (Primär)Schlüssel
bestehen aus einem oder mehreren Datenfeldern, die einen Datensatz eindeutig identifizieren
Primärschlüsseldienen der eindeutigen Indentifizierung der Datensätze, werden meist künstlich eingeführt (wie Personalnummern)
alle Schlüssel die nicht Primärschlüssel sind sind Sekundärschlüssel
Relationen
Relationen sind das zentrale strukturelement relationaler Datenbanken
können in zweidimensionaler Tabelle mit fester Anzahl Spalten und beliebiger Anzahl Zeilen dargestellt werden
Verknüpfungen erfolgen über Primärschlüssel
Realisierung relationaler Datenbanken
Zur implementierung braucht es…
…auf der konzeptuellen Ebene zwei Schritte:
- Datenmodellierung
- möglichst exakte Beschreibung des abzubildenden Realitätsausschnitts
- Ableitung von sachlogischen Objekten (zB Kunden und Artikeldaten) und Beziehungen zwischen diesen - Transfer in geeignetes Datenbankmodell
- Anlegen von Tabellen etc.
- Standard dabei relationale Datenbank (existiert jedoch auch hierarchische etc.)
Definition und Zweck Data Warehouse
Def: Sammlung aus integrierten, zeitabhängigen und nicht-volatilen Daten, aus denen Informationen für Managemententscheidungen gewonnen werden
–> meist OLAP-Datenbanken im Zentrum
integriert - aus untersch. Datenquellen
Zeitabhängig - mit Zeitstempel versehen
nicht-volatil - Daten werden nicht mehr verändert
Struktur Data Warehouse
–> Datenmanagement (Zugang und Umformung)
- interne wie externe Daten, Transformation
–> Datenorganisation (physisch und logisch)
- Speicherung gemäß Datenmodell, Zugriff,
Aktualisierung/Wartung
–> Aufbereitung/ Auswertung
- Data Mining, Visualisierung, Individuelle Anwendung
Detaillierte Architektur Data Warehouse System
siehe V3/S22