9 Datenspeicherung Flashcards
Daten
Information (d.h. Angaben über Sachverhalte oder Vorgänge) aufgrund bekannter oder unterstellter Abmachung in einer maschinell verarbeiteter Form
Digitale Daten
Daten, die durch Zeichen repräsentiert werden
Zeichen
Ein Element aus einer zur Darstellung von Information vereinbarten endlichen Menge von verschiedenen Elementen, dem sogenannten Zeichenvorrat (Alphabet)
Binärzeichen / Bit
Zeichen aus einem Zeichenvorrat von zwei Zeichen; zur Darstellung von Bits können beliebige Zeichen benutzt werden - wir verwenden die Zeichen 0 (binäre Null) und 1 (binäre Eins)
Byte
Kleinste adressierbare Einheit auf den heute üblichen Rechnersystemen, entspricht einer Folge von 8 Bits
Stellenwertsystem
Zahlensystem, bei dem der Wert einer Ziffer innerhalb einer Ziffernfolge von ihrer Stellung / Position abhängt
Dualsystem
Stellenwertsystem mit der Basis 2, verwendet zur Darstellung von Werten zwei verschiedenen Ziffern
Repräsentationsgröße
Datenmenge für ein Datenelement (in Bits oder Bytes), die letztendlich bestimmt, wie viele unterschiedliche Werte in dem Datenelement dargestellt werden können
Festkommadarstellung
Form der ziffernweisen Codierung, bei der an einer gedachten Stelle das Komma eingefügt wird; die Position des Kommas wird getrennt gespeichert
Bsp: 1VZ 000 0000 0000Vorkommastelle 1VIRGULA011Nachkommastellen = -(1.011)2
Gleitkommadarstellung
Form der Codierung von Kommazahlen, bei der jede Kommazahl durch den Zahlenwert (Mantisse) und eine Größenordnung (Exponent) dargestellt wird
Mai complex decat Festkommastelle; prezinta nr aprox
VZ + Exponent + Mantisse
Mantisse * Exponent la o respectiva putere iti da nr tau
Zeichensatz
Bestimmt eine mögliche Zeichencodierung; Durch einen Zeichensatz wird jedem Zeichen ein Zahlenwert zugewiesen, der die Position des Zeichens innerhalb des Zeichensatzes bestimmt - dieser Zahlenwert wird auch meistens bei der Sortierung von Texten, die durch den Zeichensatz dargestellt werden, herangezogen
Unicode
International genormter Zeichensatz für die einheitliche Codierung von Textdokumenten in allen Sprachen und Kulturen der Erde; Unicode wird gemeinsam von dem Unicode-Konsortium und dem ISO/IEC - Standardkomitee 10646 definiert
UTF-8 (better than ASCII)
Byteorientierte Codierung von Unicode, die unter anderem aus Kompatibilitätsgründen zu existierenden Systemen mit 8-Bit-Zeichen entwickelt wurde; bei der UFT-8-Codierung besitzen unterschiedliche Zeichen unterschiedliche Repräsentationsgrößen, wobei die häufigsten Zeichen in acht Bits codiert werden
Datenelement
Speicherbereich, der einen Namen, einen Inhalt und einen Datentyp besitzt; der Name dient zur Identifikation eines Datenelements
Datentyp
Bestimmt, welche Operationen mit Werten dieses Typs durchgeführt werden können und wie die Werte im Rechner repräsentiert werden
Variable
Datenelement, dessen Werte durch Operationen verändert werden können
Konstanten
Unveränderliche Datenelemente
Aggregation
Zusammenfassung von mehreren Bestandteilen zu einem Ganzen
Datensatz
Aggregation von unterschiedlichen Datenelementen;
Datenfeld
Ein Datenfeld ist die Aggregation von gleichartigen Datenelementen
Zeiger
Verweis (eine Referenz) auf eine Speicheradresse; diese Speicheradresse entspricht dem Ort, an dem der Wert des referenzierten Datenelements gespeichert ist
Referinta catre o zona de memorie
Datenstruktur
Summe aller elementaren und komplexen Datenelemente inklusive ihrer Referenzen
Graph
Datenstruktur, die aus Knoten und Kanten aufgebaut ist, wobei die Knoten durch Kanten verbunden sind
Gerichteter Graph
Kanten werden nur in einer Richtung durchlaufen, andernfalls ist der Graph ungerichtet
Gerichteter azyklischer Graph
Gerichteter Graph, in dem keine Zyklen erlaubt sind
Pfad
Weg in einem Graphen, der ausgehend von einem Knoten über eine oder mehrere Kanten zu einem Zielknoten führt
Lant, nu ai voie sa treci de 2 ori prin acelasi Knoten
Baum
Ein gerichteter azyklischer Graph mit Wurzelknoten, bei dem jeder Knoten maximal einen Vorgängerknoten besitzt
Organigram
Ordnung (Grad) eines Graphen
Bestimmt die maximale Anzahl der unmittelbaren Nachfolger des Knoten
Baum der Ordnung zwei
=> Binärbaum (fiecare Knoten poate sa aiba max 2 Kinder; poate sa aiba si 1 si 0)
Lineare Liste
Graph der Ordnung eins.
Jedes Listenelement besitzt maximal einen unmittelbaren Vorgängerknoten und maximal einen unmittelbaren Nachfolgerknoten
1-> 2-> 3 bla bla
Datenbank
Zentral verwalteter Datenbestand, der über anwendungsunabhängige Zugriffsverfahren nutzbar gemacht wird
Datenbankverwaltungssystem (DBMS)
Verwaltet den Datenbestand und ermöglicht gleichzeitige Zugriffe von mehreren Benutzern
Transaktion
Zusammengesetzte Datenbankoperation, die durch mehrere Einzelschritte durchgeführt wird
Externes Schema
Abgegrenzte, anwendungs- und benutzerspezifische Sicht auf eine Datenbank, die jeweils genau an die spezifischen Bedürfnisse angepasst ist
Interne Schicht
Definition der physischen Datenorganisation (physische Anordnung der Daten auf den Speichermedien) und der Zugriffspfade
Relationales Datenmodell
Konkretes Datenmodell bestehend aus Relationen; jede Relation besitzt eine Namen und enthält Attribute - die entsprechenden Werte werden in Tabellen gespeichert, wobei jede Spalte der Tabelle die Werte für ein bestimmtes Attribut und jede Zeile (Tupel) zusammengehörige Werte für eine Ausprägung repräsentiert - der Name der Tabelle entspricht dem Namen der Relation
Relationales Schema
Summe der Relationen eines Anwendungsbereichs; die entsprechenden Tabellen bilden gemeinsam eine relationale Datenbank - die Verwaltung dieser wird von einem relationalen DBMS / RDBMS vorgenommen; das Relationenmodell unterstützt allgemeine, deskriptive Datenbanksprachen, mittels derer Datenbank erstellt, verändert und abgefragt werden können
Funktionale Abhängigkeit
Abhängigkeit zw Attributen von Relationen; eine funktionale Abhängigkeit besteht zw den Attributmenge X und Y dann, wenn für jede Ausprägung von X eine eindeutige Ausprägung von Y existiert - man sagt “X bestimmt Y” oder “Y hängt funktional von X ab”
Inklusionsabhängigkeit
Abhängigkeit zw Attributen von Relationen; diese definiert, dass sämtliche Ausprägungen einer Attributmenge in den Ausprägungen einer anderen Attributmenge enthalten sein müssen
Normalisierung
Gestaltungsvorschrift für ein relationales Schema, bei dem die Attribute derart auf Relationen verteilt werden, dass beim Einfügen, Löschen oder Ändern von Datensätzen keine Inkonsistenzen auftreten
Structured Query Language (SQL)
Definitions- und Abfragesprache für relationale Datenbanksysteme; SQL ist eine sogenannte relationen-algebraische Sprache die mächtige Ausdrucksmittel zur Abfrage und Verknüpfung von Tabellen zur Verfügung stellt - ist, also, mengenstrukturiert und deskriptiv
Hierarchisches Datenmodell
Konkretes Datenbankmodell auf Basis von Baumstrukturen; die Knoten der Baumstruktur (Segmente/Records) des zugehörigen Schemas entsprechen den Satztypen mit Attributen; die Satztypen werden durch eine Eltern-Kind-Beziehung verknüpft, wobei jeder Elternknoten beliebig viele Kindknoten besitzen darf
Netzwerkdatenmodell
Konkretes Datenbankmodell auf Basis von gerichteten Graphstrukturen; die Knoten des Graphen des zugehörigen Schemas entsprechen den Satztypen (Records) mit ihren Attributen, die Kanten definieren Beziehungstypen (Sets) zw assoziierten Satztypen; jeder Knoten kann über mehrere Kanten in Beziehung mit anderen Knoten stehen - diese Beziehungen zw Ausprägungen der Satztypen werden durch Satzzeiger (Adressverweise) realisiert, die auch einen zusätzlichen Rückverweis besitzen
Strukturiertes Dokument
Datenstruktur in Form eines Dokuments, das die gemeinsame Darstellung von semantisch zusammen gehörenden Daten ermöglicht; diese Datenstruktur unterstützt die Speicherung, Übertragung und (teil)automatisierte Weiterverarbeitbarkeit; die Textelemente werden durch eine Startmarkierung eingeleitet, welche die Art der enthaltenen Daten bestimmt, und durch eine Endemarkierung abgeschlossen
XML
Metasprache für die Definition von anwendungsspezifischen Auszeichnungssprachen; mittels XML können Auszeichnungssprachen für beliebige Anwendungsbereiche maßgeschneidert werden, die anwendungsspezifische Datenstrukturen beschreiben - hierfür werden Dokumenttypen definiert, die eine Klasse von XML Dokumenten in ihrem Aufbau und ihren Inhalten festlegen
=> e un fel de basis pentru HTML, un fel de baza pe care se construieste html
Wohlgeformtes XML Dokument
XML Dokument, das in seinem Aufbau den syntaktischen Regeln von XML entspricht
XML Schema
Empfehlung vom W3C zur Definition vom XML Dokumenttypen: ermöglicht Werteeinschränkungen von nicht strukturierten Elementen
=> cu metasprache asta build alte sprachen
DOM
Standardisierte Programmierschnittstelle, über die programiersprachenunabhängig XML Strukturen verarbeitet werden können; bei der Verarbeitung mittels DOM wird das gesamte XML Dokument als eine Ojbektstruktur mit eingeschachtelten Unterobjekten betrachtet - über die DOM Schnittstelle werden Methoden zum Durchwandern, Auslesen, Einfügen und Löschen von Knoten der Dokumentstruktur bereitgestellt
Library/ tool care permite limbajului XML sa citeasca, stearga, editeze bla bla Baumstrukturen
XPath
Einfache Abfragesprache für XML Dokumente; Empfehlung vom W3C
=> interogheaza: exista nodul respectiv? care este persoana cu cel mai mare salariu bla bla deci, language for navigating in XML docs
XQuery
Mächtigere Abfragesprache für XML Dokumente, die vom W3C standardisiert wurde; basiert sich auf XPath und erlaubt die Verknüpfung von mehreren XML Dokumenten in einer Abfrage
=> tabele la Access
XSLT
Sprache zur Transformation von XML Dokumente, die vom W3C standardisiert wird; hierbei wird ein XML Dokument gemäß der mittels XSLT definierten Regeln in ein Zieldokument umgeformt - die Regeln werden in XML formuliert - die umzuformenden Bestandteile des Ausgangsdokuments werden von XSLT über XPath Ausdrücke referenziert
=> language for transforming XML docs into XHTML docs or others
Metadaten
Daten über Daten; Metadaten beschreiben Dateninhalte anhand eines bestimmten, kontrollierten Vokabularus - das Vokabular definiert, welche Attribute für welche Dateninhalte vergeben werden können
RDF (resource description framework)
Allgemeines Metadatenformat für Information, die im Internet verfügbar ist; jedes Dokument das im Internet mittels Webadresse URL adressierbar ist, wird in RDF als Ressource bezeichnet; mittels RDF können Aussagen über Ressourcen durch ein vorgegebenes Vokabular (RDF Schema) formuliert werden
Linked Open Data
Frei zugängliche und frei verwendbare Daten, die über das Internet bezogen werden können, und die mittels RDF beschrieben sind
Big Data
Schlagwort für Datenkollektionen, deren Größe die Fähigkeiten einzelner Rechnersysteme überschreiten, diese Datenmenge zu speichern, zu durchsuchen, zu analysieren und zu verwalten
Verteiltes Datenbanksystem
Datenbanksystem, das für die Speicherung, Abfrage und Verwaltung eines Datenbestands mehrere getrennte Rechner verwendet, die über ein Kommunikationsnetzwerk miteinander verbunden sind
CAP Theorem
Lehrsatz, der besagt, dass es in einem verteilten System unmöglich ist, gleichzeitig die Eigenschaften der Konsistenz, der Verfügbarkeit und der Partitionstoleranz zu garantieren
NoSQL Datenbanksystem
Ein meist nicht relationales Datenbanksystem (oder ein relationales Datenbanksystem mit einer nicht relationalen Erweiterung) für hochskalierbare Anwendungen mit meist schwacher Konsistenzgarantie
Natives XML Datenbanksystem
Datenbanksystem, das XML Strukturen als Grundelement verwendet; es verwendet XML Dokumenttypdefinitionen als Datenbankschema; konkrete XML Dokumente erscheinen als Instanzen des Schemas - durch die explizite Einbeziehung der zugrunde liegenden Dokument Schemata können auf diese Weise zB auch Abfragen oder Modifikationen der XML Dokumente vorgenommen werden
JSON
Offener Standard für die Beschreibung baumstrukturierter Daten; strukturierte Dokumente im JSON Format sind auch für Menschen leicht lesbar
Datenbankreplikation
Anlegen und Verwalten von Duplikaten einer Datenbank, meist nach einem Master-Slave-Prinzip; Änderungen in der Hauptkopie werden automatisiert in den Replikaten nachgezogen - dient zur Erhöhung der Verfügbarkeit
Datenbankfragmentierung
Aufteilung eines Datenbestands auf mehrere Rechner; dient zur Erhöhung der Skalierbarkeit
Analoge Daten
Werden durch kontinuierliche Funktionen repräsentiert. Die analoge Darstellung erfolgt durch eine physikalische Größe, die sich entsprechend den abzubildenden Sachverhalten oder Vorgängen stufenlos ändert. Beispiele hierfür bieten Thermometer