Graphorientierte und webbasierte Datenverwaltung Flashcards

Question

Was kann genutzt werden um Herausforderungen für das dezentrale Datenmanagement zu lösen?

Answer 1

Das World Wide Web.

Answer 2

Internet ist ein weltweites dezentrales Netzwerk über das angeschlossene Computer mittels festgelegter Verfahren (Protokolle) kommunizieren. Das WWW besteht aus sehr vielen Computern (Webserver) die über das Internet verbunden sind und Protokolle und Technologien zum Datenaustausch mi t Anwendern (Clients) nutzen

Answer 3

Uniform Resource Identifier Hypertext Transfer Protocol Representational State Transfer

Answer 4

Wie bereits bei zentralen Datenbanken ist insbesondere auch in verteilten Umgebungen die Möglichkeit zur eindeutigen Identifizierung von Entitäten essenziell für jegliche Form des Datenmanagements. Im Web Kontext werden Entitäten verallgemeinert auch als Ressourcen bezeichnet und sind mithilfe von URIs weltweit eindeutig identifizierbar

Answer 5

Das Hypertext Transfer Protocol enthält eine Reihe von Befehlen, welche denjenigen einer Datendefinitions und Datenmanipulationssprache aus dem Datenbankkontext ähneln. Da es von allen Webservern sowie allen Anwendungsprogrammen, welche das WWW nutzen, unterstützt wird, stellt es eine einheitliche Schnittstelle für den Datenaustausch im World Wide Web dar.

Answer 6

Beim Representational State Transfer handelt es sich um eine abstrakte Beschreibung des Datenzugriffsverfahrens, welches innerhalb des WWW verwendet wird. Webbasierte Anwendungssysteme, die das REST Paradigma umsetzen, um Daten über das Web auszutauschen oder zu manipulieren, zeichnen sich dadurch aus, dass sie URIs verwenden, um auf Ressourcen zuzugreifen oder diese zu verändern, und darüber hinaus in der Lage sind, den aktuellen Zustand ( einer Ressource im Rahmen einer (üblicherweise HTTP basierten) Server Client Kommunikation in Form einer textuellen Repräsentation der Ressource übermitteln können

Answer 7

Schema - Kontext, in dem der URI auftritt Authority - Instanz, welche den URI verwaltet Pfad - hierarchisch organisierte Angabe zur Identifikation der Ressource Abfrage - ergänzende Daten zur Auffindbarkeit der Ressource Fragment - Referenz auf eine Stelle innerhalb der Ressource

Answer 8

Der Nachrichtenkopf enthält allgemeine Informationen über die Nachricht Hierzu zählen insbesondere die auszuführende Anfragemethode request method der URI der angeforderten Ressource und weitere Informationen wie etwa die verwendete Kodierung oder der Datentyp der angeforderten Ressource Der Nachrichtenrumpf enthält die eigentlichen Daten, die mit der Nachricht transportiert werden sollen. Falls keine Daten transportiert werden, sondern lediglich eine Anfrage gesendet wird, ist der Nachrichtenrumpf leer

Answer 9

GET Methode zum Abfragen vorhandener Daten POST Methode zum Erstellen neuer Daten PUT Methode zum Modifizieren vorhandener Daten DELETE Methode zum Löschen vorhandener Daten

Answer 10

Wie Anwendungssysteme über das WWW Daten austauschen.

Answer 11

Adressierbarkeit von Ressourcen (Jede relevante Ressource kann anhand eines URI eindeutig ident. werden) Repräsentierbarkeit von Ressourcen (Zustand einer Ressource muss textuell repräsentierbar & übertragbar sein) Selbstbeschreibende (HTTP) Nachrichten (Zugriff auf Ressourcen erfolgen durch (HTTP-)Nachrichten mit Standardmethoden) Zustandslosigkeit (Server muss keine Informationen über fertig abgearbeitete Anfragen speichern)

Answer 12

Beschreibt den Ansatz, dass sämtliche Interaktionsmöglichkeiten von Anwendungsprogrammen mit einer webbasierten Datenbank über vom Webserver bereitgestellte URIs erfolgen. Das bedeutet konkret, dass sich das als Client agierende Anwendungsprogramm im Rahmen eines HTTP Nachrichtenaustauschs bei dem Webserver erkundigt, welche Datenabfrage und Datenmanipulationsoperationen zum aktuellen Zeitpunkt vom Server unterstützt werden, und dieser dann dem Client als Antwort die vorhandenen Interaktionsmöglichkeiten in Form von entsprechenden HTTP Anfragemethoden und den zugehörigen URIs zusendet. Der Client kann dann entscheiden, welche der verfügbaren Operationen er ausführen möchte, und dafür einfach die passende HTTP Anfrage schicken Als Antwort erhält er dann sowohl das Ergebnis der Operation als auch eine erneute Auflistung der nun vorhandenen Interaktionsmöglichkeiten (die sich aufgrund der letzten Operation oder anderer zwischenzeitlich erfolgter Ereignisse durchaus von der vorigen unterscheiden kann)

Answer 13

Unterstützung dezentraler Informationssysteme (IS mit dezentraler Architektur & dezentrales Datenmanagement sind naheliegend) Bessere Skalierbarkeit (höherer Durchsatz & Performance) Reduktion der Serverlast (Aufgrund der Zustandslosigkeit von REST müssen keine TA Daten von Servern gespeichert werden)

Answer 14

Verzögerung durch Netzwerkübertragung (Alle abzufragenden Daten müssen textuell repräsentiert werden & über Netzwerk übertragen werden) Geringere TA Kontrolle (ACID Eigenschaften zentralistischer Systeme können in dezentralen Umgebungen nicht sichergestellt werden) Performanzverlust bei komplexen Anfragen (Falls Daten auf versch. Servern liegen -> dauert länger)

Answer 15

Eine Möglichkeit, eine dezentrale webbasierte | Datenverwaltung auf Basis des Graphenmodells zu realisieren

Answer 16

Bereitstellung maschinell lesbarer Daten im Web

Answer 17

Web of Doc.: Bereitstellung von untereinander verlinkten HTML Dokumenten (Webseiten) Darstellung in Webbrowsern Lesbar für Menschen Web of Data (Semantic Web): Bereitstellung von strukturierten RDF Dateien mit URIs als Identifikator für Ressourcen -> Maschinenlesbare, strukturierte Daten Lesbar für maschinelle Anwender

Answer 18

Daten im RDF Format, welche Bestandteil der so entstehenden, weltweit offen zugreifbaren Graphstruktur sind, werden daher auch als Linked Open Data bezeichnet. In Linked Open Data Cloud

Answer 19

Compact URI Da URIs im Vergleich zu typischen ID Schlüsselwerten jedoch oft sehr lang und umständlich zu lesen sind, werden bei der textuellen oder graphischen Repräsentation der URIs häufig Abkürzungen eingeführt. Diese werden als CURIE (Compact URI) bezeichnet und erlauben es, Schema, Authority und Pfad eines URI durch eine beliebige Folge von Kleinbuchstaben und Ziffern, das so genannte Präfix zu ersetzen. Um CURIEs nutzen zu können, muss jedes verwendete Präfix zu Beginn eines Dokuments oder in der Legende einer graphischen Darstellung einmalig deklariert werden: @prefix name: .

Answer 20

verbinden Beziehungstypen zwei Entitäten miteinander, welche beide wie oben beschrieben als Ressourcen abgebildet und durch URIs repräsentiert werden

Answer 21

Während Attribute einer Entität bestimmte | Eigenschaften zuweisen, welche durch atomare Werte (im RDF auch als Literale bezeichnet) repräsentiert werden,

Answer 22

Attribute von Ressourcen und Beziehungstypen zwischen zwei Ressourcen wird ebenfalls als Ressourcen betrachtet und erhalten daher ebenso wie Entitäts Ressourcen einen eindeutigen Namen, der durch einen Uniform Resource Identifier (URI) repräsentiert werden kann

Answer 23

Im RDF werden Datensätze in Form von Tripeln repräsentiert Dabei handelt es sich um Gefüge der Form Subjekt - Prädikat - Objekt

Answer 24

Das Subjekt wird durch eine Ressource gebildet, also eine Entität, deren Eigenschaften oder Beziehungen gespeichert werden sollen

Answer 25

Als Prädikat kommen Attribute oder Ressourcen infrage, welche dazu geeignet sind, dem Subjekt eine Eigenschaft oder eine Beziehung zu einer anderen Ressource zuzuordnen

Answer 26

Das Objekt wird entweder durch ein Literal, also einen atomaren (Attribut --) oder durch eine weitere Ressource gebildet, die mit der Subjektressource in der durch das Prädikat spezifizierten Beziehung steht

Answer 27

Subjekt (Entität (URI/CURIE)) -> Prädikat (Attribut (URI/CURIE) oder Beziehung (URI/CURIE)) -> Objekt (Attributwert (lit) oder Entität (URI/CURIE)) Literale sind nur in der Objekt Position zulässig! URIs sind als Bezeichner für Ressourcen in allen drei Positionen ( Prädikat, Objekt) zulässig!

Answer 28

LinkedData Principles Property Graph

Answer 29

Da alle Ressourcen durch URIs identifiziert werden, können die Daten zu diesen Ressourcen bei der Verwendung geeigneter URIs für deren Bezeichnung durch eine HTTP GET Anfrage auf die entsprechende URI sofort abgerufen werden. Diese Vorgehensweise bei der Datenmodellierung wird in der Literatur als Linked Data Principles (Bizer et al 2011 bezeichnet. Aus dieser Eigenschaft folgt, dass sich das RDF zur Umsetzung des REST Paradigmas eignet

Answer 30

Da auch Prädikate (Attribute und Beziehungstypen) als Ressourcen betrachtet werden, können diesen ebenso wie Entitäten selbst Eigenschaften zugewiesen werden, weil sie gleichermaßen als Ressourcen behandelt werden. Das hieraus entstehende Graphenmodell, bei dem auch die Kanten ihrerseits wieder Eigenschaften und Beziehungen zueinander aufweisen, wird in der Literatur als Property Graph bezeichnet und eignet sich zur Erstellung eines Schemas für die Entitäten und Beziehungen, die im RDF Graphen vorkommen

Answer 31

``` Nachteile des trad. rel. Datenmanagent -> (motiviert) EAV Ansatz -> (entspricht) Graphenmodell -> (Grundlage für) Resource Description Framework (RDF) ``` ``` Nachteile der zentral. Datenverwaltung -> (motivieren) Dezentrales Datenmanag. im Web (URIs/HTTP/REST) -> (realisiert durch) Resource Description Framework (RDF) ```