Semantik und Semantisches Web Flashcards
Was bezeichnet man als gemeinsame Informationsnutzung (information sharing)?
Die Bereitstellung eines Zugriffs auf die Menge von heterogenen, autonomen und verteilten In-formationsquellen und die automatische Verarbeitbarkeit der vorgefundenen Informationen
Probleme durch Darstellung des Web-Inhalts im Hinblick auf menschliche Nutzung.
- Viele Suchergebnisse bei geringer Präzision/Relevanz
- keine oder nur wenige Treffer ergeben
- Die Suchergebnisse sind stark vom verwendeten Vokabular abhängig
- Es werden nur einzelne Web-Seiten als Suchergebnis geliefert.
- Auch bei erfolgreicher Suche müssen die Benutzenden in den gelieferten Dokumenten die interessierende Information manuell, und damit mit erheblichem kognitiven Aufwand, herausfiltern.
- Suchergebnisse sind für andere Programme kaum nutzbar und müssen manuell integriert werden
Konzept des semantisches Netzes:
Computerbasierte Dienste bieten dabei dem Nutzenden bei Suche, Sichtung und Bewertung von Informationen Unterstützung an, indem sie den semantischen Hintergrund der dargestellten Informationen interpretieren und automatisch maschinell weiterverarbeiten.
Darüber hinaus sollen Beziehungen zwischen den interpretierten Informationen vom System erkannt werden.
Probleme bei der Etablierung eines semantischen Netzes
Als zentrale Probleme erweisen sich im semantischen Netz die syntaktische, strukturelle und semantische Heterogenität der Informationsquellen.
Die Probleme, die sich allgemein aus der Heterogenität der Daten ergeben:
- die Syntax – z. B. heterogene Datenformate,
- die Struktur – z. B. Homonyme, Synonyme oder unterschiedliche Attributnamen in Datenbanktabellen,
- die Semantik – z. B. die beabsichtigte Bedeutung von Ausdrücken in speziellem Zusammenhang oder Anwendung.
Was ist ein semantisches Netz und wozu wird es verwendet?
Ein Semantisches Netz (semantic web) hilft dabei, die im Web verfügbaren Inhalte maschinell verarbeiten zu können. Dabei wird der semantische Hintergrund der dargestellten Informationen interpretiert und Beziehungen zwischen den interpretierten Informationen vom System erkannt und automatisch maschinell verarbeitet. Dies soll den Benutzern helfen, die richtigen bzw. relevanten Informationen zu finden.
Welches sind die Bestandteile eines RDF-Tripels? Nennen Sie zwei mögliche Darstellungsformen
Ressource/Subjekt, Prädikat, Objekt. Als Graf oder als XML-Notation
Die Entwicklung des semantischen Webs auf vier Ebenen:
- die Ebene der technischen Aspekte eines Computernetzwerks,
- die Ebene des Webs als Benutzungsschnittstelle für die Interaktion zwischen Mensch und Internet,
- Wissensebene,
- Anwenderebene eines Wissensnetzwerks im Sinne einer Basis für soziale Netz-werke.
Zudem werden den Benutzenden bestimmte Aufgaben abgenommen (semantisches Web, dritte Ebene):
- Informationssuche,
- Informationssammlung,
- Informationsklassifikation,
- Informationsfilterung,
- Informationsmanagement,
- Information-Mining,
- Informationsentdeckung,
- Informationsbewertung
Was sind Metadaten?
Mit Metadaten kann der Sinn von Daten explizit aus-gedrückt werden, sie beziehen sich also häufig auf die Semantik.
Wie definiert sich ein RDF-Tripel?
Subjekt bzw. Ressource, Prädikat und Objekt
Wozu nutzt man RDF?
In einem ersten Schritt kann RDF dazu verwendet werden, einer Ressource Annotationen hinzuzufügen. Auf diese Weise kann die Ressource genauer beschrieben und ihre Beziehung zueinander aufgezeigt werden.
RDF bietet einige für die Repräsentation von Metadaten wichtige Eigenschaften.
Dazu gehören die sogenannten Reifikations- und Aggregationsmechanismen.
Ersterer erlaubt es, Aussagen über Aussagen zu treffen, indem ein eindeutiger Bezeichner, auch ID genannt, für jedes Statement eingeführt wird, wodurch es zu einer Ressource wird.
RDF erlaubt außerdem, dass ein Merkmal mehrere Werte annehmen kann. Hierfür stellt RDF Datentypen für Listen und Mengen von Ressourcen zur Verfügung, die ihrerseits wiederum Ressourcen darstellen.
Nachteil von RDF:
Als Nachteil gilt, dass nur zweistellige Relationen zugelassen sind, sodass mehrstellige umständlich durch mehrere zweistellige Relationen dargestellt werden müssen.
Reflikation
Reifikation beschreibt die Fähigkeit, eine Aussage als eigene Ressource zu modellieren, was es erlaubt, Aussagen in anderen Aussagen zu referenzieren. Dies ermöglicht die Verkettung von Aussagen und das Treffen von Aussagen über Aussagen.
Argumentationsbaum
Argumente bestehen aus Prämissen und Schlussfolgerungen, wobei die Prämisse eines Arguments auch ein anderes Argument sein kann. Dies ermöglicht die Verkettung von Argumenten, was zu einer Argumentationsbaumstruktur führt.
Woraus besteht ein Argument im Sinne des Argument Interchange Format (AIF)? Was sind die Aufgaben der sogenannten S-Knoten, bzw. I-Knoten?
Ein Argument besteht aus einer oder mehreren Prämissen und einer Schlussfolgerung. Die I-Knoten enthalten dabei aussagenbezogene Informationen wie eine Behauptung oder ermittelte Da-ten, die S-Knoten erfassen die Anwendung von Schemata (Argumentation, Inferenz, …).
Ein Spezialfall sind dabei die RA-Knoten, die eine Regel der Inferenzanwendung darstellen.
Was definiert RDF-S?
Vokabular, welches in RDF-Datenmodellen Verwendung findet, und spezifiziert, welche Merk-male zu welchen Objekten gehören. Weiter wird spezifiziert welche Werte die Objekte annehmen können und die Beziehungen zwischen Objekten werden beschrieben.
Was ist RDF-S?
RDF-S ist somit bereits eine primitive Ontologie-Sprache. Sie stellt verschiedene Primitive mit festgelegter Bedeutung zur Verfügung. Dazu gehören die Konzepte von class und subclass-Beziehungen, property und subproperty-Beziehungen sowie do-main- und range-Einschränkungen. Mithilfe von speziellen Abfragesprachen können Abfragen über RDF bzw. RDF-S Dokumente formuliert werden.
Was sind Primitive in RDF-S?
Wie schon erwähnt können mit RDF Aussagen über Aussagen getroffen werden. Hierzu dienen die Primitive.
Was ist OWL?
Die Abkürzung OWL steht für Web Ontology Language. OWL wurde 2001 durch die Ontology Working Group vom W3C erstellt, um eine Strategie zu entwickeln, mithilfe derer die Informationen im Internet besser zugänglich und vor allem für Maschinen einheitlicher zu handhaben sein sollten.
Warum sind Syntax und Semantik wichtig für eine Ontologie?
Syntax und Semantik sind notwendig, um eine Ontologie zu schreiben, die nicht mehrdeutig ausgelegt werden kann. Die Semantik ist die Voraussetzung um eine allgemein-gültige Verständigung über das Internet zu ermöglichen.
Was enthält eine OWL Ontologie?
Eine OWL-Ontologie beinhaltet eine Anzahl von Beschreibungen, Klassen, Eigenschaften, Individuen, Axiomen und Fakten.
Wozu werden Axiome genutzt?
Axiome werden im Allgemeinen benutzt, um Klassen und Eigenschaften Informationen und Charakteristiken zuzuordnen. Unterschieden werden sogenannte Klassenaxiome und Eigenschaftenaxiome.
Mit Klassenaxiomen werden Klassen definiert.
Es gibt grundsätzlich zwei verschiedene Arten von Eigenschaften. Die einen spezifizieren Eigenschaften mittels Datenwerten wie z. B. Integer. Die andere Art definiert Eigenschaften in Abhängigkeit von anderen Individuen.