Semantik und Semantisches Web Flashcards
Was bezeichnet man als gemeinsame Informationsnutzung (information sharing)?
Die Bereitstellung eines Zugriffs auf die Menge von heterogenen, autonomen und verteilten In-formationsquellen und die automatische Verarbeitbarkeit der vorgefundenen Informationen
Probleme durch Darstellung des Web-Inhalts im Hinblick auf menschliche Nutzung.
- Viele Suchergebnisse bei geringer Präzision/Relevanz
- keine oder nur wenige Treffer ergeben
- Die Suchergebnisse sind stark vom verwendeten Vokabular abhängig
- Es werden nur einzelne Web-Seiten als Suchergebnis geliefert.
- Auch bei erfolgreicher Suche müssen die Benutzenden in den gelieferten Dokumenten die interessierende Information manuell, und damit mit erheblichem kognitiven Aufwand, herausfiltern.
- Suchergebnisse sind für andere Programme kaum nutzbar und müssen manuell integriert werden
Konzept des semantisches Netzes:
Computerbasierte Dienste bieten dabei dem Nutzenden bei Suche, Sichtung und Bewertung von Informationen Unterstützung an, indem sie den semantischen Hintergrund der dargestellten Informationen interpretieren und automatisch maschinell weiterverarbeiten.
Darüber hinaus sollen Beziehungen zwischen den interpretierten Informationen vom System erkannt werden.
Probleme bei der Etablierung eines semantischen Netzes
Als zentrale Probleme erweisen sich im semantischen Netz die syntaktische, strukturelle und semantische Heterogenität der Informationsquellen.
Die Probleme, die sich allgemein aus der Heterogenität der Daten ergeben:
- die Syntax – z. B. heterogene Datenformate,
- die Struktur – z. B. Homonyme, Synonyme oder unterschiedliche Attributnamen in Datenbanktabellen,
- die Semantik – z. B. die beabsichtigte Bedeutung von Ausdrücken in speziellem Zusammenhang oder Anwendung.
Was ist ein semantisches Netz und wozu wird es verwendet?
Ein Semantisches Netz (semantic web) hilft dabei, die im Web verfügbaren Inhalte maschinell verarbeiten zu können. Dabei wird der semantische Hintergrund der dargestellten Informationen interpretiert und Beziehungen zwischen den interpretierten Informationen vom System erkannt und automatisch maschinell verarbeitet. Dies soll den Benutzern helfen, die richtigen bzw. relevanten Informationen zu finden.
Welches sind die Bestandteile eines RDF-Tripels? Nennen Sie zwei mögliche Darstellungsformen
Ressource/Subjekt, Prädikat, Objekt. Als Graf oder als XML-Notation
Die Entwicklung des semantischen Webs auf vier Ebenen:
- die Ebene der technischen Aspekte eines Computernetzwerks,
- die Ebene des Webs als Benutzungsschnittstelle für die Interaktion zwischen Mensch und Internet,
- Wissensebene,
- Anwenderebene eines Wissensnetzwerks im Sinne einer Basis für soziale Netz-werke.
Zudem werden den Benutzenden bestimmte Aufgaben abgenommen (semantisches Web, dritte Ebene):
- Informationssuche,
- Informationssammlung,
- Informationsklassifikation,
- Informationsfilterung,
- Informationsmanagement,
- Information-Mining,
- Informationsentdeckung,
- Informationsbewertung
Was sind Metadaten?
Mit Metadaten kann der Sinn von Daten explizit aus-gedrückt werden, sie beziehen sich also häufig auf die Semantik.
Wie definiert sich ein RDF-Tripel?
Subjekt bzw. Ressource, Prädikat und Objekt
Wozu nutzt man RDF?
In einem ersten Schritt kann RDF dazu verwendet werden, einer Ressource Annotationen hinzuzufügen. Auf diese Weise kann die Ressource genauer beschrieben und ihre Beziehung zueinander aufgezeigt werden.
RDF bietet einige für die Repräsentation von Metadaten wichtige Eigenschaften.
Dazu gehören die sogenannten Reifikations- und Aggregationsmechanismen.
Ersterer erlaubt es, Aussagen über Aussagen zu treffen, indem ein eindeutiger Bezeichner, auch ID genannt, für jedes Statement eingeführt wird, wodurch es zu einer Ressource wird.
RDF erlaubt außerdem, dass ein Merkmal mehrere Werte annehmen kann. Hierfür stellt RDF Datentypen für Listen und Mengen von Ressourcen zur Verfügung, die ihrerseits wiederum Ressourcen darstellen.
Nachteil von RDF:
Als Nachteil gilt, dass nur zweistellige Relationen zugelassen sind, sodass mehrstellige umständlich durch mehrere zweistellige Relationen dargestellt werden müssen.
Reflikation
Reifikation beschreibt die Fähigkeit, eine Aussage als eigene Ressource zu modellieren, was es erlaubt, Aussagen in anderen Aussagen zu referenzieren. Dies ermöglicht die Verkettung von Aussagen und das Treffen von Aussagen über Aussagen.