U4 Flashcards
Co to sieci semantyczne
Sieci semantyczne są grafowym schematem reprezentacji wiedzy.
Zawiera ona węzły odpowiadające pojęciom danej dziedziny problemowej i łuki odpowiadające związkom (relacjom) zachodzącym pomiędzy tymi pojęciami.
Jakie wyrózniamy rodzaje relacji w sieciach semantycznych
- ISA (ang. is a) - relacja pomiędzy indywiduum a jego klasą.
- HASA (ang. has a) - relacja część - całość, alternatywnie PART
- AKO (ang. a kind of) - relacja pomiędzy podklasą a nadklasą, alternatywnie SUBCLASS albo SS (subset)
Sieci semantyczne - cechy
- Podlegają reifikacji - przekształcenia relacji w obiekty
- Odpowiadają na pytania przez wnioskowanie
- Dziedziczenie - Koń jest zwierzęciem. Rafał jest koniem. Zatem Rafał jest zwierzęciem.
- Wnioskowanie niemonotoniczne - Wiedza domyślna pojawia się sieciach semantycznych naturalnie dzięki dziedziczeniu
Czym są systemy ramek o jak działają
System ramek składa się z kolekcji ramek, które opisują elementy modelowanej dziedziny.
Ramka działa na podstawie podobnej jak klasy w programowaniu. Posiadają dwa rodzaje atrybutów: własne lub szablonowe. Ramki mogą dziedziczyć od siebie atrybuty.
Atrybuty mają wartości, które mogą być:
- Wartością dosłowną
- Odnośnikiem-relacją do innej ramki
Atrybut posiada swoje cechy, które mówią o wartości domyślnej, zakresie, typie itd.
Język RDF - z czego się składa?
Język RDF składa się z stwierdzeń (statement) - trójka obiekt-atrybut-wartość
RDF - Zasoby
Zasoby: URL, URI, IRI
Zasoby - obiekty, o których chcemy mówić: np. ludzie. miejsca, miasta, naukowcy, studenci, uczelnie
Każdy zasób ma URI (Universal Resource Identifier):
- adres URL (internetowy)
- inny unikalny identyfikator
Będziemy przyjmowali adresy URL jako URI.
IRI są zinternacjonalizowaną wersją URI.
Zalety korzystania:
- globalny, uniwersalny w skali świata, unikalny schemat nazewnictwa
- częściowo rozwiązuje problem wieloznaczności identycznych nazw reprezentacji danych.
RDF - Właściwosci
Właściwości - opisują relacje między zasobami: np. prowadzi kurs, kieruje
Właściwości są obywatelami pierwszej klasy, tzn. są również traktowane jako zasoby (identyfikowane przez URI), mogą mieć różne charakterystyki i tworzą własną taksonomię.
RDF - Stwierdzenia
Stwierdzenia - stwierdzają posiadanie właściwości przez zasoby, a dokładniej: związek pary zasobów pewną relacją binarną.
-
Stwierdzenie jest trójką: obiekt-atrybut-wartość:
Składa się z zasobu, właściwości i wartości - Wartościami mogą być zasoby lub literałyLiterały są wartościami atomowymi (typu string)
RDF jest dostosowany do przetwarzania maszynowego, jednak do czytania przez ludzi może być niebyt zrozumiały.
W jaki sposob mozemy reprezentować stwiedzenie
Stwierdzenie możemy reprezentować jako:
- Trójkę obiekt-atrybut-wartość
- Elementarny graf z dwoma węzłami połączonymi łukiem skierowanym
- Serializacja - zapis tekstowy
W jaki sposob mozemy reprezentować zbiór stwierdzeń
- Zbiór trójek obiekt-atrybut-wartość
- Sieć semantyczna (graf)
- Dokument (np. plik) zawierający serializację zbioru trójek.
Stwierdzenia jako trójki - szerszy kontekst
- Trójkę (x, P, y) można uważać za formułę logiczną P(x,y), gdzie binarny predykat P wiąże obiekt x z obiektem y .
- Trójkę można uważać za skierowany graf z etykietowanymi węzłami i łukami:
- Skierowany od zasobu podmiotu (obiektu) stwierdzenia.
- Skierowany do przedmiotu (wartości) stwierdzenia.
- Wartość stwierdzenia może być innym zasobem lub literałem.
W jaki sposób identifikujemy zasoby i własciwosci w RDF
W RDF zarówno zasoby jak i właściwości muszą być identyfikowane przez URI.
Co to N-Triples?
N-Triples - sformalizowana konwencja ukierunkowana zarówno na czytelność jak i przetwarzanie maszynowe.
Polega na zapisie trzech elementów trójki RDF w kolejności podmiot-predykat-przedmiot, zakończonej kropką, po jednej trójce w wierszu. Każdy z elementów trójki zapisywany jest w postaci w pełni kwalifikowanych, nieskróconych URI, zapisywanych w nawiasach kątowych <>, według schematu:
Co to Turtle (Terse RDF Triple Language)
Podstawowa gramatyka Turtle jest podobna do N-Triples (w rzeczywistości oba te formaty są podzbiorami ogólnej notacji N3 (Notation3)), ale bardziej zorientowana na skróty, czytelność i wygodę.
W notacji Turtle zasoby mogą być zapisywane w postaci qnames, czyli ns
, gdzie ns jest symbolem przestrzeni nazw, a id identyfikatorem zasobu. Przestrzenie nazw związane są w Turtle z definiującymi je URI za pomocą deklaracji @prefix.
Typy danych w RDF
- typy danych stosowane są w językach programowania, aby umożliwić interpretację.
- W RDF w tym celu stosowane są literały typowane:
- Zapis ^^ wskazuje typ literału.
- W dokumentach RDF dozwolone jest korzystanie z wszelkich zewnętrznych typów danych.
- W praktyce najczęściej wykorzystywany jest system typów XML Schema, który definiuje szeroki wachlarz typów danych.
Na przykład: Boolean, liczby całkowite, zmiennoprzecinkowe, czas, daty, itp.