U4 Flashcards
Co to sieci semantyczne
Sieci semantyczne są grafowym schematem reprezentacji wiedzy.
Zawiera ona węzły odpowiadające pojęciom danej dziedziny problemowej i łuki odpowiadające związkom (relacjom) zachodzącym pomiędzy tymi pojęciami.
Jakie wyrózniamy rodzaje relacji w sieciach semantycznych
- ISA (ang. is a) - relacja pomiędzy indywiduum a jego klasą.
- HASA (ang. has a) - relacja część - całość, alternatywnie PART
- AKO (ang. a kind of) - relacja pomiędzy podklasą a nadklasą, alternatywnie SUBCLASS albo SS (subset)
Sieci semantyczne - cechy
- Podlegają reifikacji - przekształcenia relacji w obiekty
- Odpowiadają na pytania przez wnioskowanie
- Dziedziczenie - Koń jest zwierzęciem. Rafał jest koniem. Zatem Rafał jest zwierzęciem.
- Wnioskowanie niemonotoniczne - Wiedza domyślna pojawia się sieciach semantycznych naturalnie dzięki dziedziczeniu
Czym są systemy ramek o jak działają
System ramek składa się z kolekcji ramek, które opisują elementy modelowanej dziedziny.
Ramka działa na podstawie podobnej jak klasy w programowaniu. Posiadają dwa rodzaje atrybutów: własne lub szablonowe. Ramki mogą dziedziczyć od siebie atrybuty.
Atrybuty mają wartości, które mogą być:
- Wartością dosłowną
- Odnośnikiem-relacją do innej ramki
Atrybut posiada swoje cechy, które mówią o wartości domyślnej, zakresie, typie itd.
Język RDF - z czego się składa?
Język RDF składa się z stwierdzeń (statement) - trójka obiekt-atrybut-wartość
RDF - Zasoby
Zasoby: URL, URI, IRI
Zasoby - obiekty, o których chcemy mówić: np. ludzie. miejsca, miasta, naukowcy, studenci, uczelnie
Każdy zasób ma URI (Universal Resource Identifier):
- adres URL (internetowy)
- inny unikalny identyfikator
Będziemy przyjmowali adresy URL jako URI.
IRI są zinternacjonalizowaną wersją URI.
Zalety korzystania:
- globalny, uniwersalny w skali świata, unikalny schemat nazewnictwa
- częściowo rozwiązuje problem wieloznaczności identycznych nazw reprezentacji danych.
RDF - Właściwosci
Właściwości - opisują relacje między zasobami: np. prowadzi kurs, kieruje
Właściwości są obywatelami pierwszej klasy, tzn. są również traktowane jako zasoby (identyfikowane przez URI), mogą mieć różne charakterystyki i tworzą własną taksonomię.
RDF - Stwierdzenia
Stwierdzenia - stwierdzają posiadanie właściwości przez zasoby, a dokładniej: związek pary zasobów pewną relacją binarną.
-
Stwierdzenie jest trójką: obiekt-atrybut-wartość:
Składa się z zasobu, właściwości i wartości - Wartościami mogą być zasoby lub literałyLiterały są wartościami atomowymi (typu string)
RDF jest dostosowany do przetwarzania maszynowego, jednak do czytania przez ludzi może być niebyt zrozumiały.
W jaki sposob mozemy reprezentować stwiedzenie
Stwierdzenie możemy reprezentować jako:
- Trójkę obiekt-atrybut-wartość
- Elementarny graf z dwoma węzłami połączonymi łukiem skierowanym
- Serializacja - zapis tekstowy
W jaki sposob mozemy reprezentować zbiór stwierdzeń
- Zbiór trójek obiekt-atrybut-wartość
- Sieć semantyczna (graf)
- Dokument (np. plik) zawierający serializację zbioru trójek.
Stwierdzenia jako trójki - szerszy kontekst
- Trójkę (x, P, y) można uważać za formułę logiczną P(x,y), gdzie binarny predykat P wiąże obiekt x z obiektem y .
- Trójkę można uważać za skierowany graf z etykietowanymi węzłami i łukami:
- Skierowany od zasobu podmiotu (obiektu) stwierdzenia.
- Skierowany do przedmiotu (wartości) stwierdzenia.
- Wartość stwierdzenia może być innym zasobem lub literałem.
W jaki sposób identifikujemy zasoby i własciwosci w RDF
W RDF zarówno zasoby jak i właściwości muszą być identyfikowane przez URI.
Co to N-Triples?
N-Triples - sformalizowana konwencja ukierunkowana zarówno na czytelność jak i przetwarzanie maszynowe.
Polega na zapisie trzech elementów trójki RDF w kolejności podmiot-predykat-przedmiot, zakończonej kropką, po jednej trójce w wierszu. Każdy z elementów trójki zapisywany jest w postaci w pełni kwalifikowanych, nieskróconych URI, zapisywanych w nawiasach kątowych <>, według schematu:
Co to Turtle (Terse RDF Triple Language)
Podstawowa gramatyka Turtle jest podobna do N-Triples (w rzeczywistości oba te formaty są podzbiorami ogólnej notacji N3 (Notation3)), ale bardziej zorientowana na skróty, czytelność i wygodę.
W notacji Turtle zasoby mogą być zapisywane w postaci qnames, czyli ns
, gdzie ns jest symbolem przestrzeni nazw, a id identyfikatorem zasobu. Przestrzenie nazw związane są w Turtle z definiującymi je URI za pomocą deklaracji @prefix.
Typy danych w RDF
- typy danych stosowane są w językach programowania, aby umożliwić interpretację.
- W RDF w tym celu stosowane są literały typowane:
- Zapis ^^ wskazuje typ literału.
- W dokumentach RDF dozwolone jest korzystanie z wszelkich zewnętrznych typów danych.
- W praktyce najczęściej wykorzystywany jest system typów XML Schema, który definiuje szeroki wachlarz typów danych.
Na przykład: Boolean, liczby całkowite, zmiennoprzecinkowe, czas, daty, itp.
RDF: Predykaty binarne
-
RDF używa tylko binarnych właściwości
- Jest to ograniczenie, ponieważ często używamy predykatów z więcej niż 2 argumentami.
- Ale można je zasymulować predykatami binarnymi.
-
Przykład: referee(X,Y,Z)
X jest sędzią meczu szachowego pomiędzy graczami Y i Z- Wprowadzamy nowy pomocniczy zasób chessGame oraz predykaty binarne: ref, player1 i player2.
- Możemy teraz wyrazić referee(X,Y,Z) jako:
RDF: Właściwości
- Właściwości są specjalnym rodzajem zasobów.
- Właściwości mogą występować jako obiekty w trójkach obiekt-atrybut-wartość (stwierdzeniach).
- Możliwość ta oferuje dużą elastyczność.
- Ale jest to niezwykłe dla języków modelowania i języków programowania OO.
- Może to być mylące dla programistów modelowania semantycznego.
RDF: Reifikacja
Reifikacja (przekształcenie relacji w obiekty) jest innym dość mocnym mechanizmem.
- Może wydawać się nie na miejscu we w sumie prostym języku takim jak RDF.
- Tworzenie stwierdzeń o stwierdzeniach wprowadza poziom złożoności, który nie jest niezbędny do podstawowej warstwy Semantic Web
- Mogłoby wydawać się bardziej naturalne umieszczenie tego mechanizmy w bardziej zaawansowanych warstwach, które zapewniają bogatsze funkcje reprezentacji.
RDF Schema
Schema - rozszerzenie języka RDF, które pozwala użytkownikowi opisywać zasoby przy pomocy własnych zestawów pojęć oraz wprowadzające:
- Klasy i właściwości
- Hierarchię klas i dziedziczenia
- Hierarchię właściwości
RDF Schema nie jest odrębnym językiem tworzenia schematów dla dokumentów RDF.
Co to SPARQL
SPARQL - język zapytań RDF.
Składniowo przypomina nieco SQL, lecz w rzeczywistości język SPARQL nawiązuje do grafowego modelu danych RDF:
- SPARQL opiera się na dopasowaniu do wzorców-grafów.
- Najprostszym wzorcem-grafem jest trójka, podobna do trójki RDF ale z możliwością użycia zmiennej zamiast termu RDF na pozycji podmiotu, predykatu lub przedmiotu.
- Łączenie wzorców-trójek daje wzorzec-graf. Dokładne dopasowanie wzorca do grafu danych RDF jest niezbędne dla dopasowania wzorca.
Struktura zapytania SPARQL
Podobnie jak w SQL, zapytania SPARQL mają strukturę SELECT-FROM-WHERE:
- SELECT określa liczbę i kolejność pobieranych danych.
- FROM służy do określenia źródła przeszukiwania (opcjonalne).
- WHERE nakłada ograniczenia na możliwe rozwiązania w postaci szablonów, wzorców wykresów i ograniczeń logicznych.
Co to ontologia
Ontologia - jawna specyfikacja konceptualizacji.
Ontologia - jawny, precyzyjny i kompletny opis jakiejś części świata, zwanej dziedziną przedmiotową lub problemową.
Jaki jest cel Ontologii
Celem ontologii jest m.in. uniknięcie nieporozumień, zapewnienie, że wszyscy agenci operujący w lub na danej dziedzinie rozumieją jej elementy i własności w jednolity sposób.
Co musi zawierać Ontologia
Ontologia musi zawierać specyfikację:
- Terminologii uzgodnionej dla danej dziedziny.
- Pojęć dotyczących danej dziedziny.
- Atrybutów tych pojęć, ich własności i związków między nimi.
- Istniejących więzów na te atrybuty, własności i związki.
Powyższe elementy stanowią terminologiczną wiedzę o dziedzinie. Ontologia może również zawierać część asercyjną obejmującą:
- Wiedzę o indywiduach/obiektach istniejących w dziedzinie.
Zestawienie i opisy wszystkich tych elementów danej dziedziny bywa nazywane jej konceptualizacją. Dlatego w największym skrócie ontologię danej dziedziny nazywa się jawną specyfikacją jej konceptualizacji.
Czym są Ontologie górne
Opisują pojęcia świata rzeczywistego, wspólne dla wszelkich działań, nienależące do żadnej określonej dziedziny problemowej.
Przykłady:
Dublin Core, Cyc/OpenCyc/ResearchCyc, GFO, SUMO, DOLCE, Wordnet
Ontologie dziedzinowe
wprowadzają ujednoliconą terminologię, systematykę i definiują model danych określonej dziedziny problemowej. Znaczenie pojęć ontologii dziedzinowej jest specyficzne dla danej dziedziny. Mogą, ale nie muszą, odwoływać się do jakiejś ontologii górnej.
Przykłady:
Gene Ontology, SNOMED CT
OWL - Ontology Web Language
OWL (Ontology Web Language) - deklaratywny język tworzenia ontologii. Pozwalający opisać budowę, właściwości i aktualny stan dziedziny problemowej. Stwierdzenia w nim zapisane pozwalają wywieść dalsze informacje opierając się na semantyce formalnej.
Co wystepuje w OWL
W języku OWL występują:
- Encje (entities) - elementy określające pojęcia modelowanej dziedziny (zarówno obiekty, ich własności, jak i relacje między nimi).
- Wyrażenia (expressions) - kombinacje encji i konstruktorów OWL.
- Aksjomaty (axioms) - podstawowe stwierdzenia tworzące ontologię.
Ontologia zbudowana z tych elementów składa się z szeregu stwierdzeń, mających charakter aksjomatów logicznych. Zapis ontologii stwierdza prawdziwość tych aksjomatów (true/false).
Jakie są (2) semantyki w OWL
Semantyka Bezpośrednia (Direct Semantics)
- Semantyka RDF (RDF-Based Semantics)
Co to jest logika opisowa?
Logika opisowa to podstawa teoretyczna języka OWL, rodzina formalizmów logicznych stanowiących rozstrzygalne podzbiory matematycznej logiki pierwszego rzędu.
Co to jest modelowanie ontologiczne?
Modelowanie ontologiczne to proces tworzenia reprezentacji wiedzy, która pozwala na wyrażanie, wymianę i przetwarzanie wiedzy o danej dziedzinie problemowej.
Jaką rolę pełnią silniki wnioskowania?
Silniki wnioskowania realizują wywody logiczne, choć ich konstrukcja nie jest częścią specyfikacji OWL.
Jakie są plusy i minusy korzystania z silników wnioskowania w OWL?
Plusy: Pozwalają łatwo uzyskać wiele konsekwencji oraz zauważyć pożądane i niepożądane efekty wprowadzanych stwierdzeń.
Minusy: Nie zawsze można łatwo przewidzieć konsekwencje wprowadzanych stwierdzeń.
Jaka jest różnica między semantyką bazy wiedzy a bazy danych w kontekście faktów?
W bazie danych fakt nieistniejący przyjmuje się zwykle jako fałszywy (założenie świata zamkniętego), podczas gdy ontologia OWL przyjmuje założenie świata otwartego.
Co to notacja manchaster
Notacja Manchester sprzyja beznawiasowemu zapisowi wyrażeń dzięki priorytetom (od najwyższego do najniższego):
- some, only, value, min, max, exactly, that
- not
- and
- or