Ontologie w systemach informacyjnych
Spis treści Ontologia - definicje Ontologia w systemach informacyjnych Cele inżynierii ontologicznej Charakterystyka systemów ontologii Przykład – SUMO Zastosowania Problemy
Ontologia – definicje Tries to answer the questions: What is being? What are the features common to all beings? Representation Languages
Ontologia – definicje Ontologia: teoria bytu, podstawowy dział filozofii zajmujący się badaniem charakteru i struktury rzeczywistości (Aristotle, Metaphysics, IV, 1) określa rodzaje istniejących obiektów, właściwości, zdarzeń, procesów, relacji opis rzeczywistości umożliwiający wyczerpującą klasyfikację bytów Kluczowe zagadnienia: Istnienie, identyczność, właściwość, realność / hipotetyczność, zależność, możliwość, konieczność, powszechność / wyjątkowość, rzecz / proces, zdarzenie, czas, przestrzeń, przyczyna, ilość Ontologia - opisanie rzeczywistości/związków (a nie wytłumaczenie) Credo ontologiczne – aby stworzyć dobre reprezentacje należy mieć wiedzę o reprezentowanych obiektach i procesach – odnosić się do nich
Ontologie w systemach informacyjnych Obszary informatyki odnoszące się do ontologii: inżynieria programowania Struktury danych – reprezentacje ‘rzeczy’ i programy - procesy Model obiektowy Współdzielenie kodu – biblioteki, moduły Systemy baz danych Projektowanie struktur baz danych – modelowanie konceptualne Sztuczna inteligencja; przetwarzanie języka naturalnego (NLP), systemy eksperckie
Proste ontologie = tezaurusy Relacja Przykład Synonym Duży – wielki Antonym Mały – duży IS-A (hyperonim) PIES – SSAK PART-OF (meronim) Kuchnia – piekarnik
Cele inżynierii ontologicznej Spójna i jednorodna platforma reprezentacji i wymiany wiedzy Oszczędność czasu – podstawowe pojęcia i relacje już zaprojektowane; uniknięcie modelowania ontologicznego ‘ad hoc’; rozjaśnienie problemów Bogatsze narzędzia wyrazu - zbliżone do języka naturalnego Integracja międzysystemowa Wyszukiwanie informacji Bardziej inteligentne systemy – dodanie odniesienia ontologicznego Zorientowanie na cele – obiekty rzeczywistości – software bardziej elastyczny, adoptowalny Umożliwienie automatycznego wnioskowania
Podstawowa charakterystyka systemu ontologii Formalizmy modelu Logika formalna, algebra, teoria kategorii, mereologia, teoria zbiorów, topologia, formalna analiza pojęć Klasyfikacje (taksonomie) podstawowych pojęć Forma drzewiasta (albo krata, graf) Liście wyczerpujące wszystkie możliwości Jeden korzeń – najbardziej ogólna kategoria Ontologia jako rodzina drzew – różne perspektywy rzeczywistości, np. skala mikro / makro, stosunek do czasu, itd. Język naturalny (np. angielski) – do ustalania nazw Aksjomaty relacje między podstawowymi pojęciami wyznaczające interpretacje pojęć System dedukcyjny
Podstawowe elementy ontologii i przykładowa aksjomatyzacja Całość / część Ozn.: P(x,y) – x jest częścią y (P1) P(x,x) (P2) P(x,y) and P(y,x) -> x = y (P3) P(x,y) and P(y,z) -> P(x,z) Połączenie (C1) C(x,x) (C2) C(x,y) -> C(y,x) (C3) P(x,y) -> forall z (C(z,x) -> C(z,y)) Zależność / niezależność (D1) D(x,x) (D2) D(x,y) and D(y,z) -> D(x,z) (D3) P(x,y) -> D(y,x) Identyczność / różność; Jedność / wielość; podzielność / niepodzielność; złożoność / elementarność; Czas, przestrzeń, ruch Np. połączenie, rozdzielenie, zetknięcie, separacja, zawieranie, przecięcie Procesy / zdarzenia modalność
Perspektywa pragmatyczna Metody wyznaczania kategorii przez potrzeby, praktykę, doświadczenie, codzienność, postrzeganie Język naturalny, części mowy Metody ewolucyjne Kryterium czytelności (na różnych poziomach) Specjalizacja ontologii Łączenie ontologii nie zawsze jest uzasadnione ontologie domenowe, np. działalność przedsiębiorstwa, geografii, genomu człowieka, społeczeństwa, ekologii, finansów przedsiębiorstwa zorientowanie na cele i zadania Jednoczesne używanie kilku ontologii (języki obce) Ontologia jako model przybliżony Wydajność systemu Wpływ na język reprezentacji Ograniczenia ilościowe
Pierwsze systemy języków (formalnych) do reprezentowania ontologii KL-ONE, sieci semantyczne CyCL (1990) – http://www.opencyc.com LOOM [MacGregor, 1991] Conceptual Graphs [Sowa, 1993] Ontolingua [Gruber, 1993] and KIF [Genesereth & Fikes,1992] F-Logic [Kifer, Lausen, Wu, 1995] Important question: Are the represented ontologies executable, is a reasoning service available?
Inne systemy języków (formalnych) do reprezentowania ontologii OntoMap – http://www.OntoMap.org Ontolingua DAML+OIL (http://www.daml.org , http://www.ontoknowledge.org/oil ) Systemy ‘description logics’: BACK, CLASSIC, CRACK, FLEX, K-REP,
Nowe systemy języków (formalnych) do reprezentowania ontologii RDF / RDF-Schema [Brickley, Guha, 98] UML: Unified Modeling Language XOL: Ontology Exchange Language (cf. http://www.ai.sri.com/~pkarp/xol/) DRDFS: Web-based Representation using Conceptual Graphs [Delteil et al., 01] Rule Markup Language (http://www.dfki.uni-kl.de/ruleml/)
Nowe systemy języków (formalnych) do reprezentowania ontologii
Nowe systemy języków (formalnych) do reprezentowania ontologii RDF Semantics W3C Recommendation 10 February 2004 This Version: http://www.w3.org/TR/2004/REC-rdf-mt-20040210/ Latest Version: http://www.w3.org/TR/rdf-mt/ Previous Version: http://www.w3.org/TR/2003/PR-rdf-mt-20031215/ Editor: Patrick Hayes (IHMC)< phayes@ihmc.us> Series Editor Brian McBride (Hewlett Packard Labs)<bwm@hplb.hpl.hp.com> Please refer to the errata for this document, which may include some normative corrections.
Zastosowania
Przykład istniejącego systemu ontologii – SUO/SUMO SUO – Standard Upper Ontology SUO – grupa robocza IEEE mająca za zadanie stworzyć SUMO (http://suo.ieee.org) SUMO – Suggested Upper Merged Ontology SUMO powstała z integracji wielu publicznie dostępnych ontologii SUMO ma docelowo zawierać 1000-2500 pojęć i około 10 zdań definiujących dla każdego pojęcia Ontologia dostępna w sieci: http://ontology.teknowledge.com/ SUO-KIF – język podstawowy SUMO KIF (Knowledge Interchange Format) - 1992 Stanford – Mike Genesereth Zaprojektowany jako narzędzie wymiany i integracji wiedzy; elastyczne, czytelne dla człowieka i maszyny wariant rachunku predykatów 1 rzędu, podobny do LISPa semantyka teorii zbiorów Mechanizmy meta-językowe ‘konceptualizacja’: 1.zbiór obiektów mających istnieć w świecie, 2.zbiór właściwości, relacji i funkcji jako zbiór uporządkowanych par Obiekt: indywiduum, zbiór lub klasa Świat zawiera: liczby zespolone, obiekt będący wartością funkcji dla niesensownej kombinacji argumentów funkcji, wszystkie skończone listy i zbiory obiektów, słowa kluczowe i wyrażenia KIF
SUO/SUMO –c.d. Moduły ontologii SUMO Szczyt hierarchii podstawowej SUMO Przykład aksjomatyzacji
SUO/SUMO –c.d. Przykład aksjomatyzacji
SUO/SUMO –wybrane elementy Pojęcia podstawowe Fizyczne, Abstrakcyjne Obiekty ZłożonyZCzęści, Region, Collection, Agent Procesy Dwuobiektowy, Intencjonalny, Ruch, ZmianaWewnętrzna, Abstrakty ZbiórLubKlasa, Relacja, Proposition, Ilość, Struktury M.in.: instancja, domena, poddomena, zakres, partycja, rozdzielny Podstawowe relacje binarne Symetryczne, asymetryczne, antysymetryczne, itd. Role: agent, cel, źródło, itd. Przedmioty M.in.:Ubranie,dzieło sztuki, budynek Urządzenia: instrument muzyczny, broń, maszyna, itd. Liczby Jednostki Organizmy Pojęcia czasowe Przedział czasu Punkt czasowy Mereologia Przestrzeń Poniżej, powyżej, pomiędzy, odległość, położenie Semiotyka Słowo, zdanie
SUO/SUMO –przykład pojęcia ‘matka’
SUO/SUMO –przykład pojęcia ‘matka’ (<=> (sibling ?ANIMAL1 ?ANIMAL2) (and (not (equal ?ANIMAL1 ?ANIMAL2)) (exists (?FATHER ?MOTHER) (and (father ?ANIMAL1 ?FATHER) (father ?ANIMAL2 ?FATHER) (mother ?ANIMAL1 ?MOTHER) (mother ?ANIMAL2 ?MOTHER)))))
Wordnet Wordnet (http://www.cogsci.princeton.edu/~wn) WordNet contains 118.000 word forms 90.000 word meanings WordNet categorizes word into syntactic categories – (N, noun) – (V, verb) – (Adj, adjective) und – (Adv, adverb). WordNet additional contains semantic relations between word meanings
CyC CyC Initiated in the course of AI, making common-sense knowledge accessible and processable groups concepts into micro theories; micro theories are a means to express context dependency of knowledge upper-level ontology (3000 concepts) public available http://www.cyc.com/cyc-2-1/index.html recent development: „Bringing Cyc to the Web“ http://www.e-cyc.com/ Open source project is going: http://www.opencyc.org/
Sensus Architecture of SENSUS The Sensus ontology (formerly known as the Pangloss ontology) is a freely available `merged' ontology produced by the Information Sciences Institute (ISI) http://www.isi.edu/natural-language/resources/sensus.html
Sensus Development of a wide ontology (SENSUS) for systems that analyze and understand natural language: concepts are embedded into a is-a-hierarchy SENSUS has been developed from different existing resources through integration and adap tation (1) very generic natural language ontologies (PENMAN Upper Model, ONTOS) (2) WordNet (3) machine readable dictionaries SENSUS contains approx. 50.000 concepts
Sensus
UMLS (Unified Medical Language System) (I) Provided by the National Library of Medicine (NLM), a database of medical terminology. terms from several medical databases (MEDLINE, SNOMED International, Read Codes, etc.) are unified so that different terms are identified as the same medical concept. Access at http://umlsks.nlm.nih.gov/ Documentation available at: http://www.nlm.nih.gov/research/umls/UMLSDOC.HTML
UMLS (II) UMLS Knowledge Sources: – Metathesaurus provides the concordance of medical concepts: • 730.000 concepts • 1.5 million concept names in different source vocabularies – SPECIALIST Lexicon provides word synonyms, derivations, lexical variants, and grammatical forms of words used in MetaThesaurus terms • 130,000 entries. – Semantic Network codifies the relationships (e.g. causality, "is a", etc.) among medical terms. • 134 semantic types, 54 relationships.
Kierunki badań / problemy Automatyczne budowanie i specjalizowanie ontologii Łączenie ontologii Zastosowanie technik ontologicznych w istniejących systemach Efektywne implementacje ontologii – bazy danych, reprezentacje, indeksy Metody ewolucyjne / adaptacyjne Zmienność rzeczywistości – stosunek ontologii do czasu Od ontologii do inteligencji
Współdziałanie ontologii - IFF IFF – The Information Flow Framework Ontologia teorii integracji ontologii domenowych Ontologie: współdziałanie, manipulowanie, morfizmy, partycjonowanie, zależności Bazuje na teorii przepływu informacji, teorii formalnej analizy pojęć
Zastosowania Integracja międzysystemowa E-commerce Edukacja Medycyna, prawo, finanse, wojskowość Technologie NLP