1 Od metadanych do inteligentnego Internetu Mariusz Olko 8 stycznia 2003.

Slides:



Advertisements
Podobne prezentacje
Platformy e-learningowe Krzysztof Andrelczyk IS, WIMiIP, III rok
Advertisements

Przekształcanie dokumentów XML - XSL
Inteligentne Systemy Informacyjne
Modelowanie przypadków użycia
Simple Knowledge Organisation System
Rafał Hryniów Tomasz Pieciukiewicz
Resource Description Framework
Sieci komputerowe Usługi sieciowe Piotr Górczyński 27/09/2002.
DUBLIN CORE METADATA INITIATIVE – działalność i projekty
SCR 2008/2009 – informatyka rok 5. Edytor Wizualny - Agenda Przeznaczenie komponentu Funkcjonalność Opis działania.
Komponenty bazy danych Baza danych Jest to uporządkowany zbiór powiązanych ze sobą danych charakterystycznych dla pewnej klasy obiektów lub zdarzeń,
XPath XSLT – część XPath. XSLT – część 12 XPath – XML Path Language Problem: –jednoznaczne adresowanie fragmentów struktury dokumentu XML.
Technologie zarządzania wiedzą Technologie zarządzania wiedzą2 Tendencje w biznesie Źródło: Gladstone, B., From Know-How to Knowledge – The.
XPath. XSLT – część XPath. XSLT – część 12 XPath – XML Path Language Problem: –jednoznaczne adresowanie fragmentów struktury dokumentu XML.
XML w zarządzaniu formularzami ubezpieczeniowymi ZUS
11 RDF Wertykalne zastosowania XML-a. 22 RDF - Wprowadzenie Problemy Sieć jest nieczytelna dla programów komputerowych. Sieć zawiera zbyt wiele informacji.
Definiowanie typów dokumentów Część 2. Przestrzenie nazw, XML Schema.
Modelowanie wiedzy.
Technologie zarządzania wiedzą
Technologie zarządzania wiedzą Technologie zarządzania wiedzą2 Tendencje w biznesie Źródło: Gladstone, B., From Know-How to Knowledge – The.
MS Access 2000 Normalizacja Paweł Górczyński 2005.
PySBQL Język zapytań dla obiektowych baz danych. Aplikacje bazodanowe Główny nurt budowania aplikacji opiera się na połączeniu: SQL JDBC Java Jak wyświetlić
KONKURS WIEDZY O SZTUCE
Dokumentowanie wymagań w języku XML
Zastosowanie pamięci semantycznej we wspomaganiu decyzji medycznych
Wykład 2: Systemy klasy C.A.T. (Computer-Aided Translation)
Inteligentne Systemy Informacyjne
Pakiety i ATD 1 Definicja. Pakietem albo jednostką programową nazywamy grupę logicznie powiązanych elementów, które mogą być typami, podtypami, obiektami.
„Migracja środowisk Novell NDS/eDirectory oraz Novell Groupwise do środowiska Microsoft Active Directory oraz Microsoft Exchange przy użyciu narzędzi Quest.
Microsoft WinFS – nowy system plików, zasada działania. Wojtek Galek.
Information Bridge Framework platforma integracji Microsoft Office 2003 z aplikacjami Line of Business Krzysztof Michalski10/01/2005.
Resource Description Framework
Modele baz danych - spojrzenie na poziom fizyczny
Technologie informacyjne MCE Pudełko. Zakładanie strony internetowej Technologie informacyjne Marek Pudełko.
Multimedialne bazy danych
Bibliotekarz – odkrywca. Agenda Proces tworzenia informacji Indeksy wyszukiwawcze Budowa rekordu w Promaxie Zapytania.
Wprowadzenie do JSP Copyright © Politecnico di Milano September 2003 Translation: Kamil Żyła, Politechnika Lubelska.
Warszawa, luty 2013 PinkPoland Profil socio-demograficzny witryn erotycznych sieci PinkPoland.
Web Serwisy w praktyce Technologie internetowe ( )
Konfiguracja kont w programie Adobe Dreamweaver
Metadane w opisie hurtowni danych oraz procesie ETL
SQL - Structured Query Language
XML – eXtensible Markup Language
Wybrane zagadnienia relacyjnych baz danych
Programowanie obiektowe 2013/2014
ZWIĄZKI MIĘDZY KLASAMI KLASY ABSTRAKCYJNE OGRANICZENIA INTERFEJSY SZABLONY safa Michał Telus.
Aplikacje internetowe
W W W Łukasz Stochniał.
XML Publisher Przedmiot i zakres szkolenia Przedmiot i zakres szkolenia Przeznaczenie XML Publisher Przeznaczenie XML Publisher Definiowanie Definiowanie.
Toruń 28/ Metadane SAML opisują, w jaki sposób ma być realizowana komunikacja pomiędzy IdP i SP Metadane są typowo prezentowane w postaci XML.
Model obiektowy bazy danych
Wyszukiwanie informacji w internecie
System plików.
Treści multimedialne - kodowanie, przetwarzanie, prezentacja Odtwarzanie treści multimedialnych Andrzej Majkowski informatyka +
Treści multimedialne - kodowanie, przetwarzanie, prezentacjaOdtwarzanie treści multimedialnych Andrzej Majkowski informatyka +
Treści multimedialne - kodowanie, przetwarzanie, prezentacja Odtwarzanie treści multimedialnych Andrzej Majkowski 1 informatyka +
Piotr Czapiewski Wydział Informatyki ZUT. Web Services Description Language.
XML w serwisach webowych. Zapotrzebowanie na serwisy XML.
Waldemar Bartyna 1 Programowanie zaawansowane LINQ to XML.
1. Podaj definicję kartografii internetowej. 2. Geographic Markup Language: a) Jest schematem XML a) Opisuje obiekty w fizycznej przestrzeni a) Jest formatem.
Podstawy programowania
INTERNET jako „ocean informacji”
Bartosz Pawlak Wiktor Paliwoda Bezpieczeństwo Systemów Operacyjnych IMAP vs POP.
ASP.NET Tworzenie i zarządzanie wyglądem aplikacji, tworzenie mapy witryny. Kontrolki nawigacyjne.
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu Społecznego 33 Modelowy program praktyk podnoszący jakość kształcenia studentów.
Bezpieczny internet.
Hipertekst HTML WWW.
Statystyki serwera www Serwer proxy Cash .....
Przeczytaj wszystko na temat wiadomości programu Microsoft SharePoint
Modele baz danych - spojrzenie na poziom fizyczny
Zapis prezentacji:

1 Od metadanych do inteligentnego Internetu Mariusz Olko 8 stycznia 2003

2 Metadane Informacja o informacji (sic!) Różnorakie informacje o dokumencie Data utworzenia Słowa kluczowe Autor Schemat bazy danych Powiązania klucz główny/klucz obcy Typy i rozmiary pól Więzy integralności

3 Skąd się biorą metadane? Zdania wypowiedzianie (zapisane) niezależnie od dokumentu Wyróżnione elementy w dokumencie Pan Tadeusz <META http-equiv="Content-Type" content="text/html; charset=iso ">

4 Zdania o dokumencie ma autora o nazwie Mariusz Olko Olko autor Podmiot subject Orzeczenie predicate Dopełnienie object

5 Resource Description Framework Zdania są zapisane w postaci trójek (subject, predicate, object) Podmiotem (subject) w trójce są zasoby (resources), które Mogą być adresowalne w internecie np. dokument HTML Mogą też oznaczać koncepty abstrakcyjne np. osobę lub dziedzinę sztuki Predykat w trójce jest zawsze konceptem abstrakcyjnym określającym własność Dopełnieniem trójki może być Inny zasób abstrakcyjny lub rzeczywisty Bądź też literał czyli napis nie podlegający interpretacji w ramach RDF

6 Universal Resource Identifier Zasoby są identyfikowane przez URI URI nie musi być URL, tzn. nie musi oznaczać lokalizacji internetowej Używając przestrzeni nazw w serializacji XML można zdefiniować prefix rdf dla URI przestrzeni nazw Zapisać pełne URI zasobu w postaci skróconej rdf:label Indetyfikator przestrzeni nazwNazwa lokalna

7 Interpretacja trójek RDF Zbiór zdań RDFowych reprezentuje graf skierowany Węzły z których wychodzą łuki reprezentują zasoby Łuki reprezentują własności Specyfikacja RDF definiuje sposób serializacji grafu do XMLa Grafy RDFowe można w sposób prosty łączyć Symfonia 8L. Van Beethoven kompozytor Płyta DG H. Von Karajan dyrygent utwór

8 Narzędzia do modelowania RDF definiuje podstawowy zestaw pojęć, który może być użyty do modelowania informacji i budowy ontologii Własności dotyczące zasobów label (krótka etykieta nadana zasobowi) description (dłuższy opis zasobu) type (określenie typu zasobu) Własności dotyczące klas subClassOf (podział klasy na podklasy) Własności dotyczące własności subPropertyOf domain (klasa obiektów, które mogą być podmiotem zdań z danym predykatem) range (klasa obiektów, które mogą być dopełnieniem zdań z danym predykatem)

9 Inferencje w RDFach Nadanie interpretacji językowi oraz predykatom służącym do budowania modeli pozwala na skonstruowanie reguł zwanych regułami inferencji. Reguła dotycząca podklas Jeżeli A jest podklasą B i a jest obiektem typu A To a jest też obiektem typu B (A, rdfs:subClassOf, B) (a, rdf:type, A) => (a, rdf:type B)

10 Reguły inferencyjne Reguła dotycząca podwłasności Jeżeli P jest podwłasnością B i zachodzi (a, P, b) To zachodzi też (a, R, b) (P, rdfs:subPropertyOf, R) (a, P, b) => (a, R, b) Reguła dotycząca dziedziny własności Jeżeli dziedziną P jest klasa A oraz a ma własność P o dowolnej wartości To a jest typu A (P, rdfs:domain, A) (a, P, x) => (a, rdf:type, A)

11 Reifikacja Nie można w prosty sposób wypowiadać zdań na temat innych zdań! Aby można było się wypowiedzieć na temat jakiegoś zdania, musi ono zostać zreifikowane tzn. zamienione na zestaw zdań (metazdań) Prawdopodobieństwo faktu, że 9 stycznia będzie temperatura 20 stopni celsjusza jest bliskie zeru Dzień 9/01/2004Temperatura20 stopni 0,01 object predicate subject prawdopodobieństwo

12 Dublin Core Słownik pojęć Title Creator Subject Description Publisher Contributor Date Type Format Source Language Rights Dublin Core Metadata Initiative (DCMI) jest organizacją której celem jest promowanie stosowania standardów metadanych i rozwój specjalizowanych słowników pojęć do opisu zasobów Zdefiniowane zostały podstawowe i rozszerzone słowniki pojęć Określono standardy użycia np. w HTMLowych tagach META Określono schematy zapisu metadanych w postaci grafów RDF Namespace URI

13 RDF Site Summary (RSS) Powstał dla potrzeb portalu my.netscape.com syndykacji informacji XMLowa lista hiperłączy do zasobów internetowych razem z metainformacjami dotyczącymi tych zasobów Zazwyczaj pliki RSS są pobierane przez programy agregujące przetwarzane i wyświetlane jako hiperlinki do oryginalnych zasobów Listy mogą zawierać: Wiadomości z ostatniej chwili Listę ostatnich wpisów w blogu lub najnowszych artykułów w serwisie List ofert pracy Wyniki poszukiwań Namespace URI Słownik pojęć Channel Item Title Description

14 RSS example

15 Friend-Of-A-Friend (FOAF) W jaki sposób jednoznacznie zidentyfikować osobę? Użyć jej adres ! Osoby publikują swoje pliki FOAF Pliki mogą zawierać informacje np. nt. miejsca pobytu projektów na których pracują osób które znają Roboty lub aplikacje agregują informacje z wielu źródeł Zagregowane informacje mogą zostać wykorzystane do prezentacji np. Kogo ze znajomych mogę spotkać w mieście w którym odbywa się konferencja na którą jadę? Słownictwo Agent Person name nick Mbox knows depiction publications homepage organization group project

16 Łączenie grafów RDFowych "M. Olko" name mbox knows mbox Jan Kowalski name mbox WAW contact:nearestAirport airport:iataCode

17 Łączenie grafów RDFowych "M. Olko" name mbox knows mbox Jan Kowalski name mbox WAW contact:nearestAirport airport:iataCode Wartość własności mbox indentyfikuje jednoznacznie osobę!

18 Łączenie grafów RDFowych "M. Olko" name mbox knows Jan Kowalski name mbox WAW contact:nearestAirport airport:iataCode Wartość własności mbox indentyfikuje jednoznacznie osobę!

19 OWL Web Ontology Language

20 OWL Obecnie Proposed Recommendation w W3C Bardziej sformalizowany język budowania ontologii Dostosowany do możliwości implementacji silników inferencyjnych Ogranicza wolność opisu RDFowego dając w zamian dobrze zdefiniowaną interpretację zdań Składnia oparta o dokumenty RDF, "internetowy" charakter Semantyka korzysta z dorobku AI w zakresie reprezentacji wiedzy

21 Słownictwo OWL Definicja klasy owl:oneOf przez wyliczenie przynależnych instancji owl:restriction i owl:onProperty przez podanie ograniczenia na własności instancji owl:allValuesFrom wszystkie wartości własności są w podanej klasie owl:someValuesFrom przynajmniej jedna w własności jest w podanej klasie owl:minCardinality i owl:maxCardinality Przez wykonanie operacji teoriomnogościowej na innych klasach owl:intersectionOf owl:unionOf owl:complementOf

22 OWL słownictwo owl:sameAs stwierdza tożsamość dwóch obiektów owl:equivalentProperty ta sama dziedzina i ten sam zakres mogą mieć całkowicie inne znaczenie Owl:TransitiveProperty przechodniość własności Owl:FunctionalProperty Własność P, która może mieć tylko jedną unikalną wartość dla każdej instancji obiektu Inaczej jeżeli dwa obiekty mają jako tę samą wartość P to oznacza, że obiekty są tożsame owl:differentFrom Dwa URI odnoszą się do dwóch różnych bytów

23 OWL - trzy poziomy języka OWL full Pozwala mieszać słownictwo RDFSchema oraz OWL Pozwala na dowolność w opisywaniu obiektów, klas i własności OWL DL Stawia ograniczenia na używanie słownictwa RDFSchema Wymaga rozdzielenia klas, własności, instancji Pozwala na zastosowanie istniejących już silnych narzędzi do wnioskowania opartych na Description Logic OWL Lite Stawia te same ograniczenia co OWL DL na użycie słownictwa RDFSchema oraz na rozdzielenie klas, własności i instancji Wybiera prosty podzbiór słownictwa umożliwiający łatwy start użytkownikom oraz zapewniający prostotę implementacji narzędzi

24 Semantic Web "The Semantic Web will bring structure to the meaningful content of Web pages, creating an environment where software agents roaming from page to page can readily carry out sophisticated tasks for users." Scientific American, May 2001 Scientific American, May 2001 Internetowa infrastruktura publikacji danych neutralna (niezależna od aplikacji) umożliwiająca przetwarzanie informacji przez programy w celu automatyzacji agregacji wielokrotnego użycia

25 Semantic Web - aplikacje Poprawienie jakości wyszukiwania informacji Umożliwienie wyszukiwania usług sieciowych Automatyzacja czynności codziennych Rezerwacja wizyty u lekarza, w urzędzie Przygotowanie podróży Uwaga To jest ciągle wizja Technologie się pojawiają ale Zdania nie oznaczają faktów URI nie identyfikują bytów rzeczywistych Potrzebna jest kodyfikacja wiedzy codziennej Pojawiają się problemy związane z etyką oraz bezpieczeństwem

26 Projekt SWAP Kombinacja dwóch techonologii Peer-to-Peer Semantic Web Zarządzanie informacją i wiedzą w środowisku rozproszonym Konwencjonalny systemy zarządzania wiedzą Trudne w obsłudze Narzucają własne widzenie świata (ontologie) Wymagają "oddania" dokumentów Systemy peer-to-peer Dużo efektywniejsze w wymianie informacji Wyszukiwanie informacji jest zbyt proste - słowa kluczowe Nie umożliwiają dzielenie się "wiedzą" (ontologiami)

27 Korzyści płynące ze SWAPa Benefit Investment Sophisticated, but conventional KM System P2P based KM System SWAP System n Think big! n Start small! n Grow step by step!

28 Scenariusz Ontologia jest budowana ze struktury informacji przechowywanych na komputerze takich jak: Dokumenty Bookmarki Poczta Zostają automatycznie sklasyfikowane i udostępnione innym użytkownikom Użytkownicy mogą podawać zapytania dotyczące ontologii przechowywanej w węźle Komputer może gromadzić "wiedzę" przechowywaną na innych węzłach poprzez intergrację wyników zapytań Użytkownicy mogą pobierać dokumenty zgromadzone na odległych węzłach

29 Resource Sharing Message Informer Advertisement Discoverer Query Replier Query Rewriter Peer Selector Query External Knowledge Source Adapter Resource Retrieval Local Node Repository (Adapter) Communication Adapter JXTA Network Knowledge Source Integration Ontology Extractor Ontology Merger Ontology Integrator Metadata Integrator Knowledge Sources SWABBI User Interface Query Formulator Visualizer Edit Statements Request Resource Answer SWAP Architecture

30 Referencje Resource Description Framework Resource Description Framework na serwerze W3C OWL Web Ontology Language Strony inicjatych opartych o RDF Inicjatywa Dublin Core Projekt Friend-Of-A-Friend Artykuły Scientific American nt. Semantic Web Tutorial RSS