Simple Knowledge Organisation System SKOS w pigułce Simple Knowledge Organisation System Marcin Roszkowski
PLAN WYSTĄPIENIA Wprowadzenie Czym jest SKOS? Dlaczego SKOS? Semantic Web w 5 minut, Linked Data. Czym jest SKOS? Dlaczego SKOS? SKOS w praktyce. Krytyka SKOS. Wnioski.
SEMANTIC WEB W 5 MINUT Tim Berners-Lee (2007) Sukces World Wide Web: nieograniczone możliwości łączenia informacji (np. hiperłącza), otwarte standardy, rozdzielenie warstw sieci (komunikacja, wizualizacja, przetwarzanie).
SEMANTIC WEB W 5 MINUT dzisiejsza sieć to sieć dokumentów (statyczne, dynamiczne), dane w dokumentach zrozumiałe tylko dla ludzi, aplikacje sieciowe nie są w stanie przetworzyć danych.
SEMANTIC WEB W 5 MINUT
SEMANTIC WEB W 5 MINUT utrzymanie postulatu AAA (Anyone can say Anything about Any topic), rozpowszechnienie standardów opisywania treści, „zrozumienie” danych przez aplikacje, możliwość powiązania danych.
SEMANTIC WEB W 5 MINUT Podstawowe standardy/specyfikacje: RDF (Resource Description Framework) - specyfikacja modelu metadanych, RDF Schema (RDFS) - język reprezentacji wiedzy, OWL (Web Ontology Language) – język modelowania ontologii internetowych, rozszerzenie RDFS.
SEMANTIC WEB W 5 MINUT Cel standaryzowany i spójny model danych, zmiana perspektywy - dane, dane powiązane (Linked Data).
LINKED DATA nie model danych, lecz filozofia, metoda ekspresji, reprezentacji, łączenia i współdzielenia danych, Tim Berners-Lee: data hugging, narzędzia: identyfikator URI, protokół http, RDF oraz RDFS/OWL.
LINKED DATA Cztery zasady Linked Data: Używaj URI jako nazwy dla obiektów. Stosuj protokół http, po to by uzyskać informacje o tych obiektach. Aktywacja poszczególnego URI ma spowodować pozyskanie użytecznych informacji. Wykorzystuj powiązania z innymi obiektami za pomocą URI, aby zapewnić możliwość eksploracji i odkrywania innych obiektów.
LINKED DATA FOAF (Friend Of A Friend), format reprezentacji danych personalnych, internetowa tożsamość, wizytówka sieciowa, rozszerzenie RDF.
FOAF
FOAF <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:admin="http://webns.net/mvcb/"> </foaf:PersonalProfileDocument> <foaf:Person rdf:ID="me"> <foaf:name>Marcin Roszkowski</foaf:name> <foaf:givenname>Marcin</foaf:givenname> <foaf:family_name>Roszkowski</foaf:family_name> <foaf:mbox_sha1sum>e59bff904001aa669cc84a983fcbf6e4b97e2299</foaf:mbox_sha1sum> <foaf:homepage rdf:resource="http://biblioteka.unipt.pl"/> <foaf:based_near rdf:resource="http://sws.geonames.org/3088972/" rdfs:label="Piotrków Trybunalski"/> <foaf:depiction rdf:resource="http://4.bp.blogspot.com/_4XgyLS9g-Xg/roszkowski.jpg"/> <foaf:workplaceHomepage rdf:resource="http://mroszkowski.blogspot.com"/> <foaf:schoolHomepage rdf:resource="Uniwersytet Jana Kochanowskiego. Filia w Piotrkowie Trybunalskim"/></foaf:Person> </rdf:RDF>
FOAF + GEONAMES
LINKED DATA
LINKED DATA Formaty danych / zbiory danych: FOAF (Friend Of A Friend), SIOC (Semantically-Interlinked Online Communities) Project – format danych do opisu społeczności, jej członków, zainteresowań DOAP (Description of a Project) - format danych do opisu projektów open source, jego twórców, przebiegu, efektów, Kartoteki wzorcowe VIAF (The Virtual International Authority File), DBpedia – ustrukturyzowane dane pochodzące z Wikipedii. SKOS (Simple Knowledge Organisation System).
CZYM JEST SKOS? Czym jest SKOS? format danych dla systemów porządkowania pojęć (systemy organizacji wiedzy), formalny język reprezentacji struktury SOW, rozszerzenie RDF, rekomendacja World Wide Web Consortium - W3C (sierpień 2009 r.)
CZYM JEST SKOS? Systemy organizacji wiedzy (SOW): systemy porządkowania pojęć, tradycyjne języki informacyjno- -wyszukiwawcze, sieciowe systemy organizacji wiedzy: taksonomie internetowe, ontologie.
OPIS W SKOS opis pojęcia z wykorzystaniem składni RDF, Trójki RDF (RDF triples) : podmiot – predykat – obiekt, pojęcie – predykat – wartość. Przywołanie pojęcia za pomocą indywidualnego URI w opisywanym zbiorze.
OPIS W SKOS <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:skos="http://www.w3.org/2004/02/skos/core#"> <skos:Concept rdf:about="http://www.ukat.org.uk/thesaurus/concept/1750"> <skos:prefLabel>Economic cooperation</skos:prefLabel> </skos:Concept> </rdf:RDF>
CECHY SKOS Standaryzowany zbiór klas i własności, które służą do: identyfikacji pojęcia: skos:Concept za pomocą jego URI http://bn.org.pl/jhp/concept/1750 (pojęcie językoznawstwa) identyfikacji SOW: skos:ConceptScheme np. JHP BN
CECHY SKOS ustalenia nazw dla pojęcia i określenie ich statusu: skos:prefLabel (w różnych językach etnicznych) Językoznawstwo @pl, skos:prefLabel Linguistics @en, skos:altLabel Lingwistyka, skos:hiddenLabel Językonzawstwo,
CECHY SKOS dodatkowych informacji o znaczeniu pojęcia i jego zmianach: skos:note, skos:scopeNote, skos:definition, skos:editorialNote,
CECHY SKOS ustalenia relacji znaczeniowych pomiędzy pojęciami: relacja nadrzędności zakresowej skos:broader, relacja podrzędności zakresowej skos:narrower, relacja skojarzeniowa skos:related,
JHP W SKOS
JHP W SKOS <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:skos="http://www.w3.org/2004/02/skos/core#"> <skos:Concept rdf:about="http://bn.org.pl/jhp/concept/1750"> <skos:prefLabel>Językoznawstwo</skos:prefLabel> <skos:altLabel>Lingwistyka</skos:altLabel> <skos:hiddenLabel>Językoznwastwo</skos:hiddenLabel> <skos:broader rdf:resource="http://bn.org.pl/jhp/concept/4382"/> <skos:narrower rdf:resource="http://bn.org.pl/jhp/concept/2108"/> <skos:narrower rdf:resource="http://bn.org.pl/jhp/concept/9505"/> <skos:narrower rdf:resource="http://bn.org.pl/jhp/concept/15053"/> <skos:narrower rdf:resource="http://bn.org.pl/jhp/concept/18987"/> <skos:related rdf:resource="http://bn.org.pl/jhp/concept/3250"/> <skos:inScheme rdf:resource="http://bn.org.pl/jhp"/> </skos:Concept> </rdf:RDF>
JHP W SKOS
EKSPRESJA SKOS Siła ekspresji SKOS pozwala również na uwzględnienie: sztucznego systemu notacyjnego, np. dla klasyfikacji: <skos:notation>81</skos:notation>, odwzorowanie fasetowej struktury pola semantycznego: <skos:collection>Procesy</skos:collection> odwzorowanie zależności pomiędzy pojęciami z różnych SOW (mapowanie), wykładniki typów zgodności zakresowej: skos:exactMatch, skos:closeMatch.
ELASTYCZNOŚĆ SKOS
SOW W SKOS UK Archival Thesaurus (UKAT), The General Multilingual Environmental Thesaurus (GEMET), Australian Public Affairs Information Service (APAIS) Thesaurus, Tezaurus AGROVOC, Library of Congress Subject Headings (LCSH) Medical Subject Headings (MeSH), GeoNames, kartoteka wzorcowa nazw geograficznych, UNESCO Thesaurus, ISO639 Codes for the representation of names of languages.
SOW W SKOS
DLACZEGO SKOS? wspólny model danych dla opisu SOW, opis SOW musi być zrozumiały dla aplikacji, SOW muszą być współdzielone, SOW jako platforma wspólnego odniesienia.
JAK TO DZIAŁA? Rezultaty wyszukiwania Rezultaty wyszukiwania Rezultaty JIW SOW1 SOW2 OPAC BAZA1 BAZA2
JAK TO DZIAŁA? API
http://www.flickr.com/photos/dullhunk/639163558/sizes/l/
JAK TO DZIAŁA?
KRYTYKA SKOS format danych vs. mechanizmy ich przetwarzania, wymiar technologiczny: aplikacje eksplorujące i przetwarzające linked data, języki zapytań (np. SPARQL), mechanizmy wizualizacji RAW DATA,
KRYTYKA SKOS wymiar technologiczny: problemy: narzędzia opisu SOW w SKOS (np. Protege, Tematres) problemy: reprezentacja niesamodzielnych jednostek leksykalnych (symbole pomocnicze, określniki), reprezentacja zdań JIW.
PODSUMOWANIE formalizacja umożliwia automatyczne przetwarzanie, bariery: odległość, język, granice dyscyplinarne, SKOS < Linked Data, projekt nadal rozwijany, ocena bibliotekarzy?
PODSUMOWANIE SKOS = format danych dla SOW, potrzeba współdzielonych zbiorów danych, co z „naszymi” formatami?
PODSUMOWANIE RAW DATA NOW !
Simple Knowledge Organisation System SKOS w pigułce Simple Knowledge Organisation System Marcin Roszkowski Dziękuję za uwagę