Technologie wspierające zarządzanie wiedzą
Zarządzanie wiedzą Kontekst organizacyjny zarządzania wiedzą. Techniki wspierające zarządzanie wiedzą: sieci semantyczne, wyszukiwanie wsparte modelem wiedzy. Standardy modelowania wiedzy: TopicMaps, Resource Description Framework.
Modne hasło: zarządzanie wiedzą Wiedza – najcenniejszy zasób w organizacji. Zarządzanie wiedzą: powstawanie wiedzy, przesyłanie wiedzy (dzielenie się wiedzą), wykorzystanie wiedzy.
Wiedza a kultura organizacyjna Psychologiczne bariery przepływu wiedzy: "gromadzisz wiedzę – masz władzę – budujesz swój autorytet", "korzystając z cudzej wiedzy przyznajesz, że jesteś niekompetentny". Syndrom klasy szkolnej. Motywowanie do dzielenia się wiedzą: ocenianie pracowników, udział w efektach wykorzystania wiedzy, tworzenie warunków do wymiany wiedzy: czas i miejsce, technologia.
Rozwiązania System plików (na dysku sieciowym). System zarządzania dokumentami/treścią: metainformacje, workflow, wersje, uprawnienia, ..., SGML/XML, Intranet – zarządzanie i publikowanie treści w jednym. Portal korporacyjny: każdy jest zarówno czytelnikiem, jak i autorem, udostępnianie zintegrowanej informacji z: systemów biznesowych organizacji, Internetu; jednokrotna autoryzacja dostępu do wszystkich zasobów, personalizacja. Czy to jest zarządzanie wiedzą?
Co autor miał na myśli Co ciekawsze zasłyszane definicje systemu zarządzania wiedzą: baza wszystkich pracowników, ich doświadczeń i umiejętności, pozwalająca na znalezienie osoby o zadanym doświadczeniu, system umożliwiający określenie statusu i miejsca przebywania przesyłki (w firmie kurierskiej), system przekazu obrazu wideo, pozwalający ekspertom na zdalną diagnozę i naprawę uszkodzonych szybów naftowych. Czy to jest zarządzanie wiedzą?
Czym tak na prawdę jest wiedza? To więcej niż: informacja, tekst, dokument. To sieć powiązań, relacji, skojarzeń między informacjami, doświadczeniami, spostrzeżeniami. Tymczasem: systemy zarządzania dokumentami, systemy zarządzania treścią, portale korporacyjne operują na dokumentach!
Wiedza a technologia Modelowanie wiedzy: ontologia – schemat modelowanej dziedziny: typy pojęć, typy relacji między pojęciami, mapa wiedzy: abstrakcyjne pojęcia, powiązania między pojęciami, wystąpienia pojęć w dokumentach. System zarządzania wiedzą: budowanie ontologii, budowanie, rozwijanie mapy wiedzy, nawigacja po mapie wiedzy.
Mapa wiedzy – przykład ryba śledzie w oliwie śledź świeży śledź główny składnik rodzaj śledzie w oliwie rodzaj śledź świeży śledź grupa podobny do przygotowywany z rodzaj śledzie w śmietanie śledź solony główny składnik grupa danie rybne składnik można zastąpić natka pietruszki suszona pietruszka
Ontologia – przykład Typy pojęć: przepis, grupa przepisów, składnik. Relacje: składnik wchodzi w skład przepisu, składnik jest głównym składnikiem przepisu, składnik jest rodzaju składnik, składnik jest przygotowywany ze składnika, składnik można zastąpić składnikiem, przepis należy do grupy przepisów, przepis jest podobny do przepisu
Wiedza operacyjna a wiedza abstrakcyjna opisuje konkretne instancje obiektów i ich własności, np.: klienta Jana Kowalskiego, polisę nr 1234-5678/2002; często się zmienia, ma charakter relacji bazodanowych. Wiedza abstrakcyjna: opisuje własności abstrakcyjnych bytów (klas obiektów), np: zakres ubezpieczenia terminowego na życie; nie zmienia się w wyniku działalności operacyjnej, ma charakter luźnej sieci powiązań. Ontologia przedstawiona na poprzednich slajdach zawiera więc wiedzę operacyjną – opisującą konkretne projekty, osoby z nimi związane, oraz zawierającą dokumenty projektowe. Oczywiście powyższy podział ma charakter akademicki – pozwala nam uzmysłowić sobie różnicę, ale tak na prawdę rzadko występuje w czystej postaci w przyrodzie. Często bowiem łączymy w mapie wiedzy elementy wiedzy abstrakcyjnej oraz operacyjnej, np. opisując w części abstrakcyjnej własności ubezpieczenia terminowego na życie, oraz dla konkretnych polis z części operacyjnej – określając ich rodzaj poprzez powiązania z obiektami części abstrakcyjnej.
Sztuczna inteligencja a zarządzanie wiedzą Zarządzanie wiedzą w organizacji: to człowiek, a nie maszyna, wykorzystuje wiedzę, problemem jest efektywny dostęp do zgromadzonej wiedzy. Reprezentacja wiedzy w sztucznej inteligencji: logika klasyczna, logiki niemonotoniczne i inne, sieci semantyczne. W sztucznej inteligencji, metody reprezentacji wiedzy były konstruowane z myślą o ich automatycznym wykorzystaniu – np. poprzez wnioskowanie w systemie eksperckim. W kontekście zarządzania wiedzą w organizacji, sytuacja różni się tym, że zamiast automatycznie przetwarzać wiedzę, musimy zaprojektować efektywny sposób dostępu do niej przez człowieka. Problem reprezentacji wiedzy jest jednak wspólny dla obu obszarów. Logika (zdania logiczne) jest najprostszym sposobem kodowania wiedzy. Logika klasyczna odwołuje się jedynie do wiedzy zakodowanej, zapisanej w systemie, podczas gdy logiki niemonotoniczne odwołują się także do braku wiedzy (np. brak informacji o tym, że klient pali papierosy, logiki te interpretują jako niepalenie). Sieci semantyczne pozwalają na zakodowanie logiki w sposób bardziej modularny – przy pomocy obiektów i powiązań. Umożliwiają także np. proste zakodowanie dziedziczenia.
Mapa wiedzy a dokumenty Wiedza zawarta w: pojęciach i powiązaniach w mapie wiedzy, treści dokumentów. Poeta napisał Warstwa pojęć autor dzieło Szekspir „Hamlet” Dokumenty nie należą w zasadzie do mapy wiedzy, lecz tworzą osobną warstwę dokumentów, które możemy dowiązać do pojęć mapy wiedzy, określając w ten sposób semantykę tych pojęć. Rozdział ten jest istotny, ponieważ wiedza jest zakodowana nie tylko w samej mapie wiedzy, ale także w treści dokumentów. Aby więc móc korzystać ze zgromadzonej wiedzy w sposób pełny, musimy potrafić w łatwy sposób znaleźć dokumenty zawierające interesującą nas treść. biografia zdjęcie treść Warstwa dokumentów Szekspir – biografia Hamlet by W. Shakespeare
Jak dotrzeć do wiedzy zawartej w dokumentach? Znajdowanie właściwych dokumentów: nawigacja po mapie wiedzy, wyszukiwanie pełnotekstowe: często wystarczy odnaleźć rozwiązanie podobne, na czym polega "podobieństwo"? jak je wyrazić? Wyszukując w treści dokumentów, powinniśmy uwzględnić: wiedzę zakodowaną w mapie wiedzy o zależnościach między pojęciami, wiedzę ukrytą. Rozwiązanie: wyszukiwanie wsparte modelem wiedzy. Komplementarną do nawigacji po mapie wiedzy metodą dotarcia do właściwej informacji, jest wyszukiwanie w treści dokumentów. Jednak zwykłe wyszukiwanie pełnotekstowe nie rozwiązuje problemu, ponieważ nie uwzględnia wiedzy, którą zawarliśmy w mapie wiedzy. Nie uwzględnia także wiedzy ukrytej, którą każdy ekspert posiada i na co dzień z niej korzysta, lecz z oczywistych powodów nie posiada jej system komputerowy. Chodzi tu np. o wiedzę o synonimach, terminach bliskoznacznych, czy też podobieństwach między podstawowymi terminami (np. o tym, że utrata wzroku jest rodzajem inwalidztwa). Wyszukiwanie wsparte modelem wiedzy pozwala wykorzystać tego typu wiedzę podczas wyszukiwania, skutkiem czego w wyniku wyszukiwania otrzymujemy nie tylko dokumenty zawierające szukany termin, ale też terminy podobne czy synonimy.
inteligentne odpowiedzi Wyszukiwanie a wiedza zapytanie Wyszukiwanie wsparte modelem wiedzy: konfrontuje zapytanie z modelem wiedzy, znajduje dokumenty semantycznie odpowiadające zapytaniu. baza wiedzy wiedza dane i dokumenty inteligentne odpowiedzi
Model wiedzy – przykład Typ: składnik. Wartości i podobieństwa: śledź śledź świeży śledź solony natka pietruszki suszona pietruszka koperek 100 90 80 60 20
Model wiedzy – przykład Typ: kaloryczność Funkcja podobieństwa: 100% user input
Idealny system zarządzania wiedzą Funkcjonalność portalu korporacyjnego plus: zasoby opisane mapą wiedzy: interfejs aktualizacji mapy wiedzy, nawigacja; wyszukiwanie wsparte modelem wiedzy: zadawanie zapytań w języku naturalnym, rozpoznawanie polskiej odmiany wyrazów.
Resource Description Framework Resource Description Framework – metodologia opisu zasobów (w Internecie). Zastosowania: metainformacje zasobów, modelowanie zależności pomiędzy zasobami, wnioskowanie na podstawie modelu wiedzy (RDQL – Resource Description Query Language, język zapytań), Semantic Web. RDF jest standardem modelowania i opisu informacji w sposób bardzo uogólniony, oparty na trójkach: obiekt (zasób), relacja (własność), wartość. Jego zastosowania widzi się przede wszystkim w kontekście Internetu, gdzie może służyć do opisywania metainformacji dokumentów (wówczas obiektem jest dokument).
Reprezentacja wiedzy w RDF Zdania logiczne: podmiot orzeczenie przedmiot np. A. A. Milne jest autorem „Kubusia Puchatka” Pojęcia: zasoby: „A. A. Milne”, „Kubuś Puchatek” typy właściwości: „jest autorem”, „słowo kluczowe” wartości właściwości: zasób „Kubuś Puchatek”, literał „miód” Typy właściwości są zasobami. Właściwości mogą być zasobami. Elastyczność: nie ogranicza się repertuaru właściwości. A. A. Milne jest autorem Kubuś Puchatek Zasobom przypisujemy właściwości. Formalnie, właściwość jest trójką: zasób, typ właściwości oraz jej wartość. Ponieważ typy właściwości są również zasobami, mogą same mieć właściwości. To samo dotyczy właściwości – mogą mieć własne właściwości. Stąd już bardzo blisko do Topic Maps. Ponieważ każdy może tworzyć swoje typy właściwości, sama RDF nie rozwiązuje problemu wyszukiwania. Musi dopiero przyjąć się pewien zbiór standardowych typów właściwości, który będzie powszechnie używany.
Budowanie ontologii w RDF Obiektowość: klasy obiektów, relacja podklasy, relacja bycia instancją. Typy właściwości: dziedzina – klasa obiektów, do których się odnosi (podmiotów), zasięg – klasa wartości właściwości. Dziedziczenie: wszędzie, gdzie dozwolone jest użycie klasy, można użyć jej podklas. Klasa jest zbiorem obiektów o tej samej charakterystyce. Na przykład, Jan Kowalski jest klasy osoba, zaś polisa nr 1234/2002 jest klasy polisa. Klasy możemy uszczegóławiać, tworząc ich hierarchię, np.: Jan Kowalski jest klasy mężczyzna, mężczyzna jest podklasą osoby.
Dziedziczenie w RDF A. A. Milne jest autorem „Kubusia Puchatka” Klasa: człowiek Podklasa: pisarz Instancja: A. A. Milne Klasa: dzieło Podklasa: książka Instancja: „Kubuś Puchatek” Własność: jest autorem Dziedzina (domain): człowiek Zasięg (range): dzieło
RDF Schema Zestaw podstawowych klas, zdefiniowanych w RDF, będących bazą do tworzenia własnych ontologii. Literal – wartość literalna, Seq – sekwencja wartości, Resource – zasób, Bag – "worek" wartości (zbiór z możliwością powtórzeń), Class – klasa, subClassOf – relacja bycia podklasą. Klasy te są zdefiniowane jako zwyczajne zasoby w strukturze RDF, tyle że o specjalnym znaczeniu dla aplikacji, która przetwarza struktury RDF. Dlatego RDF nazywamy standardem samoopisującym się.
Dokumenty w RDF Dokumenty vs. zasoby abstrakcyjne: zasób może mieć przypisaną właściwość – lokalizację, zasób może opisywać dokument – wtedy używamy lokalizacji do wskazania dokumentu, jeśli zasób nie ma lokalizacji, mamy do czynienia z zasobem abstrakcyjnym. Przykład: projekt: "system zarządzania wiedzą" dokument: "Specyfikacja funkcjonalna systemu zarządzania wiedzą" lokalizacja: /KM/dokumentacja/specyfikacje/spec-funkc.doc W zasadzie sieć RDF jest siecią abstrakcyjnych obiektów, nie mających nic wspólnego z dokumentami. Ale możemy przypisać pewnym obiektom specjalną właściwość – lokalizację, która będzie wskazywała położenie dokumentu związanego z obiektem. W przykładzie, zarówno projekt, jak i dokument, są zasobami w sieci RDF. Zasób dokument ma jedynie określoną lokalizację, która pozwala znaleźć właściwą treść dokumentu związanego z zasobem.
RDQL – język zapytań Resource Description Query Language: łatwy język zapytań wzorowany na SQL, dostępny dla popularnych języków programowania np. Java. Przykład: select ?user where (<http://strona.com>,<http://property/created-by>,?user)
Narzędzia RedFoot – aplikacja napisana w Pythonie, udostępniająca własną bibliotekę RDF oraz API Jena API – API do RDF napisane w Javie. empolis Knowledge Management Suite e:kms: zarządzanie zasobami informacyjnymi powiązanymi w sieć semantyczną, konfigurowanie ontologii, automatyczne publikowanie zasobów na witrynie internetowej. IsaViz – program do wizualnego projektowania ontologii.
Geneza Topic Maps "W dzisiejszych czasach, większość ludzi nie potrzebuje więcej informacji. Jeśli już, to potrzebują jej mniej, ponieważ już toną w ogromnych jej ilościach." Steve Pepper "Euler, Topic Maps and Revolution" Oryginalna motywacja (1991): jednolity standard do reprezentacji indeksów, scalanie indeksów. Pomysł: utworzenie nad warstwą zasobów warstwy abstrakcyjnych pojęć, powiązanie obu warstw poprzez wystąpienia pojęć w zasobach.
Pojęcia Pojęcie (topic): abstrakcyjny byt, "co autor miał na myśli". Typ pojęcia: także jest pojęciem. Pojęcie posiada: nazwy, wystąpienia, role pełnione w powiązaniach.
Wystąpienia Wiążą pojęcia z warstwą zasobów: zasoby nie są częścią mapy pojęć. Nadają sens pojęciom. Role wystąpień.
Powiązania Tworzą sieć zależności między pojęciami: typy powiązań, role pojęć w powiązaniu, powiązania łączące więcej niż dwa pojęcia.
Warszawa Polska empolis Kompletny przykład Miasto Firma urodzony w człowiek miejsce stolica państwo miasto siedziba instytucja miasto Polska Warszawa Chopin empolis Polska Warszawa Polska empolis
Co z tego mamy? Mapa pojęć jako samodzielny, niezależny byt (dokument): oddzielona od warstwy zasobów, linki (powiązania) niezależne od warstwy zasobów. Więc: nad danym zbiorem zasobów można skonstruować wiele różnych map, jedna mapa może być użyta do nawigacji po wielu zbiorach zasobów. Reprezentacja wiedzy! "The GPS of the information universe".
Zastosowania Wydawnictwa encyklopedyczne: wartość dodana do informacji encyklopedycznej (poprzez możliwość łatwego znalezienia informacji), Mother Encyclopaedia. Zarządzanie witryną internetową: struktura witryny jako mapa pojęć, interfejs nawigacyjny – dzięki odpowiednim przekształceniom XSLT. Zarządzanie wiedzą w organizacjach. Wymiana/przesyłanie zakodowanej wiedzy.
Status Topic Maps: pierwotnie zwany Topic Navigation Maps, standard ISO/IEC 13250:2000, twórcy: Michel Biezunski, martin Bryan, Steven R. Newcomb, oparty na SGML-u i Hy-Time. XML Topic Maps (XTM): rozwijany przez TopicMaps.org – niezależne konsorcjum specjalistów, aktualnie dostępna wersja: 1.0 z 6.08.2001, twórcy: Steve Pepper i Graham Moore, oparty na XML-u i XLink.
XML Topic Maps – przykład <topic id="kompozytor"> <baseName><baseNameString>kompozytor</baseNameString></basename> </topic> ... <topic id="chopin"> <instanceOf><topicRef xklink:href="#kompozytor"/></instanceOf> <baseName><baseNameString>Fryderyk Chopin</baseNameString></basename> <baseName><baseNameString>Chopin, Fryderyk</baseNameString></basename> <occurrence><resourceRef xlink:href="http://www.encyklopedia.pl/chopin.htm"/></occurence> <topic id="polska"> <instanceOf><topicRef xklink:href="#kraj"/></instanceOf> <baseName><baseNameString>Polska</baseNameString></basename> <occurrence><resourceRef xlink:href="http://www.encyklopedia.pl/polska.htm"/></occurence> <association> <instanceOf><topicRef xklink:href="#urodzony-w"/></instanceOf> <member><rolespec><topicRef xklink:href="#osoba"/></rolecpec> <topicRef xlink:href="chopin"/> </member> <member><rolespec><topicRef xklink:href="#kraj"/></rolecpec> <topicRef xlink:href="polska"/> </member> </assoc> </topicMap>
TMQL – Topic Maps Query Language Trwają prace rozwojowe. Przykład: SELECT topic x WHERE x instance_of topic named "Job seeker” AND assoctemp y named "Person is skilled in” AND x in (assoc template_is y) has topic named "Java programming” AND x in (assoc template_is y) has topic named "German – fluent”
Równoważna siła wyrazu: RDF Topic Maps Bardzo prosty aparat pojęciowy. Skomplikowany aparat pojęciowy. Wsparcie dla ontologii. Brak wsparcia dla ontologii. Równoważna siła wyrazu: W RDF można zakodować dowolną mapę Topic Map. Przy pomocy Topic Map można zakodować sieć RDF.
Narzędzia Topic Maps Loom, InfoLoom www.infoloom.com k42, empolis www.topicmaps.com www.empolis.co.uk Ontopia Knowledge Suite www.ontopia.net TM4J, Topic Maps for Java tm4j.org www.techquila.com