Wizualizacja Wikipedii Julian Szymański Julian Szymański Wydział Elektroniki Telekomunikacji i Informatyki Politechniki Gdańskiej Włodzisław Duch Katedra Informatyki Stosowanej Uniwersytetu Mikołaja Kopernika Nanyang Technological University, Singapore Google: Duch W Wizualizacja Wiedzy, Warszawa 11/12/2010
Strona naukowa Jak mózgi, używając masowo równoległych procesów, reprezentują wiedzę i umożliwiają wnioskowanie? L. Boltzmann (1899): “Wszystkie idee i pojęcia to tylko wewnętrzne obrazy wyrażające się w mowie przez kombinację dźwięków.” „Zadaniem teorii jest skonstruować obraz zewnętrznego świata, który istnieje tylko w naszej głowie…”. L. Wittgenstein (Tractatus 1922): myśli to obrazy tego, w jaki sposób rzeczy istnieją w świecie, propozycje wskazują na te obrazy. Kenneth Craik (1943): umysł konstruuje „w małej skali" modele rzeczywistości by antycypować zdarzenia, rozumować i wyjaśniać. P. Johnson-Laird (1983): modele mentalne to psychologiczne reprezentacje rzeczywistych, hipotetycznych lub wyobrażonych sytuacji. J. Piaget: dzieci tworzą sobie schematy rozumowania zgodne z logiką FOL. Duch W (2002) Geometryczny model umysłu. Kognitywistyka i Media w Edukacji Duch W (2010) Reprezentacje umysłowe jako aproksymacje stanów mózgu
Strona praktyczna Szukanie oparte na słowach kluczowych jest ograniczone ze względu na wieloznaczność i niejednoznaczność (synsety) pojęć. Ludzie mają oczekiwania i skojarzenia, ale jeśli nie znają specyficznego słownictwa trudno znaleźć informację w nowych obszarach wiedzy. Eksploracja artykułów encyklopedii: zbyt wiele linków w ogólnych artykułach, brak spojrzenia na całą domenę przefiltrowanego przez zainteresowania użytkownika: co ciekawego ma „neuroscience” do powiedzenia na temat „attention” i „neural synchronization”? Statyczne linki nie wystarczą: procesy prymowania (priming) w mózgu tworzą sieci funkcjonalne aktywizując wybrane połączenia grup neuronów, zwracamy uwagę i interpretujemy tylko to co pasuje do oczekiwań w określonym kontekście. Semantyczne prymowanie: przygotowuje drogę dla aktywacji sieci neuronów pobudzając rozległe obszary mózgu, przygotowując je do przyjęcia informacji, ujednoznaczniając sens pojęć, prowadząc do jednoznacznej interpretacji informacji (mowy i tekstów).aktywacji sieci neuronów
Czy słowa opisują pojęcia? 329 ras psów w 10 kategoriach: Sheepdogs & Cattle Dogs; Pinscher & Schnauzer; Spitz & Primitive; Scenthounds; Pointing Dogs; Retrievers, Flushing Dogs & Water Dogs; Companion & Toy Dogs; Sighthounds Własności z licznych ontologii, częściowo ręcznie poprawiane, służyły do zgadywania za pomocą gry w 20 pytań jaka to rasa => marna dokładność! Kategorie oparte na podobieństwie wizualnym są całkiem odmienne niż kategorie stosowane przez związki kynologiczne oparte na zachowaniu psów lub kategorie biologiczne. Słowa wskazują to, co już wiemy => ale nie wszystkim stanom mózgu odpowiadają symbole. Komunikacja ogranicza się do tego, co już przynajmniej częściowo wiemy Widzisz to co wiesz i wiesz to co widzisz.
Imitacja zaprowadzi nas daleko …
Mapy mózgu Mapy mózgu: spróbuj przedstawić organizację informacji podobnie jak w mózgu eksperta. Wiele książek (T. Buzan i inni). Wiele programów do rysowania. TheBrain ( interfejs oparty na hierarchicznych mapach linków internetowych. Liczne programy do graficznej reprezentacji infromacji. Nasza implementacja (Szymanski): Wordnet, Wikipedia i inne: grafy powiązań linków i semantycznych podobieństw dokumentów.
Atlas semantyczny spirit: 79 słów 69 klik, czyli minimalnych jednostek znaczenia. Synset = zbiór synonimów
Sieć semantyczna Automatycznie tworzenie sieci semantycznych na podstawie analizy tekstów, w których znajdujemy własności pojęć, sprawdzamy za pomocą gry w 20 pytań czy to wystarczy. Sieci semantyczne pokazują wiedzę ogólną, ale my widzieć tylko podsieci interesujące z punktu widzenia aktualnie wyszukiwanej informacji. Wikipedia: zamiast sieci pojęć mamy sieć artykułów.
Nasze podejście
Wizualizacja Wiki Problem: szukanie zbioru artykułów na specyficzne tematy. Artykuły ogólne, np. o neuroscience, mają zbyt wiele linków prowadzących do dokumentów nieistotnych dla konkretnego pytania. Wizualizacja powiązań pomiędzy artykułami w oparciu o istniejące linki. Wizualizacja podobieństwa semantycznego. Zmiana konta widzenia przez podawanie słów kluczowych lub dokumentów referencyjnych – filtrowanie wizualizowanej informacji pod określonym kontem. Tylko część zaimplementowana, serwer: Wizualizacja Wordnetu, Wikipedii. Simple Ontology Editor, projekt realizuje Bartosz Kuczkowski, używając Gossamera. Jego zadanie: wspierać poprzez interaktywny graficzny interfejs prace zespołowe nad edycją ontologiiuser.
NarzędziaNarzędzia Przykłady: 3 filmiki
Wizualizacja struktury powiązań Wizualizacja struktury powiązań pomiędzy artykułami z użyciem interaktywnego grafu
Drzewo kategorii Wiki Drzewo kategorii Wiki wykorzystywane do wyszukiwania zbliżonych tematycznie artykułów.
Graficzne przedstawienie artykułu Graficzne przedstawienie reprezentacji artykułu wykorzystujące informacje kategorialne.
KonkluzjeKonkluzje Tylko mózgi potrafią interpretować i tworzyć informację w języku naturalnym, statystyczne i gramatyczne algorytmy analizy nie wystarczą, potrzebne są inspiracje kognitywne. Sieci neuronowe to dziedzina wykorzystująca modele neuronów lub proste analogie do działania neuronów biologicznych. Neurokognitywne podejście do języka pozwala na tworzenie interesujących algorytmów korzystając z inspiracji na wyższym poziomie organizacji, np. grafów obrazujących funkcjonalne dynamiczne połączenia obszarów kodujących własności semantyczne pojęć, pozwalając na elastyczną organizację i odkrywanie nowej wiedzy. Zastosowania obejmują wizualizację encyklopedii, np. Wikipedii: Jak wyższe czynności poznawcze powstajaw wyniku aktywności mózgu? Kreatywność = przestrzeń neuronalna (wiedza, torowanie) + fluktuacje aktywności (wyobraźnia)+ filtrowanie rezultatów (skojarzenia i emocje). Informatyka neurokognitywna = abstrakcje tego procesu.
Dziękuję za użyczenie ucha Google: Duch W => P 3 =Prezentacje, Prace, Projekty