WordNet WordNet to duża leksykalna baza języka angielskiego. Grupuje ona rzeczowniki, czasowniki, przymiotniki i przysłówki w zestawy kognitywnych (poznawczych) synonimów (tzw. synsets), z których każdy wyraża odrębną koncepcję. Synsety powiązane są ze sobą znaczeniami pojęciowo- semantycznych i leksykalnych relacji. Korzystanie z WordNeta możliwe jest dla wszystkich poprzez przeglądarki internetowe, a także przez pobranie na swój komputer (jest to darmowe i ogólnodostępne).
WordNet jest także przydatnym narzędziem dla lingwistyki komputerowej oraz przetwarzania naturalnego języka. WordNet powierzchownie przypomina Thesaurusa ( w grupowaniu słów, w oparciu o ich znaczenie. Jednak, w odróżnieniu od Thesaurusa, WordNet łączy między sobą nie tylko formy wyrazów, ale także konkretne znaczenia słów. A więc słowa, które znajdują się blisko siebie są mają podobne znaczenia. WordNet znakuje semantyczne relacje między słowami, Thesaurus natomiast nie stosuje żadnych wzorów łączenia wyrazów, poza podobieństwem.
Głównymi relacjami pomiędzy słowami jest ich synonimiczność, jak pomiędzy słowami shut i close czy car i automobile Ponadto, synonimy grupowane są w synsety, które połączone są z innymi synsetami za pomocą niewielkiej liczby znaczeniowych relacji Synsety zawierają krótkie definicje i w większości przypadków jedną lub więcej sentencji ilustrujących użycie słów tego synsetu.
WordNet łączy słowa w relacje, wśród których wyróżnić można: - relację super-subordinate zwaną także hiponimią, która łączy ogólne pojęcia (np. mebel) z bardziej szczegółowymi (np. łóżko) - meronimia, która przyporządkowuje ogólnym słowom ich części (np. krzesło łączone jest z oparciem, nogami czy siedzeniem, podobnie jak fotel, ponieważ on przez relację super-subordinate łączony jest z krzesłem) - czasowniki grupowane są ze względu na pole semantyczne, a także stopniowane (np. ze względu na głośność, szybkość itp.) – komunikować się-rozmawiać-szeptać - przymiotniki wiązane są m.in. w kategoriach antonimii (mokry-suchy, stary-młody), ale także na zasadzie podobnego semantycznego znaczenia (suchy łączony jest z prażony, wyschły, wyschnięty na kość itp.) - większość słów w WordNecie łączonych jest ze względu na części mowy, a więc zawiera się w czterech grupach: rzeczowników, czasowników, przymiotników i przysłówków
Autorzy WordNet powstał jako projekt Wydziału Psychologii Uniwersytetu Princeton, teraz zajmuje się nim jednak Wydział Informatyki Nad WordNetem pracują następujące osoby: - Christiane Fellbaum - Randee Tengi - Michael Bailey - Jacob Goldstein - Lavanya Jose - Isaac Julien - Peter Schulam - Eric Tengi - Mark Tengi
Korzystanie z WordNeta