Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

7.03.2005IPI PAN Warszawa Nina Suszczańska Instytut Informatyki Politechniki Śląskiej Zastosowanie GS-modelu języka polskiego.

Podobne prezentacje


Prezentacja na temat: "7.03.2005IPI PAN Warszawa Nina Suszczańska Instytut Informatyki Politechniki Śląskiej Zastosowanie GS-modelu języka polskiego."— Zapis prezentacji:

1

2 IPI PAN Warszawa Nina Suszczańska Instytut Informatyki Politechniki Śląskiej Zastosowanie GS-modelu języka polskiego w kompleksowej analizie tekstów

3 IPI PAN Warszawa 2 z 57 Plan Wiadomości ogólne o GS-modelu Formalizm SGS Gramatyka SGGP (dawniej GS-gramatyka) Analiza składniowa Analiza semantyczna Modelowanie tekstu Aplikacje LAS Thetos Polsumm Liana Podsumowanie

4 IPI PAN Warszawa 3 z 57 Wiadomości ogólne o GS-modelu (1) Model języka Przy budowaniu modeli języka ustala się: skończony zbiór V (słownik języka) gramatyka formalna (zbiór reguł – produkcji) Sensowność formalnej gramatyki języka naturalnego z punktu widzenia lingwistyki Aktualne pytania: jak odbywa się podział zdania na składowe jakie relacje powstają przy tym podziale

5 IPI PAN Warszawa 4 z 57 Wiadomości ogólne o GS-modelu (2) SGS – Formalizm Systemów Grup Składniowych 1975 – A.V.Gładky 1975 – A.V.Gładky: Powstanie formalizmu Uogólnienie formalizmów: analizy składnikowej i drzew zależności Reprezentacja składniowa zdania: etykietowany skierowany graf: Węzły – grupy składniowe (GS) Krawędzie – relacja zależności Aksjomaty: ograniczenia na topologię grafu 1984 – c.d.: 1984 – c.d.: Rozwój formalizmu w celu modelowania języka naturalnego Zalety SGS Zdolność jawnie wskazywać grupy wyrazów Zdolność jawnie wskazywać relacje składniowe między wyrazami lub grupami wyrazów Przydatność do języków naturalnych, przede wszystkim o szyku swobodnym

6 IPI PAN Warszawa 5 z 57 Wiadomości ogólne o GS-modelu (3) SGS na potrzeby NL: aksjomaty Gładkiego silny etykietowany SGS: kryteria ogólne grupowania GS-gramatyka NL operacje na iloczynie kartezjańskim G x I x K x A x R poziomy GS typy reguły szczegółowe skończony zbór produkcji postaci GS L GS P gdzie GS L i GS P są jednostkami GS–modelu, czyli elementami słownika V jednostki terminalne i nieterminalne reprezentacja składniowa zdania multigraf problemy redukcji Predykatywno-argumentowy model zdania Modelowanie tekstu

7 IPI PAN Warszawa 6 z 57 Wiadomości ogólne o GS-modelu (2) Gramatyka SGGP – Syntactical Groups Grammar for Polish – dawniej GS-gramatyka Zadanie SGGP: określenie warunków grupowania GS oraz warunków powstania relacji składniowych SGGP operuje na skończonych zbiorach: G – zbiór GS Zdanie jest skończonym zbiorem Z podzbiorów słów Niepusty podzbiór GS Z nazywa się grupą składniową, jeżeli spełnia on aksjomaty SGS Słowo z atrybutami jest GS; I – zbiór indeksów Indeks słowa: numer porządkowy słowa w tekście Indeks GS: nazwa typu + numer porządkowy GS danego typu K – zbiór typów GS A – zbiór atrybutów GS Cechy morfo-syntaktyczne Cechy semantyczne Inne zbiór atrybutów GS jest dziedziczony lub generowany Reguły cechowania GS są częścią składową GS-gramatyki R – zbiór relacji składniowych Kolejność wykonania reguł nie jest obojętna dla wyników Reguły zarządzania tą kolejnością także należą do GS-gramatyki

8 IPI PAN Warszawa 7 z 57 Pojęcia podstawowe (1) Słowo: ciąg symboli, w tym liter, cyfr, znaków interpunkcji itp. Grupa (składniowa): ciąg wyrazów lub grup spełniający aksjomaty SGS Element bazowy: element główny w GS, wszystkie inne elementy są grupowane wokół bazowego (reprezentant GS) Klasa (typ) słowa lub grupy: kategoria gramatyczna – odpowiednik kategorii część mowy w gramatyce tradycyjnej Wymaganie: wskazuje na warunki wykonania produkcji Warunek: ograniczenie na wybór wymagania lub innej kategorii w produkcji Modyfikator (mod): jednostka GS–modelu, która zmienia lub modyfikuje sens GS stojącej z prawej strony modyfikatora Łącznik : jednostka GS–modelu, która łączy dwie GS stojące z lewej i prawej strony od bez podporządkowania jednej grupy drugiej Łącznik : jednostka GS–modelu, która łączy dwie GS stojące z lewej i prawej strony od, podporządkowując grupę z prawej grupie z lewej strony od łącznika Model rządu : definiuje kontekst semantyczny GS (GS) = 0 – nie jest znany lub nie istnieje (GS) 0 – znany i ma być brany pod uwagę przy wykonaniu produkcji

9 IPI PAN Warszawa 8 z 57 Pojęcia podstawowe (2) Cztery poziomy (rzędy) GS: Zerowy – trywialny Pierwszy Drugi Czwarty - funkcjonalny Spójność Cecha gramatyczna GS GS spójna bierze udział w rozbiorze składniowym zdania Definicja: GS jest spójną, jeżeli jest ona maksymalną GS rzędu drugiego, czyli taką, która według reguł GS-gramatyki nie może być częścią jakiejkolwiek GS poza samym zdaniem Typ relacji między składowymi GS zależny od poziomu GS, ponadto Relacja potencjalna (RP): relacja binarna, która może powstać między grupami przy łączeniu ich w jedną GS Relacja wewnętrzna (Rel): relacja binarna powstała między elementami składowymi GS Relacja funkcyjna (RF): relacja binarna między spójnymi GS. Wyznacza rolę składniową danej GS w zdaniu

10 IPI PAN Warszawa 9 z 57 GS-gramatyka c.d. Kryteria ogólne grupowania wyrazów: Bezwarunkowe kryterium leksykalne: a także, r. ak., na przykład kryterium pozycyjne: w sobotę, w wybranym języku kryterium paradygmatyczne: będę czytał kryterium zespolenia: usiąść, gdzie wskazano; człowiek, do którego mówię kryterium zestawienia: dwieście dwadzieścia dwa Warunkowe kryterium operatorowe: bardzo dobrze, nie zawsze kryterium zgody: dwie dziewczynki, Jan czyta kryterium współrzędności: obie dziewczynki i parasol kryterium rządu: wybór kandydata na podmiot kryterium odbudowy: wygłaszam referat

11 IPI PAN Warszawa 10 z 57 GS-gramatyka c.d. Reguły szczegółowe: Poziom GS Typ Struktura Reprezentant Własności Cechy gramatyczne Relacje syntaktyczne między elementami składowymi GS Kryterium wyróżnienia GS

12 IPI PAN Warszawa 11 z 57 GS-gramatyka c.d. (Typy GS) Typ GSZnaczeniePoziom 1Poziom 2Spójność AGgrupa ogólna*** GATgrupa atrybutywna* GIMimię*** GLgrupa liczebnika* GSPgrupa spójnika** GWgrupa wypunktowania** NGgrupa rzeczownika*** PGgrupa przyimka*** PSgrupa przysłówka*** Sgrupa zdania** TZLgrupa trywialna złożona*** VGgrupa czasownika*** ZPKgrupa interpunkcyjna**

13 IPI PAN Warszawa 12 z 57 GS-gramatyka c.d. GS trywialne (GS 0 ) Kryterium leksykalne Gramatyka zadana z góry, np. słownikiem Informacja dodatkowa reprezentant SG cechy syntaktyczne semantyczne (ew.) RP = Ø

14 IPI PAN Warszawa 13 z 57 GS-gramatyka c.d. GS poziomu pierwszego (na przykładzie PS 1 ) [operator] + przysłówek (1) gdzie operator fakultatywny: operator z listy modyfikatorów dla przysłówków przysłówek z cechami gramatycznymi modyfikatora semantycznego PS, której elementem głównym jest przysłówek z cechami gramatycznymi jak wyżej Warunkiem grupowania jest odpowiednia kolejność GS przy spełnieniu jednego z ww. punktów Lista operatorów stanowi element słownikowy Nie każdy modyfikator może pełnić funkcję operatora dla konkretnych klas wyrazów: wszystko może być modyfikatorem dla czasownika więcej dla rzeczownika, ale żaden z nich nie może być modyfikatorem przysłówka RP = {modyfikacja, niegacja}

15 IPI PAN Warszawa 14 z 57 Gramatyka PS 1 c.d. PS wg Kryterium współrzędności PS1 PS2 (2) Znak oznacza przecinek lub jeden z spójników szeregowych Składowa główna nie jest wyznaczana Reprezentantem PS złożonej może być każdy z reprezentantów PS składowych Relacja między PS1 i PS2 jest szereg Warunkiem wykonania reguły (2) jest fakt posiadania kandydatów na składowe wspólnych cech gramatycznych

16 IPI PAN Warszawa 15 z 57 Gramatyka PS 1 c.d. Relacja szereg Zbiór relacji: połączenie_przez_spójnik_-i połączenie_przez_spójnik_-lub połączenie_przez_spójnik_-także uzgodnienie_przez_przecinek Notacja: #sp_i, #sp_lub, #sp_także oraz #uzg_, Przykład: szybko 1 i 2 bezpiecznie 3 PS = {1,2,3}; 1 3 Myślnik wskazuje na równoważność składowych PS Wyszczególniono: 1 # sp_i 3

17 IPI PAN Warszawa 16 z 57 GS 1 -gramatyka c.d. Cechy gramatyczne (atrybuty) Cechy gramatyczne GS, w tym semantyczne, wyznacza się jako wynik: dziedziczenia po składowej głównej dla (1) wykonania operacji unifikacji atrybutów składowych szeregowych dla (2) wykonania operacji generalizacji atrybutów składowych szeregowych dla (2) Operacje unifikacji i generalizacji stosowane do atrybutów (cech) GS nie będą omawiane

18 IPI PAN Warszawa 17 z 57 GS 1 -gramatyka c.d. Przykłady GAT 1 zbyt 1 młody 2 Tu G = {1,2}; 2 #mod 1 ładnie 1 ozdobiona 2 Tu G = {1,2}; 2 #mod 1 nie 1 wystarczająco 2 szybko 3 przeczytany 4 G 1 = {1,2}; G 2 = {G 1,3}; G 3 = {G 2,4}; 2 #nie 1, 3 #mod G1, 4 #mod G2 najpotężniejszym 1 i 2 najstarszym 3 G 1 = {1,2,3}; 1 #sp_i 3 czwartego 1, 2 piątego 3 i 4 dziesiątego 5 G 1 = {1,2,3}, G 2 = { G 1,4,5}; 1 #uzg_, 3, G 1 #sp_i 5

19 IPI PAN Warszawa 18 z 57 GS 2 -gramatyka Przykłady NG 2 dom 1 ojca 2 NG = {NG 1, NG 2 }, NG 1 = {1}, NG 2 = {2}; NG 1 #dop2 NG 2 ; dom 1 dla 2 ojca 3 NG = {NG 1, PG}, NG 1 = {1}, PG = {2,3}; NG 1 #dop PG ;

20 IPI PAN Warszawa 19 z 57 NG 2 -gramatyka c.d. Przykład 2 Schemat wymagań [Polański] co do otoczenia dla rzeczownika demonstracja w znaczeniu pokaz To samo w postaci komputerowej [Grund] Znak – oznacza rzeczownik, NGacc, NGd, NGi, NGg to są NG odpowiednio w bierniku, celowniku, narzędniku i dopełniaczu – NGacc+({NGd,przed^NGi,wobec^NGg})

21 IPI PAN Warszawa 20 z 57 GS-gramatyka c.d. Zdanie jako GS poziomu drugiego Grupa zdania S: Kryterium rządu, Kryterium zespolenia, Kryterium współrzędności, Kryterium operatorowe Kryterium odbudowy Elementami składowymi S są GS spójne Rolę GS bazowej spełnia VG, która jest korzeniem grafu struktury S, wszystkie inne spójne GS są podrzędnymi VG

22 IPI PAN Warszawa 21 z 57 Zdanie c.d. Przykład Mój 1 pies 2 nie 3 lubi 4 goździków 5. 6 trzy spójne GS: NG 1, NG 2 i VG, NG 1 i NG 2 są podrzędnymi VG: NG 1 = {1,2}, NG 2 = {5}, VG ={3,4}, S = {NG 1, NG 2, VG}; 2 1, 4 3, VG NG 1, VG NG 2 ;

23 IPI PAN Warszawa 22 z 57 Zdanie c.d. S, jak i każda inna GS, etykietowana jest cechami gramatycznymi indeks zdania tryb czas strona itp. Relacje w zdaniu podmiot orzeczenie dopełnienia różnego rodzaju okoliczniki Nie wszystkie z cech gramatycznych i relacji składniowych GS-gramatyki zgadzają się z tradycyjnymi, ponieważ zostały wprowadzone ze względu na przetwarzanie komputerowe

24 IPI PAN Warszawa 23 z 57 Fragment listy relacji składniowych RelacjeZnaczenieTyp argumentówFunkcyjne GS Poziomu1 GS Poziomu2 Relacje #atratrybut (przystawka, oznaczenie) ** #dop2dopełnienie w dopełniaczu * #dop4dopełnienie w bierniku * #niezgniespójność * #okolicznikokolicznik * #orzeczenieorzeczenie * #podmiotpodmiot *

25 IPI PAN Warszawa 24 z 57 Analiza składniowa Parser Polsyn Część składowa projektów Thetos, LAS, PolSumm, Liana, Dialog-2 Przebieg analizy: Analiza morfologiczna Analiza składniowa (Polsyn) Interpretacja semantyczna Tekst

26 IPI PAN Warszawa 25 z 57 Struktura zdania w SGGP Dawno, dawno temu, w małym wiejskim domku, mieszkała pewna dziewczynka, której prawdziwego imienia nikt nie pamiętał.

27 IPI PAN Warszawa 26 z 57 GS poziomu pierwszego Dawno, dawno temu, w małym wiejskim domku, mieszkała pewna dziewczynka, której prawdziwego imienia nikt nie pamiętał. TZG1 PG1 GAT1 NG1 ZPK1 VG1 NG2 ZPK2 NG3 NG4 NG5 VG2 ZPK3

28 IPI PAN Warszawa 27 z 57 GS poziomu drugiego Dawno, dawno temu, w małym wiejskim domku, mieszkała pewna dziewczynka, której prawdziwego imienia nikt nie pamiętał. TZG1 PG1 GAT1 NG1 ZPK1 VG1 NG2 ZPK2 NG3NG4 NG5VG2 ZPK3 AG1 PG2 AG2 VG3 NG6AG4 [EOC] NG7 [Anafora] NG8 NG9 VG4 AG6 [EOC]

29 IPI PAN Warszawa 28 z 57 Poziom funkcjonalny Dawno, dawno temu, w małym wiejskim domku, mieszkała pewna dziewczynka, której prawdziwego imienia nikt nie pamiętał. TZG1 PG1 GAT1 NG1 ZPK1 VG1 NG2 ZPK2 NG3NG4 NG5VG2 ZPK3 AG1 PG2 AG2 VG3 NG6 AG3 [EOC] NG7 [Anafora] NG8 NG9 VG4 AG4 [EOC] podmiot VG3 predykat S1 major okoliczn_gr S2 VG4 predykat podmiot dopełnienie problem

30 IPI PAN Warszawa 29 z 57 Poziom funkcjonalny Dawno, dawno temu, w małym wiejskim domku, mieszkała pewna dziewczynka, której prawdziwego imienia nikt nie pamiętał. TZG1 PG1 GAT1 NG1 ZPK1 VG1 NG2 ZPK2 NG3NG4 NG5VG2 ZPK3 AG1 PG2 AG2 VG3 NG6 AG3 [EOC] NG7 [Anafora] NG8 NG9 VG4 AG4 [EOC] podmiot VG3 predykat S1 major okoliczn_gr S2 VG4 predykat podmiot dopełnienie problem

31 IPI PAN Warszawa 30 z 57 Poziom funkcjonalny Dawno, dawno temu, w małym wiejskim domku, mieszkała pewna dziewczynka, której prawdziwego imienia nikt nie pamiętał. TZG1 PG1 GAT1 NG1 ZPK1 VG1 NG2 ZPK2 NG3NG4 NG5VG2 ZPK3 AG1 PG2 AG2 VG3 NG6 AG3 [EOC] NG7 [Anafora] NG8 NG9 VG4 AG4 [EOC] podmiot VG3 predykat S1 major okoliczn_gr S2 VG4 predykat podmiot dopełnienie problem

32 IPI PAN Warszawa 31 z 57 Anafora w SGGP W SGGP przez anaforę rozumiemy relację nie między pojedynczymi słowami, a między GS W naszym przykładzie: NG7 - anafora NG6 - antecedent NG7 Przykłady inne: Jej mamusia także lubiła używać tego imienia, bo pasowało do dziewczynki. Wtedy wybiła północ i stało się to, co zapowiedziała wróżka.

33 IPI PAN Warszawa 32 z 57 Analiza semantyczna (1) Predykatywno-argumentowy model zdania Relacja n-arna Zbiór relacji binarnych Relacje wyprowadzone Interpretacja semantyczna

34 IPI PAN Warszawa 33 z 57 Analiza semantyczna (2) Tablica - nie więcej niż 4 warianty rozbioru z uwzględnieniem miejsc walencyjnych Narzędzie do eliminowania niejednoznaczności Podstawa do wyszukiwania antecedensów Lp.PredykatSubiektObiektAdresatInstrumentMiejsceCzasCel(meta)PrzyczynaInne W1VGNG1NG2NG3 W2VGNG2NG1NG3 W3 W4 SemSyn

35 IPI PAN Warszawa 34 z 57 Modelowanie tekstu Na potrzeby Thetosa i Polsumm Podział zdań złożonych na pojedyncze Rekonstrukcja strukturalnej i leksykalnej pełni składu zdań Anafory Elipsy Forma kanoniczna zdania

36 IPI PAN Warszawa 35 z 57 Projekt Thetos Polish Text into Sign Language Translator Zastosowanie wyników w systemie Thetos wersja 1 ( ) wersja 2 ( ) Część lingwistyczna Część animacyjna

37 IPI PAN Warszawa 36 z 57 animated gesture sequence Schemat translacji w Thetosie-2 Ogólny widok modyfikacji output text (textual form of the sign language) Linguistic subsystem modeled input text (in canonical form) input text Text modeling processor Text translating processor Animation subsystem

38 IPI PAN Warszawa 37 z 57 Schemat translacji w Thetosie-2 Procesor modelujący tekst

39 IPI PAN Warszawa 38 z 57 Schemat translacji w Thetosie-2 Procesor tłumaczący tekst

40 IPI PAN Warszawa 39 z 57 Schemat translacji w Thetosie-2 Widok ogólny

41 IPI PAN Warszawa 40 z 57 Anafora przy tłumaczeniu (1) Zdania w języku miganym nie mogą być złożone Problemy: Jak przekazać w języku migowym/miganym związek anaforyczny? Jak uzupełniać braki w zdaniach z elipsą? Czy i w jakim stopniu w języku miganym występują te mechanizmy językowe? Jak przetłumaczyć elipsę na elipsę?

42 IPI PAN Warszawa 41 z 57 Anafora przy tłumaczeniu(2) Założenia: antecedens – tylko w zdaniach poprzednich tekst przekształcany na bieżąco kolejne wyszukiwania – w przetworzonym tekście Hipoteza: schemat walencyjny jest pomocny w odnalezieniu składowej (także w przypadku elipsy) Problem: ile zdań w zakresie wyszukiwania?

43 IPI PAN Warszawa 42 z 57 Badania statystyczne Wyliczenie zakresu przeszukiwania: Półautomatyczne wyliczenie zakresu

44 IPI PAN Warszawa 43 z 57 Badania statystyczne(2) Postać raportu: Liczba anafor: 6 (Chm-Aut) odległość maksymalna: 3 odległość minimalna: 1 odległość średnia: 1,66 Liczba anafor: 8 (S-P1) - odległość maksymalna: 2 - odległość minimalna: 1 - odległość średnia: 1,25 Liczba anafor: 9 (Kr.Śn.) - odległość maksymalna: 4 - odległość minimalna: 1 - odległość średnia: 2,44 Liczba anafor: 35 (S-P2) - odległość maksymalna: 7 - odległość minimalna: 1 - odległość średnia: 1,82

45 IPI PAN Warszawa 44 z 57 Badania statystyczne(3) Fragmenty tekstów: Królewna Śnieżka – 6 KB Kopciuszek - 3 KB Czerwony Kapturek - 3 KB Robinson - 6 KB Pani Twardowska - 4 KB Wioska - 2 KB J. Chmielewska, Autobiografia - 1 KB H. Sienkiewicz, Potop – 2 fragmenty 2 KB 3 KB

46 IPI PAN Warszawa 45 z 57 Badania statystyczne (4) Wyniki: Anafor w tekście 80%10%2% Odstęp (w zdaniach)

47 IPI PAN Warszawa 46 z 57 Badania statystyczne (6) Czerwony Kapturek Dawno, dawno temu, w małym wiejskim domku, mieszkała pewna dziewczynka, której prawdziwego imienia nikt nie pamiętał. Dziewczynka chodziła w czerwonej pelerynce z kapturkiem i dlatego wszyscy nazywali ją Czerwonym Kapturkiem. Jej mamusia także lubiła używać tego imienia, bo pasowało do dziewczynki. Czerwony Kapturek miał babcię, która mieszkała w chatce w lesie. W lesie mieszkał szczwany wilk, który wielokrotnie obserwował dziewczynkę zza drzew, gdy biegła ścieżką do babci. Dziś zaś stwierdził, że jest tak głodny, że Czerwony Kapturek będzie smacznym kąskiem na obiad.

48 IPI PAN Warszawa 47 z 57 Przekształcenie tekstu Wyniki generowania zdań Dla zdania S1: [NG6 VG3 AG2 PG2] pewny dziewczynka mieszkać dawno, dawno to w mały wiejski domek Dla zdania S2: [NG9 VG4 NG8 NG7] nikt pamiętać nie prawdziwy imię który Przekształcenie tekstu: Nowa grupa NG7: Zmiany strukturalne: dziewczynka - reprezentant antecedensa (NG6) - zastępuje której (NG7) morfo-syntaktyczne charakterystyki NG7 dziedziczone po NG7 Nowa grupa NG8 = NG8+NG7 Zdanie S2 po przebudowie: [NG9 VG4 NG8] nikt pamiętać nie prawdziwy imię dziewczynka

49 IPI PAN Warszawa 48 z 57 Generowanie W lesie mieszkał szczwany wilk, który wielokrotnie obserwował dziewczynkę zza drzew, gdy biegła ścieżką do babci. Dziś zaś stwierdził, że jest tak głodny, że Czerwony Kapturek będzie smacznym kąskiem na obiad.

50 IPI PAN Warszawa 49 z 57 Program PolSumm Program streszczania tekstów Metody statystyczne Metody lingwistyczne Analiza składniowa, semantyczna Metod dominant Wybór istotnych faktów Metoda statystyczna Wyszukiwanie informacji Obliczenie unikalnej wagi dla każdego zdania

51 IPI PAN Warszawa 50 z 57 Program PolSumm c.d. Etapy streszczania w programie PolSumm Wybór istotnych faktów Generowanie tekstu streszczenia Analiza lingwistyczna

52 IPI PAN Warszawa 51 z 57 Serwer lingwistyczny LAS Stanowisko badawcze Serwer analizy lingwistycznej LAS (Linguistics Analysis Server)

53 IPI PAN Warszawa 52 z 57 System LIAna (1) Opracowanie oprogramowania wspomagającego analityka obiektowego Opracowanie elementów metodyki LIA (Linguistically based Information Analysis) dla języka polskiego algorytmy automatycznej identyfikacji kluczowych abstrakcji: wydzielenie kandydatów na klasy, obiekty lub atrybuty wydzielenie kandydatów na relacje, zdarzenia lub metody algorytmy inne: wyszukiwanie kontekstów dla zidentyfikowanych pojęć podejmowanie decyzji na podstawie macierzy kontekstowej sporządzenie arkuszu roboczego analityka (tezaurus, baza doświadczenia) itd.

54 IPI PAN Warszawa 53 z 57 BD kontekstów Analiza lingwistyczna Baza Tekstów Wizualizacja wyników analizy lingwistycznej BD leksemów Wyniki analizy lingwistycznej Kontekster Tworzenie arkusza OOA/D Procesor tablicy kontekstów Wizualizacja wyników OOA/D (Edytory graficzne diagramów) BD wymagań Tablica kontekstów Arkusz roboczy OOA/D Schemat ogólny systemu Liana

55 IPI PAN Warszawa 54 z 57 System Liana (2) Schemat przekształcenia RelSyn RelOOA/D Interpretacja semantyczna Oparta o cechy gramatyczne Oparta o ontologie Opracowanie ontologii: Wybór relacji Opracowanie sieci pojęć Opracowanie maszyny decyzyjnej RelSyn Interpretacja semantyczna RelOOA/D

56 IPI PAN Warszawa 55 z 57 Eksperyment: interpretacja semantyczna Przyk ł ad RelSyn: #ozn(A,B) Interpretacja semantyczna Propozycja abstrakcji OOA/D A, cechyB, cechy zadaniem programu program (rzecz.) zadanie (rzecz.ods ł.) A jest obiektem dzia ł alności B brak RelOOA/D: 1) B jest usługą żądaną od A; 2) A jest argumentem operacji B elementy firmy firma (l.p.) element (l.mn.) B jest częścią A agregacja(A,B): B A; 1:N interwa ł wysy ł ki wysy ł ka (rzecz. ods ł.) interwa ł (rzecz.) A jest atrybutem dzia ł alności B brak RelOOA/D: 1) A jest zdarzeniem; 2) B jest atrybutem A plik dokumentów dokument (l.mn.) plik (l.p.) B składa się z A; A jest częścią B agregacja(A,B): A B; N:1

57 IPI PAN Warszawa 56 z 57 Podsumowanie Rozbudowano i dostosowano do potrzeb przetwarzania języka naturalnego formalizm SGS Opracowano: zbiór GS-gramatyk dla różnych poziomów przetwarzania GS-parser dla języka polskiego algorytmy i programy analizatora semantycznego analizy najprostszych przypadków anafor i elips interpretacji semantycznej relacji składniowych zasady modelowania tekstu Opracowania znalazły zastosowanie w systemach Thetos, PolSumm, Liana, DIALOG-2 i in. Dziękuję za uwagę

58 IPI PAN Warszawa 57 z 57 Bibliografia Gładky A.V., (1985) Sintaksiczeskie struktury jestestwennogo jazyka w awtomatizirowannych sistemach obszczenija. Nauka, Moskwa B.S. Galukshov, (1975) Grammatika Sintaksicheskich Grupp. Nauchno-technicheskaya informaciya, seriya 2, No. 1, Gładky A., Melczuk I., (1979) Elementy matematiczeskoj lingwistiki. Nauka, Moskwa. Nikitin A.I., Sushchanskaya N.F., (1984) Automation of the Presemantic Analysis of Natural-language Texts, Cybernetics 20 (1): Świdzński M., (1992) Gramatyka formalna języka polskiego. Wydawnictwa Uniwersytetu Warszawskiego, Warszawa Sushchanska N.F., (1999) Computer grammar of syntactic groups. Cybernetics and Systems Analysis, Consultants Bureau, New York Vol. 35 (6) Nov-Dec, Szafran K., (1996) Analizator morfologiczny SAM-95, opis użytkowy, fragment raportu z pracy realizowanej w Instytucie Informatyki Uniwersytetu Warszawskiego, Warszawa Tokarski J., ed: Zygmunt Saloni, (1993) Schematic Index a Tergo of Polish Words Forms, Wydawnictwo Naukowe PWN, Warszawa. Polański K.(red.), (1980) Słownik syntaktyczno-generatywny czasowników polskich, Wyd. PAN, Warszawa-Wrocław-Katowice-Gdańsk Grund D., (2000) Komputerowa implementacja słownika syntaktyczno-generatywnego czasowników polskich. Studia Informatica, Vol.21, No 3 (41), s Suszczanska N., (2000) On some universal algebras using in NL-semantics. Abstract in Atlas Mathematical Conference Abstracts (http://at.yorku.ca/cgi- bin/amca/caee-75). Materiały konferencji międzynarodowej AAA60: Workshop on General Algebra (60. Arbeitstagung Allgemeine Algebra), June , 2000, Dresden University of Technology, Dresden, GERMANYAtlas Mathematical Conference Abstractshttp://at.yorku.ca/cgi- bin/amca/caee-75) Szmal P., Suszczańska N. (2001) Selected Problems of Translation from the Polish Written Language to the Sign Language. Archiwum Informatyki Teoretycznej i Stosowanej 13, 37–51 Suszczańska N., Kulików S., (2003) A Polish Document Summarizer. 21st IASTED International Conference APPLIED INFORMATICS - AI2003, Innsbruck Yourdon E., Argila C. (1996) Case Studies in Object-Oriented Analysis and Design, Prentice Hall/Yourdon Press, Suszczańska N., (2003) Automatyczna identyfikacja relacji między abstrakcjami dziedziny problemu dla potrzeb analizy obiektowej. Materiały V Krajowej Konferencji Inżynieria Wiedzy i Systemy Ekspertowe, czerwiec 2003, Wrocław, Szmal, P., Kulików, S.: Support for deaf people at Web browsing. 3rd IASTED International Conference Artificial Intelligence and Applications AIA2003, Benalmadena 2003, s Ciura M., Grund D., Kulików S., Suszczańska N.: A System to Adapt Techniques of Text Summarizing to Polish. Proceedings of the International Conference on Computational Intelligence, Istanbul, Turkey, 2004, s Bach M.: Metody konstruowania zadań wyszukiwania w bazach danych w procesie translacji zapytań sformułowanych w języku naturalnym, Rozprawa doktorska, Gliwice Suszczańska N., Lubiński M.: POLMORPH, Polish Language Morphological Analysis Tool, 19th IASTED Int. Conf. APPLIED INFORMATICS - AI2001, Innsbruck (Austria) 2001, s Suszczańska N.: GS-model składni języka polskiego, Speech and Language Technology, Red. G. Demenko, M Karpiński, K. Jassem, Polskie Towarzystwo Fonetyczne, vol. 7, Poznań Grund D.: Biblioteka funkcji dostępu do danych słownika syntaktycznego czasowników polskich. Studia Informatica, Vol.23, No 4 (51), Gliwice 2002, s


Pobierz ppt "7.03.2005IPI PAN Warszawa Nina Suszczańska Instytut Informatyki Politechniki Śląskiej Zastosowanie GS-modelu języka polskiego."

Podobne prezentacje


Reklamy Google