NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego Instytut Języka.

Slides:



Advertisements
Podobne prezentacje
I część 1.
Advertisements

Klasyfikacja roczna w roku szkolnym 2012/2013
Joanna Sawicka Wydział Nauk Ekonomicznych, Uniwersytet Warszawski
Metody badania stabilności Lapunowa
Wprowadzenie do informatyki Wykład 6
TERMO-SPRĘŻYSTO-PLASTYCZNY MODEL MATERIAŁU
Lingwistyka Matematyczna
KONKURS WIEDZY O SZTUCE
1 magia kuponów jak wykorzystać kupony w reklamie efektywnościowej.
Systemy operacyjne Copyright, 2000 © Jerzy R. Nawrocki Wprowadzenie do informatyki.
mgr inż. Jan Masiejczyk Akademia Marynarki Wojennej
mgr inż. Michał Joachimczak Instytut Oceanologii PAN, Sopot
Wyniki sprawdzianu i egzaminu gimnazjalnego szkół w roku 2008
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
Wstęp do geofizycznej dynamiki płynów. Semestr VI. Wykład
Zrozumieć „myślenie przestrzenią”.
6. Wiedza o języku Studia Podyplomowe „Polski Język Migowy” 2013/2014
UKŁADY SZEREGOWO-RÓWNOLEGŁE
Jaki jest następny wyraz ciągu: 1, 2, 4, 8, 16, …?
5. Wprowadzenie do nauki o języku A1NJ
4. Wprowadzenie do nauki o języku A1NJ
Dyskretny szereg Fouriera
Transformacja Z (13.6).
Tytuł prezentacji Warszawa, r..
Literatura dla dzieci i młodzieży ćwiczenia
Wprowadzenie do JSP Copyright © Politecnico di Milano September 2003 Translation: Kamil Żyła, Politechnika Lubelska.
Technika Mikroprocesorowa 1
Projektowanie Stron WWW
Synteza układów sekwencyjnych z (wbudowanymi) pamięciami ROM
Wyrażenia algebraiczne
Produkcja skojarzona w systemie elektroenergetycznym
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
Kalendarz 2011 Real Madryt Autor: Bartosz Trzciński.
Kalendarz 2011 Oto ciekawy kalendarz, który zaprojektował
KALENDARZ 2011r. Autor: Alicja Chałupka klasa III a.
1 Wykład 8 Podprogramy. 2 Pojęcie i istota stosowania dzielenie programu na części (logicznie spójne) - nazwane - niezależne od pozostałych części - z.
1/34 HISTORIA BUDOWY /34 3/34 6 MAJA 2011.
Podstawy adresowania hostów w sieciach komputerowych
Plan prezentacji Zarys projektu Geneza tematu
Podstawy działania wybranych usług sieciowych
ŻYWE JĘZYKI PROGRAMOWANIA LIVING IT UP WITH A LIVE PROGRAMMING LANGUAGE Sean McDirmid Ecole Polytechnique Fédérale de Lausanne (EPFL)
Analiza wpływu regulatora na jakość regulacji (1)
Analiza wpływu regulatora na jakość regulacji
Modelowanie i Identyfikacja 2011/2012 Metoda propagacji wstecznej Dr hab. inż. Kazimierz Duzinkiewicz, Katedra Inżynierii Systemów Sterowania 1 Warstwowe.
Lekcja 13 Strona 15. Lekcja 13 Strona 16 Lekcja 13 Strona 17 Vertical primary and secondary Tesla coil Jacobs ladder.
Kalendarz 2011r. styczeń pn wt śr czw pt sb nd
1.
11. Wiedza o języku Studia Podyplomowe „Polski Język Migowy” 2013/2014
ZDYSCYPLINOWANY OPIS JĘZYKÓW NATURALNYCH I KORPUSY TEKSTÓW Proseminarium doktoranckie 2013/2014, semestr letni Prof. dr hab. Marek Świdziński Zakład.
1 Jak by tu po-współpracować z innymi ? a może coś jeszcze… Word 2007.
© GfK 2012 | Title of presentation | DD. Month
(C) Jarosław Jabłonka, ATH, 5 kwietnia kwietnia 2017
ZDYSCYPLINOWANY OPIS JĘZYKÓW NATURALNYCH I KORPUSY TEKSTÓW Proseminarium doktoranckie 2013/2014, semestr letni Prof. dr hab. Marek Świdziński Zakład Językoznawstwa.
EcoCondens Kompakt BBK 7-22 E.
W2 Modelowanie fenomenologiczne I
I ROK MINISTRA GIERTYCHA Warszawa, 5 maja dni Wrzesień dni, tu jesteśmy 365 dni, tu jesteśmy.
Jak Jaś parował skarpetki Andrzej Majkowski 1 informatyka +
Bramki logiczne i układy kombinatoryczne
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
6. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
Kalendarz 2020.
Elementy geometryczne i relacje
ZDYSCYPLINOWANY OPIS JĘZYKÓW NATURALNYCH Proseminarium doktoranckie 2014/2015, semestr letni Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego.
Spotkanie 5 Poliqarp.. Znakowanie – tagging Narzędzie do znakowania – tager Znakowanie: przypisywanie jednostkom tekstowym jakichś kodów (tagów): 1. lokalizacja.
10. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
Spotkanie 5 Wstęp do GFJP: jak to chodzi....  Definicja pewnego zbioru wyrażeń (np. zbioru „język polski”).  Różne aparaty: ST, EST, GB, GPSG, HPSG,…
Spotkanie 5 Poliqarp.. Znakowanie – tagging Narzędzie do znakowania – tager Znakowanie: przypisywanie jednostkom tekstowym jakichś kodów (tagów): 1. lokalizacja.
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
Proseminarium doktoranckie 2015/2016, semestr letni WSPÓŁCZESNE NARZĘDZIA OPISU LINGWISTYCZNEGO POLSZCZYZNY Proseminarium doktoranckie 2015/2016, semestr.
Zapis prezentacji:

NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego Instytut Języka Polskiego UW śr , pok. 1 Konsultacje: śr , pok. 1 Adres internetowy:

Program Cel Motywacja (Pre)historia Dziury i błędy w opisie fno fno: co to jest? Format i parametry Przykładowe reguły Rozwiązanie I: jałowa rekursja Rozwiązanie II: realizacje atrybutywne Rozwiązanie III: opis przecinka Luźne końce… –2–2

Cel Prezentacja projektu przebudowy GFJP. Łóżko testowe: opis jednej jednostki składniowej. Pokaz gotowych rozwiązań kilku problemów teoretycznych i praktycznych. –3–3

Motywacja GFJP była / jest testowana ( Świgra). GFJP musi być poprawiona / rozbudowana (?). Dlaczego nie napisać GFJP lepiej? Zacząć od jakiejś jednostki składnikowej. fno: fraza (jednostka prostsza niż zdaniowa); nominalna (jednostka ważna, częsta w tekstach, strukturalnie bogata); jednostka oddolna. –4–4

(Pre)historia (1) Szpakowicz, S., Świdziński, M.: Formalna definicja równorzędnej grupy nominalnej we współczesnej polszczyźnie pisanej. Warszawa Maszynopis powielony. Również w: Studia gramatyczne t. IX, Wrocław Świdziński, M.: Gramatyka formalna języka polskiego, Warszawa Świdziński, M., Derwojedowa, M., Rudolf, M.: A computational account of multi-word numeral phrases in Polish. Linguistik International Band 10. Investigations into Formal Slavic Linguistics. Contributions of the FDSL IV. Frankfurt am Main i in –5–5

(Pre)historia (2) Świdziński, M., Derwojedowa, M., Rudolf, M.: Two formal approaches to Polish numeral phrases implemented. Studia z gramatyki i leksykologii języka polskiego. Red. M. Gębka-Wolak, I. Kaproń-Charzyńska, M. Urban. Toruń Woliński, M.: Komputerowa weryfikacja gramatyki Świdzińskiego. Rozprawa doktorska. IPI PAN: Warszawa Świdziński, M.: A DCG account of Polish relative constructions. [W:] Human Language Technologies as a Challenge for Computer Science and Linguistics. Proceedings of the 3rd L&T Conference, October 5-7, 2007, Poznań, Poland. Poznań –6–6

(Pre)historia (3) Świdziński, M., Woliński, M.: Towards a new version of the formal grammar of Polish: the NP redefined. [W:] Formal Description of Slavic Languages FDSL-7. University of Leipzig, 30 November – 2 December, Book of Abstracts, Leipzig –7–7

Dziury i błędy w opisie fno (1) Brak definicji fraz z koordynacją. Brak definicji fraz z liczebnikiem. Brak definicji fraz liczebnikowych. …………. –8–8

Dziury i błędy w opisie fno (2) Są to także błędy ogólne!!! 1.Mechanizm jałowej rekursji. 2.Realizacja przymiotnikowa fno. 3.Opis przecinka. –9–9

Dziury i błędy w opisie fno (3) 1. Jałowa rekursja Hierarchia kanoniczna: –Fraza nominalna (FNO) –Konstrukcja nominalna z dopełniaczem (KNODOP) –Konstrukcja nominalna z frazą przyimkową (KNOPM) –Konstrukcja nominalna z atrybutem (KNOATR) –Konstrukcja nominalna z inkorporacją (KNOINK) –Konstrukcja nominalna (KNOM) – 10

Dziury i błędy w opisie fno (4) -FNO = KNODOP FZD -KNODOP = KNOPM FNO -…………….. -KNOM = FNO KNOM (p, rl, o, neg, z, kl) = FNO (p, rl, o, neg, NI, z, kl). (NO48) – 11

Dziury i błędy w opisie fno (5) 2. Realizacja przymiotnikowa fno -FNO = KNODOP FZD -KNODOP = KNOPM FNO -…………….. -KNOATR = FPT -…………….. KNOATR (p, rl, 3, neg, i, z, kl) = FPT (p, rl, st, neg, i, z, kl). (NO38) – 12

Dziury i błędy w opisie fno (6) 3. Opis przecinka Przecinek jako jednostka składniowa – duży problem ogólny: -wielofunkcyjność słowa, -wielomotywacyjność wystąpień przecinka ortograficznego -opcjonalność w pewnych kontekstach W GFJP – przecinek pusty międzyspójnikowy: % Wiem, że jeśli przyjdą, umrę. % * Wiem, że, jeśli przyjdą, umrę. – 13

fno: co to jest? (1) Występuje jako realizacja lub składnik: –frazy wymaganej, –frazy luźnej, –frazy przyimkowo-nominalnej, –frazy nominalnej (w szczególności skoordynowanej), –frazy przymiotnikowej. – 14

fno: co to jest? (2) Ma różne struktury: –współrzędną –podrzędną –egzocentryczną Ma różne centra: –rzeczownikowe –liczebnikowe –zaimkowe różnych typów –przymiotnikowe (?) –gerundialne (?) – 15

fno: co to jest? (3) Ma bogaty zestaw cech gramatycznych: –przypadek –rodzaj –liczba –osoba –klasa (centrum) …….. Gęsta sieć uzgodnień wewnętrznych i zewnętrznych – 16

Format i parametry (1) fno(P, R/L, O, Neg, I, Pnw, Kl, Tak, Sub, Pk [, Poz]) fnokoor(P, R/L, O, Neg, I, Pnw, Kl, Tak, Sub, Pk [, Poz, Sp]) – 17

Format i parametry (2) Pprzypadek R/Lrodzaj i liczba Oosoba Negnegacja Iinkorporacja: bowiem, natomiast, więc, zaś, ni, bp; R/L Pnwpytajno-niepytajność: npyt, pyt, pz, wz Klklasa: rzecz, os, co, kto, który, jaki, nuzg, uzg Taktaktylowatość: tk, tyle Subnad-podrzędność: na, po Pkprzecinkowość końcowa: bp, stan Poz pozycja: pre, post, egz Spoznaczenie spójnika – 18

Format i parametry (3) Porządek zapisu reguł: Pnw dowolne Pnw = pyt Pnw = npyt Pnw = wz Pnw = pz – 19

Przykładowe reguły (1) fno(P, R/L, O, Neg, I, Pnw, Kl, Tak, Sub, Pk) --> s(no#), fno(P, R/L, O, Neg, I, Pnw, Kl, Tak, na, bpk), { rozne(Kl, co) }, fzd(który, nk, A, C, T, Neg2, R/L, po, Pk). % Chłopiec, którego znam, [umarł.] % Chłopiec, którego znam [, który umarł, nie przyjdzie.] – 20

Przykładowe reguły (2) fno(mian, nij/poj, 3, Neg, I, pyt, licz, Tak, Sub, Pk) --> s(no#), fpt(mian, R/L, St, Neg1, I1, Pnw1, Kl1, Tak1, po, Pk1), { oblink(I, I1, I2), oblink(I, I2, I3), oblnegf(Neg, Neg1, Neg2) }, flicz(mian, R/L, O, Neg2, I2, Pnw2, nuzg, Tak2, na, Pk2), fno(dop, R/L, O, Neg3, I3, Pnw3, Kl3, Tak3, po, Pk), { rozne(R, mos), rowne(pyt, Pnw1.Pnw2), rowne(Pnw1, npyt.pyt), rowne(Pnw2, npyt.pyt), rowne(Pnw3, npyt.pyt), obltak(Tak, Tak1, Tak2), rozne(Kl3, licz), obltak(Tak, Tak2, Tak3) }. % Które pięć facetek [było zaproszonych?] % Te pięć z której klasy facetek [przyszło?] – 21

Rozwiązanie I: jałowa rekursja fnoprzecspojfno fnospojfno spojfno przec spoj fno fnokoor fno fzd fno(...,I,...) spoj(Tsp, I, ni) fno bez podrzędnika [różne realizacje]: formarzecz, zaimpyt, zaimwzg, zaimos,... – 22

Rozwiązanie II: realizacje atrybutywne (1) Nie ma takiej realizacji ogólnej!!! Zamiast niej – wyliczanka realizacyj szczegółowych: Pnw dowolne: Przymiotnik fno(P, R/L, 3, Neg, I, Pnw, Kl, Tak, Sub, Pk) --> s(no#), fpt(P, R/L, St, Neg, I, Pnw, Kl, Tak, na, Pk), { rowne(St, wyz.naj) }. % Nowszą od czego [czytano?] % Najnowszej [nie czytano.] – 23

Rozwiązanie II: realizacje atrybutywne (2) Liczebnik porządkowy fno(P, R/L, 3, Neg, I, Pnw, Kl, Tak, Sub, Pk) --> s(no#), flicz_porz(P, R/L, Neg, I, Pnw, Kl, Tak, na, Pk). % Drugiego [widziałem.] – 24

Rozwiązanie II: realizacje atrybutywne (3) Zaimek przymiotny fno(P, R/L, 3, Neg, I, Pnw, Kl, Tak, Sub, Pk) --> s(no#), fno_zaim_przym(P, R/L, Neg, I, Pnw, Kl, Tak, Sub, Pk). % Każdą [lubiłem.] % [Nie znam] żadnej [.] Jest osobna definicja fno_zaim_przym – 25

Rozwiązanie II: realizacje atrybutywne (4) Pnw = wz fno(P, R/L, 3, Neg, I, wz, Kl, Tak, Sub, Pk) --> s(no#), przyimek(Forma, dop), { rowne(Forma, z.spośród) }, fno(dop, R/mno, O, Neg1, I1, wz, Kl1, Tak1, po, Pk1), { oblnegf(Neg, Neg1, Neg2), oblink(I, I1, I2), obltak(Tak, Tak1, Tak2) }, fno_zaim_przym(P, R/L, Neg2, I2, Pnw2, Kl2, Tak2, na, Pk). % [Książek, ] z których żadnej [nie znam, nie czytano.] – 26

Rozwiązanie III: opis przecinka (1) Problem: % Chłopiec, którego znam, umarł. % * Chłopiec, którego znam umarł. % Umarł chłopiec, którego znam. % * Umarł chłopiec, którego znam,. % Chłopiec, którego znam, który umarł, nie przyjdzie. % Chłopiec, którego znam,, który umarł, nie przyjdzie. – 27

Rozwiązanie III: opis przecinka (2) fno(P, R/L, O, Neg, I, Pnw, Kl, Tak, Sub, Pk) --> s(no#), fno(P, R/L, O, Neg, I, Pnw, Kl, Tak, na, bpk), { rozne(Kl, co) }, fzd(który, nk, A, C, T, Neg2, R/L, po, Pk). Jednostki zawierające przec lub spoj(przec,…) zdanie (koordynacja!!!) fw fl fno fpt fzd – 28

Rozwiązanie III: opis przecinka (3) W regułach definiujących te jednostki składnik przedprzecinkowy / przedspójnikowo-przecinkowy X dostaje wartość bpk. W regule definiującej wypowiedzenie jednostka zdanie ma wartość bpk. Wewnątrz X wartość ta spada na składnik końcowy. Dla X = fzd są dwie realizacje: -stan – z przec na końcu -bpk – bez przec na końcu Dla X będącego frazą bez przecinka każda realizacja jest stan. – 29

Rozwiązanie III: opis przecinka (4) % Chłopiec, którego znam [Pk = stan], umarł. % * Chłopiec, którego znam umarł. % Umarł chłopiec, którego znam [Pk = bpk]. % * Umarł chłopiec, którego znam,. % Chłopiec, którego znam [Pk = bpk], który umarł, nie przyjdzie. % Chłopiec, którego znam,, który umarł, nie przyjdzie. – 30

Rozwiązanie III: opis przecinka (5) Problem przecinka początkowego: rozwiązany przez parametr I (?). % Kto pyta, nie błądzi. % *, Kto pyta, nie błądzi. Pozostaje problem opisu braku przecinka wewnątrz fzd o pierwszym składniku będącym fzd: % Wiem, że kto pyta, nie błądzi. % * Wiem, że, kto pyta, nie błądzi. – 31

Luźne końce… (1) Definicja frazy liczebnikowej (banał…). Porządna definicja fno z koordynacją. Opis fno egzocentrycznej: % Chłopiec i dziewczyna [przyszli.]egz % My i dziewczyna [przyszliśmy.]egz % [Przyszli] chłopiec i dziewczyna [.]egz % [Przyszliście] chłopiec i wy [.]egz % [Przyszedł] chłopiec i dziewczyna [.] post % [Przyszedł] chłopiec i ktoś jeszcze [.] post % [Przyszedł] chłopiec i dwie dziewczyny [.] post % [Przyszedł] chłopiec i pięć dziewczyn [.] post – 32

Luźne końce… (2) % Chłopiec i ktoś jeszcze [przyszedł.]pre % Chłopiec i dwie dziewczyny [przyszły.]pre % Chłopiec i pięć dziewczyn [przyszło.]pre Ale także: % naszych Jasia i Marysi % kochane Joasiu i dziewczyny % tymi filozofią i matematyką – 33

Dziękuję za uwagę!!! – 34