Proseminarium doktoranckie 2015/2016, semestr letni WSPÓŁCZESNE NARZĘDZIA OPISU LINGWISTYCZNEGO POLSZCZYZNY Proseminarium doktoranckie 2015/2016, semestr letni Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego Instytut Języka Polskiego UW Konsultacje: środa , pok 1 Strona internetowa:
2 Spotkanie 5 GFJP z lotu ptaka
3 Program na dziś 1. Źródła. 2. GFJP jako model języka polskiego. 3. Hierarchia i jednostki. 4. Parametry. 5. Ogólny mechanizm uzgodnienia.
Model — urządzenie funkcjonujące jak oryginał. Co jest tym oryginałem (= obiektem opisu)? Umowa: JN – zbiór wszystkich zdań poprawnych. Co modelujemy? Ten zbiór. Opis języka to definicja zbioru wszystkich zdań poprawnych i tylko takich. Język jest zbiorem nieskończonym. Język = gramatyka. Opis języka jest również konwencjonalny i arbitralny. Istnieje nieograniczenie wiele poprawnych gramatyk (= opisów) danego języka. 4 Intuicja opisu formalnego
Formalne rozumienie języka Język formalny: zbiór wszystkich wyrażeń poprawnych zbudowanych z elementów danego słownika (zbiór wszystkich wyrażeń nad danym alfabetem). Gramatyka formalna: definicja języka formalnego, czyli instrukcja budowy (lub rozbioru) wszystkich tych i tylko tych zdań, które należą do danego języka. Słownik należy do gramatyki!!! Opis formalny danego JN: zdefiniowanie pewnego języka formalnego i dopasowanie go do opisywanego JN. 5
6 Źródła A. Colmerauer (1978) – gramatyka metamorficzna i język programowania PROLOG. S. Szpakowicz, Formalny opis składniowy zdań polskich (1983, 1986) M. Świdziński, Gramatyka formalna języka polskiego (1992) GM => parser: droga niedługa (?).
7 M. Woliński, Komputerowa weryfikacja gramatyki Świdzińskiego (2004) Świgra M. Ogrodniczuk, Weryfikacja korpusu wypowiedników polskich (z wykorzystaniem gramatyki formalnej Świdzińskiego) (2006) gfjp2 (od 2010) Dendrarium (2010--)
8 GFJP G: Vkształty słów (także wyrażeń...; są słowa puste...) V'ponad 100 jednostek składniowych (termy) WYPOWIEDZENIE P461 reguł postaci: FNO (p,rl,o,neg,i,z,kl) = KNODOP (p,rl,o,neg,i,z,kl) FZD (KTÓRY,k,a,c,t,neg1,rl) PRZEC $ RÓŻNE (kl,CO.KTO.WZ)
9 GFJP jako model języka polskiego Założenia: 1. definicja polszczyzny – wyliczanka struktur (ekstensywność), 2. opisujemy wszystkie wyrażenia (exhaustiveness), 3. polszczyzna to język o szyku ustalonym, 4. hierarchia wielopoziomowa, 5. typowa realizacja jednostki składniowej: konstrukcja („filozofia trzech”), 6. dwa mechanizmy: wymaganie i uzgodnienie, 7. jednostka składniowa: term z parametrami.
10 1. Ekstensywność. Tego brak. Tego mi brak. Tego tylko mi brak. Tego od wielu lat mi brak. Tego godzinę mi było brak. Tego chłopca znam. Tego chłopca nie znam. Tego faceta matka jest wziętym ginekologiem. Tego, że będzie padać, spodziewaliśmy się od rana. Tego ani tamtego ci nie darują. Tego dnia armia talibów zajęła Hrubieszów. Tego brak, a tamtego znów mamy w nadmiarze. Tego chłopca nie znam, nikt mi go nie przedstawił, żałuję. Tego chłopca nie znam, nikt mi go bowiem nie przedstawił.
11 Nie tylko Z1, ale także Z2. Z1, ale Z2. Z1, Z2' zaś Z2". I Z1, i Z2,..., i Zn. Albo Z1, albo Z2. Z1, Z2,..., Zn. Z1, Z2. Z1 bądź Z2. Z1, więc//bo Z2. Dopóki Z1, dopóty Z2 Z
12 Filozofia GFJP: niesłownikowość bardzo wysoki poziom szczegółowości opisu wielointerpretacyjność modelowanie neutralizacji niemożliwość określenia stopnia permisywności opisu
13 2. Exhaustiveness. Czego GFJP nie definiuje? a. oznajmień: *Won! *Co to? *Ryk wód, szum zawiei. b. zawiadomień, *„Pan Tadeusz” *WARSZAWA WSCHODNIA *HP LaserJet
14 c. niektórych wyrażeń z nieciągłością: *Kogo on chce oszukać? d. konstrukcji z liczebnikami: * Dwie kobiety przyszły. *Pięć psów szczeka. *Pięciu facetów było rozebranych. (To już dzisiaj nieprawda...) e.niektórych innych wyrażeń...
15 3. Polski – język pozycyjny. Jaś ma katar. Jaś katar ma. Ma Jaś katar. Ma katar Jaś. Katar Jaś ma. Katar ma Jaś.
16 Konsekwencje definicja danej jednostki składniowej przez zbiór reguł kłopot z jednostkami pustymi (nad)wielointerpretacyjność...
17 4. Hierarchia wielopoziomowa
18
19 Konsekwencje drzewa niechomskiańskie drzewa niekoniecznie binarne bardzo długie gałęzie Cykle jałowe typu: JNP= A A= BRekurencja... Uff!!!.... Z= JNP
20 5. „Filozofia trzech” A. Dwa typy konstrukcji składniowych: współrzędny podrzędny B.Trzy typy realizacji: systemowo typowa systemowo prosta systemowo zdegenerowana
21 Ad A.: (Znam) Jasia i Małgosię tego, któremu nie zależy odpowiedź Piotra kumpla z wojska znanych znawców Ad B.: systemowo typowa systemowo prosta systemowo zdegenerowana (Znam) Jasia
22
23 6. Dwa mechanizmy. A.wymaganie:=> FW Intuicja: zadane przez prawą stronę reguły (?) specjalne parametry (?) B. uzgodnienie:=> parametry Intuicja: wymuszona identyczność wartości cech składniowych.
24 7. Termy z parametrami. Zdanie równorzędne ZR (wf,a,c,t,rl,o,neg,i,z) Zdanie elementarne ZE (wf,a,c,t,rl,o,wa,wb,wc,neg,i,z,ow) Fraza wymagana właściwa FW1 (tfw,k,a,c,rl,o,neg,i,z)
25 Fraza nominalna FNO (p,rl,o,neg,i,z,kl) Spójnik SPÓJ (tsp,oz,i) Zaimek względny ZAIMWZG (kgz,p,rl,o,kl)
26 Przykładowe reguły FNO (p,rl,o,neg,i,z,kl) = KNODOP (p,rl,o,neg,i,z,kl) FZD (KTÓRY,k,a,c,t,neg1,rl) PRZEC $ RÓŻNE (kl,CO.KTO.WZ) = KNODOP (p,rl,o,neg,i,z,kl) FZD (tfz,k,a,c,t,neg1,rl) PRZEC $ RÓWNE (kl,CO.KTO) $ RÓWNE (tfz,kl.KTÓRY). Chłopiec, którego znam, umarł. Nie mam tego, czym się szczycisz, ani pieniędzy.
27 FW1 (BIER,k,a,c,rl,o,neg,i,z) = FNO (DOP,rl1,o1,neg,i,z,kl). $ RÓWNE (neg,ANI.NIE). FW1 (BIER,k,a,c,rl,o,TAK,i,z) = FNO (BIER,rl1,o1,neg,i,z,kl). Nie kupili żadnej książki. Ciekawą książkę kupili.
28 Hierarchia i jednostki Jednostki zdaniowe: 1. WYPOWIEDZENIE 2. ZR 3. ZSZ 4. ZJ 5. ZP 6. ZE
29 Przełączniki fraz: 1. FF (FF1) 2. FW (FW1) 3. FL (FL1)
30 Frazy: 1. FWE (KWENEG, KWEINK, KWE) 2. FPM 3. FNO (KNODOP, KNOPM, KNOATR, KNOINK, KNOM) 4. FPT 5. FPS 6. FZD
31 Jednostki funkcyjne: 1. SPOJNIK 2. ZAIMWZG 3. ZNAKKONCA 4. PRZECSP 5. PRZEC
32 Strukturyzacja To nie było dawno, ale albo się mylę, albo Jaś, choć nie wydawał się bystry, dowiedział się zarówno o tym, że zabrakło tego, kto miał nad nami czuwać, oraz o tym, że nikt nie przyszedł ani nie zadzwonił, jak również że przegapiono okazję, która się nie powtórzy, bo był dość konsekwentny, starając się, żebyśmy doszli, dlaczego tak się stało.
33 Zdanie elementarne to nie było dawno się mylę Jaś, choć nie wydawał się bystry, dowiedział się zarówno o tym, że zabrakło tego, kto miał nad nami czuwać, oraz o tym, że nikt nie przyszedł ani nie zadzwonił, jak również że przegapiono okazję, która się nie powtórzy, bo był dość konsekwentny, starając się, żebyśmy doszli, dlaczego tak się stało nie wydawał się bystry zabrakło tego, kto miał nad nami czuwać dlaczego tak się stało
34 Struktura zdania elementarnego ZE = FL FFFWFWFW FW
35 Parametry wyróżnik fleksyjny aspekt czas tryb rodzaj-liczba osoba wymaganie a wymaganie b wymaganie c negacja inkorporacja zależność ograniczenie wewnętrzne
36 Ogólny mechanizm uzgodnienia ZE (wf,a,c,t,rl,o,wa,wb,wc,neg,i,z,ow) = FL (a,c,rl,o,neg,i,NP) (E4) <FF(wf,a,c,t,rl,o,wa,wb,wc,k,neg,NI, z,ow) FW (wa,k,a,c,rl,o,neg,NI,NP) FW (wb,k,a,c,rl,o,neg,NI,NP) FW (wc,k,a,c,rl,o,neg,NI,NP) >......