Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Wstęp do językoznawstwa synchronicznego 3003-11A1WS Filologia polska, I rok * 2013/2014 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego.

Podobne prezentacje


Prezentacja na temat: "Wstęp do językoznawstwa synchronicznego 3003-11A1WS Filologia polska, I rok * 2013/2014 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego."— Zapis prezentacji:

1 Wstęp do językoznawstwa synchronicznego A1WS Filologia polska, I rok * 2013/2014 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego Instytut Języka Polskiego UW Konsultacje w pok. 1: środa Strona przedmiotu szukaj pod:

2 2 Program 1.Przedmiot językoznawstwa. 2.Cechy definicyjne języka naturalnego. 3.Struktura języka I: słownik i morfologia. 4.Struktura języka II: składnia. 5.Formalne rozumienie języka. Lingwistyka formalna i informatyczna. 6.Komunikacja językowa. 7.Podstawy leksykologii. Leksykografia. 8.Słowniki – analiza zawartości, klasyfikacja. 9.Zróżnicowanie języków świata. Podstawy typologii. 10.Typy badań lingwistycznych. 11.Kolokwium.

3 Temat 5 Formalne rozumienie języka. Lingwistyka formalna i informatyczna. 3

4 Model urządzenie funkcjonujące jak oryginał. Co jest tym oryginałem (= obiektem opisu)? Umowa: JN – zbiór wszystkich zdań poprawnych. Co modelujemy? Ten zbiór. Opis języka to definicja zbioru wszystkich zdań poprawnych i tylko takich. Język jest zbiorem nieskończonym. Język = gramatyka. Opis języka jest również konwencjonalny i arbitralny. Istnieje nieograniczenie wiele poprawnych gramatyk (= opisów) danego języka. 4 Intuicja opisu formalnego

5 Lingwistyka do początków XX wieku – filologia: analiza tekstów minionych epok, egzegeza, interpretacje historyczne (etymologia). Lingwistyka I połowy XX wieku – strukturalizm (J.N. Baudouin de Courtenay, F. de Saussure, M. Kruszewski, O. Jespersen, N. Trubeckoj, L. Hjelmslev, L. Tesniére, J. Kuryłowicz, L. Bloomfield, Z. S. Harris): opis struktury, nie genezy. 5 Lingwistyka formalna i informatyczna

6 Lingwistyka formalna: opisy matematyczne – twierdzenia, dowody, rachunki. Opis na papierze!!! Wynik: definicja drzew struktury. Lingwistyka informatyczna: zadania inżynierskie – automatyczna analiza tekstu, przetwarzanie tekstów, przeszukiwanie itp. Opis jest urządzeniem – na przykład programem komputerowym. Wynik: rzeczywiste drzewa struktury dla danego wyrażenia (parsing trees). Pojęcie implementacji opisu (formalnego). 6 Lingwistyka formalna i informatyczna

7 [Zbiór_zdań] = {1, 17, 909, 1889, ,...} [Zbiór_zdań] to język!!! [Zbiór _znaków_prostych] = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} Wyrażenia niepoprawne (= nie należące do języka): *01 *017 * ,... 7 Inny system dwuklasowy

8 Gramatyka formalna = instrukcja: a.Napisz dowolną cyfrę. b.Zakończ. c.Napisz dowolną cyfrę różną od 0. d.Ewentualnie dopisz dowolną cyfrę do wyniku instrukcji c. e.Operację d. możesz ewentualnie powtórzyć dowolnie wiele razy. f.Napisz KONIEC. 8 Gramatyka formalna

9 Nasze derywacje [1] a.0 b.KONIEC 9 Derywacje

10 [2] c.5 d.58 f.KONIEC 10 Derywacje

11 [3] c.5 d.58 e f.KONIEC 11 Derywacje

12 Gramatyka formalna – pewien rachunek. Wiele szczegółowych formalizmów. Jedna z postaci gramatyki formalnej: gramatyka struktur frazowych, PS-grammar). G: gdzie: Vsłownik terminalny V'słownik nieterminalny (pomocniczy) symbol początkowy Pzbiór produkcji 12 Zapis formalny

13 Przykładowa gramatyka formalna V = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} V'= {Cyfradow, Cyfranie0, Liczba, Liczbabez0} = Liczba P:(1)Liczba Cyfradow (2)Liczba Cyfranie0 Liczbabez0 (3)Liczbabez0 Cyfradow (4)Liczbabez0 Cyfra Liczbabez0 (5)Cyfra 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 (6)Cyfra 1 1, 2, 3, 4, 5, 6, 7, 8, 9 gdzie 'przepisz to, co po lewej, na to, co po prawej stronie produkcji'. (4): produkcja rekurencyjna!!! 13 Zapis formalny

14 14 Przykładowa gramatyka formalna V = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} V'= {Cyfra, Cyfra 1, Liczba, Liczba 1 } = Liczba P:(1)Liczba Cyfra (2)Liczba Cyfra 1 Liczba 1 (3)Liczba 1 Cyfra (4)Liczba 1 Cyfra Liczba 1 (5)Cyfra 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 (6)Cyfra 1 1, 2, 3, 4, 5, 6, 7, 8, 9 gdzie 'przepisz to, co po lewej, na to, co po prawej stronie produkcji'. (4): produkcja rekurencyjna!!!

15 Nasze derywacje [1] Liczba Cyfra (1) 0 [2] Liczba Cyfra 1 Liczba 1 (2) 5 Liczba 1 (6) 5 Cyfra(3) 58(5) 15 Derywacje

16 [3] Liczba Cyfra 1 Liczba 1 (2) 5 Liczba 1 (6) 5 Cyfra Liczba 1 (4) 5 8 Liczba 1 (5) 5 8 Cyfra Liczba 1 (4) Liczba 1 (5) Cyfra Liczba 1 (4) Liczba 1 (5) Cyfra Liczba 1 (4) Liczba 1 (5) Cyfra Liczba 1 (4) Liczba 1 (5) Cyfra(4) (5) 16 Derywacje

17 Synteza i analiza Derywacja to również opis analizy. Interpretacja wyrażenia *058: Reguła Liczba Cyfra Liczba TAKIEJ REGUŁY NIE MA!!! Więc: wyrażenie się nie analizuje. Wyrażenie jest dewiacyjne (= nie istniejące, niepoprawne). 17 Derywacje

18 Co taka gramatyka robi? a. odróżnia wyrażenia poprawne od niepoprawnych (= nie należących do języka), b. interpretuje wyrażenia poprawne, c. wytwarza wyrażenia poprawne. Gramatyka robi to samo, co użytkownik tego języka!!! 18 Gramatyka formalna jako model języka

19 W taki sam sposób można opisywać JN!!! 19 Gramatyka formalna jako model języka

20 Formalne rozumienie języka Język formalny: zbiór wszystkich wyrażeń poprawnych zbudowanych z elementów danego słownika (zbiór wszystkich wyrażeń nad danym alfabetem). Gramatyka formalna: definicja języka formalnego, czyli instrukcja budowy (lub rozbioru) tych i tylko tych zdań, które należą do danego języka. Słownik należy do gramatyki!!! Opis formalny danego JN: zdefiniowanie pewnego języka formalnego i dopasowanie go do opisywanego JN. 20 Język formalny

21 Przewrót kopernikański w lingwistyce Noam Chomsky (1928-), profesor MIT. Syntactic Structures, Cambridge (Mass.) Gramatyka generatywno-transformacyjna. Gramatyka generatywna: 1.każda gramatyka formalna. 2.gramatyka Chomskyego. ST: Standard Theory Idea: składnik frazowy: definicja zbioru drzew składnik transformacyjny: przekształcenia drzew interpretacja fonologiczna i semantyczna 21 Generatywizm

22 Przykładowe reguły frazowe S => NP AUX VP VP => V NP PP NP => (Det) N PP => P NP N => Jeeves, employer, castle V => meet AUX => will P => at DET => the, his 22 Generatywizm

23 23 Generatywizm

24 Intuicja transformacji Przekształcają drzewo w inne drzewo: At the castle, Jeeves will meet his employer. His employer, Jeeves will meet at the castle. Meet his employer at the castle, Jeeves will (indeed). 24 Generatywizm

25 Aspects of the Theory of Syntax, Cambridge (Mass.) [Po polsku: Zagadnienia składni ogólnej, Warszawa 1976] EST: Extended Standard Theory. Idea: drzewo – struktura głęboka drzewo przekształcone – struktura powierzchniowa zachowanie znaczenia ograniczenia selekcyjne interpretacja semantyczna 25 Generatywizm

26 Lectures on Government and Binding, Dordrecht GB: teoria rządu i wiązania. Idea: proces nabywania języka: 3 składniki –wstępne doświadczenia językowe –UG (zbiór zasad i parametrów) –gramatyka danego języka wszystkie języki świata mają tę samą UG gramatyka: składnik frazowy (z warunkami), jedna transformacja (Move ) 26 Generatywizm

27 Aparat pojęciowy subkategoryzacja teoria Theta role tematyczne zasada projekcji rozszerzona zasada projekcji rzut (projekcja) przypisywanie przypadka c-command teoria wiązania ograniczenia lokalne łańcuchy A przesunięcie NP punkt lądowania bariera Generatywizm

28 Inne teorie Joan Bresnan, Ronald Kaplan (po 1970) LFG (Lexical functional grammar) Alain Colmerauer, Fernando Pereira, David Warren (po 1978) DCG (Definite Clause Grammars) Ivan A. Sag, Carl J. Pollard (koniec lat 1980) HPSG (Head-Driven Phrase Structure Grammar) Noam Chomsky (1995) The Minimalist Program 28 Generatywizm

29 Jest bardzo obfita literatura generatywistyczna: opisy wielu języków – także egzotycznych; także polszczyzny. Głównie: GB i HPSG. Pionier: I. Bobrowski GB: P. Bański. J. Błaszczak, K. Dziwirek, B. Rozwadowska, E. Willim, J. Waltoś HPSG: A. Przepiórkowski, A. Kupść, A. Marciniak, A. Mykowiecka 29 Generatywizm

30 PROLOG i DCG w Polsce A. Colmerauer (1978) – gramatyka metamorficzna i język programowania PROLOG. S. Szpakowicz, Formalny opis składniowy zdań polskich (1983, 1986) M. Świdziński, Gramatyka formalna języka polskiego (1992) GM = prawie gotowy parser!!! 30 Gramatyka metamorficzna

31 Przykładowe reguły GFJP FNO (p,rl,o,neg,i,z,kl) = KNODOP (p,rl,o,neg,i,z,kl) FZD (KTÓRY,k,a,c,t,neg1,rl) PRZEC $ RÓŻNE (kl,CO.KTO.WZ) = KNODOP (p,rl,o,neg,i,z,kl) FZD (tfz,k,a,c,t,neg1,rl) PRZEC $ RÓWNE (kl,CO.KTO) $ RÓWNE (tfz,kl.KTÓRY). Chłopiec, którego znam, umarł. Nie mam tego, czym się szczycisz, ani pieniędzy. 31 Gramatyka metamorficzna

32 FW1 (BIER,k,a,c,rl,o,neg,i,z) = FNO (DOP,rl1,o1,neg,i,z,kl). $ RÓWNE (neg,ANI.NIE). FW1 (BIER,k,a,c,rl,o,TAK,i,z) = FNO (BIER,rl1,o1,neg,i,z,kl). Nie kupili żadnej książki. Ciekawą książkę kupili. 32 Gramatyka metamorficzna

33 zdanie(Wf,A,C,T,Rl,O,Neg,Dest,I,Pk,Sub) --> s(ze1), ff(Wf,A,C,T,Rl,O,Wym1,Neg,Dest1,I1,Pk1,na), { sprawdz_wf(Wf,Wym1,Wym) }, sequence_of([ fw(W2,A,C,Rl,O,post,Neg,Dest2,I2,Pk2,po) ^[oblwym_iter,Wym,W2,ResztaWym], fl(A,C,Rl,O,Neg,Dest2,I2,Pk2,po) ^[najwyżej3,0,_,_] ] ^[obldest_iter,Dest1,Dest2,Dest] ^[oblink_iter,I1,I2,I] ^[sprawdz_pk_iter,Pk1,Pk2,Pk] ), { ResztaWym = wym([],OW),resztawym(OW) }. 33 DCG

34 Opis formalny może być zrealizowany w praktyce, czyli zaimplementowany. Implementacja: 1.napisanie programu, 2.sam ten program (aplikacja) 34 Implementacje

35 Analizator morfologiczny AMOR ( ) (Michał Rudolf, Joanna Rabiega-Wiśniewska) 35 Implementacje

36 Analizator morfologiczny POMOR (po 1987) (dr Robert Wołosz, Pecs) 36 Implementacje

37 Analizator morfologiczny Morfeusz (dr Marcin Woliński, Warszawa) 37 Implementacje

38 Analizator składniowy Marcina Wolińskiego Świgra Marcin Woliński, Komputerowa weryfikacja gramatyki Świdzińskiego. Rozprawa doktorska, Instytut Podstaw Informatyki PAN, Warszawa, grudzień 2004 Promotor: J.S. Bień. 38 Implementacje

39 39

40 40

41 Projekt składniowy: Budowa banku drzew składniowych dla języka polskiego z wykorzystaniem automatycznej analizy składniowej, Nr N Kierownik projektu: dr Marcin Woliński. Od do Implementacje

42 Zastosowania Złota encyklopedia PWN Komputerowy Słownik Języka Polskiego Słownik gramatyczny języka polskiego Korpus PWN Korpus IPI PAN 42 Produkty

43 Wyszukiwarka HOLMES (Michał Rudolf) Wyszukiwarka Poliqarp (Marcin Woliński, IPI PAN) 43 Produkty

44 Napisz gramatyki formalne dla następujących języków: Język liczb dziesiętnych: J1 = {-0,73, 11,5, 1298,333, 12, 0, ,…} Język ułamków zwykłych: J2 = {0, -1[2/3], 128[1/2], 3[7/141], -122,…} Język zegara 12-godzinnego: J3 = {6.15A, 8.44P, 9.12P, 12.00P, 14.11P,…} 44 Zadania

45 45 Podsumowanie 1.Druga połowa XX wieku: początek ery lingwistyki formalnej. 2.Wybitne nazwiska: N. Chomsky, J.Bresnan, G. Gazdar, I. Sag, A. Colmerauer, F. Pereira, C. Pollard. W Polsce: I. Bobrowski, E. Willim, A. Przepiórkowski. 3.Ważne teorie: gramatyka generatywno- transformacyjna – teoria standardowa, rozszerzona teoria standardowa, teoria rzadu i wiązania, minimalizm; uogólniona gramatyka struktur frazowych; gramatyka struktur frazowych ze sterowaniem od nadrzędnika; gramatyka metamorficzna. 4.Lingwistyka informatyczna: wykorzystanie gramatyk formalnych jako narzędzia NLP.

46 Przykładowa gramatyka formalna V = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} V'= {Cyfra_dowolna, Cyfra_nie_0, Liczba, Liczba_nie_od_0, Liczba_od_0, Minus, Przecinek} = Liczba P:(1) (2) (3) (4) (5) (6) 46 Zapis formalny


Pobierz ppt "Wstęp do językoznawstwa synchronicznego 3003-11A1WS Filologia polska, I rok * 2013/2014 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego."

Podobne prezentacje


Reklamy Google