5. Wprowadzenie do nauki o języku A1NJ

Slides:



Advertisements
Podobne prezentacje
I część 1.
Advertisements

Lingwistyka Matematyczna
Lingwistyka Matematyczna
Lingwistyka Matematyczna
Metody badania stabilności Lapunowa
Wprowadzenie do informatyki Wykład 6
Obserwowalność System ciągły System dyskretny
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
Ludwik Antal - Numeryczna analiza pól elektromagnetycznych –W10
Filtracja obrazów cd. Filtracja obrazów w dziedzinie częstotliwości
Liczby pierwsze.
PROGRAM OPERACYJNY KAPITAŁ LUDZKI Priorytet III, Działanie 3.2
Lingwistyka Matematyczna
Systemy operacyjne Copyright, 2000 © Jerzy R. Nawrocki Wprowadzenie do informatyki.
Systemy operacyjne Copyright, 2000 © Jerzy R. Nawrocki Wprowadzenie do informatyki.
Języki formalne i gramatyki
Podstawy informatyki Rekurencja i rekurencja Grupa: 1A
Podstawowe pojęcia akustyki
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
1. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
2. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego Instytut Języka.
1. Wprowadzenie do nauki o języku A1NJ
4. Wprowadzenie do nauki o języku A1NJ
Dyskretny szereg Fouriera
Transformacja Z (13.6).
Jak wypadliśmy na maturze z matematyki w 2010 roku?
Wykonawcy:Magdalena Bęczkowska Łukasz Maliszewski Piotr Kwiatek Piotr Litwiniuk Paweł Głębocki.
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
Obserwatory zredukowane
Stabilność Stabilność to jedno z najważniejszych pojęć teorii sterowania W większości przypadków, stabilność jest warunkiem koniecznym praktycznego zastosowania.
KALENDARZ 2011r. Autor: Alicja Chałupka klasa III a.
1/34 HISTORIA BUDOWY /34 3/34 6 MAJA 2011.
Podstawy adresowania hostów w sieciach komputerowych
Plan prezentacji Zarys projektu Geneza tematu
Podstawy działania wybranych usług sieciowych
ŻYWE JĘZYKI PROGRAMOWANIA LIVING IT UP WITH A LIVE PROGRAMMING LANGUAGE Sean McDirmid Ecole Polytechnique Fédérale de Lausanne (EPFL)
Analiza wpływu regulatora na jakość regulacji (1)
Analiza wpływu regulatora na jakość regulacji
Wskazówki konkursowe.
Modelowanie i Identyfikacja 2011/2012 Metoda propagacji wstecznej Dr hab. inż. Kazimierz Duzinkiewicz, Katedra Inżynierii Systemów Sterowania 1 Warstwowe.
Teoria sterowania 2011/2012Stabilno ść Kazimierz Duzinkiewicz, dr hab. in ż. Katedra In ż ynierii Systemów Sterowania 1 Stabilność Stabilność to jedno.
Dekompozycja Kalmana systemów niesterowalnych i nieobserwowalnych
Wykład 22 Modele dyskretne obiektów.
Kalendarz 2011r. styczeń pn wt śr czw pt sb nd
Obserwowalność i odtwarzalność
Translatory Copyright, 2006 © Jerzy R. Nawrocki Wprowadzenie do informatyki Wykład 11.
Gramatyki i translatory
Stabilność Stabilność to jedno z najważniejszych pojęć dynamiki systemów i teorii sterowania W większości przypadków, stabilność jest warunkiem koniecznym.
ZDYSCYPLINOWANY OPIS JĘZYKÓW NATURALNYCH I KORPUSY TEKSTÓW Proseminarium doktoranckie 2013/2014, semestr letni Prof. dr hab. Marek Świdziński Zakład.
  Prof.. dr hab.. Janusz A. Dobrowolski Instytut Systemów Elektronicznych, Politechnika Warszawska.
W2 Modelowanie fenomenologiczne I
Gramatyki Lindenmayera
Treści multimedialne - kodowanie, przetwarzanie, prezentacja Odtwarzanie treści multimedialnych Andrzej Majkowski informatyka +
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
Kalendarz 2020.
Elementy geometryczne i relacje
Języki formalne i gramatyki Copyright, 2005 © Jerzy R. Nawrocki Teoretyczne podstawy.
Spotkanie 5 Poliqarp.. Znakowanie – tagging Narzędzie do znakowania – tager Znakowanie: przypisywanie jednostkom tekstowym jakichś kodów (tagów): 1. lokalizacja.
8. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
Języki formalne Copyright, 2006 © Jerzy R. Nawrocki Wprowadzenie do informatyki Wykład.
ANALIZA SKŁADNIOWA.
10. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
Systemy wspomagające dowodzenie twierdzeń
Spotkanie 5 Wstęp do GFJP: jak to chodzi....  Definicja pewnego zbioru wyrażeń (np. zbioru „język polski”).  Różne aparaty: ST, EST, GB, GPSG, HPSG,…
Spotkanie 5 Poliqarp.. Znakowanie – tagging Narzędzie do znakowania – tager Znakowanie: przypisywanie jednostkom tekstowym jakichś kodów (tagów): 1. lokalizacja.
Wstęp do programowania Wykład 9
Proseminarium doktoranckie 2015/2016, semestr letni WSPÓŁCZESNE NARZĘDZIA OPISU LINGWISTYCZNEGO POLSZCZYZNY Proseminarium doktoranckie 2015/2016, semestr.
Zapis prezentacji:

5. Wprowadzenie do nauki o języku 3003-11A1NJ 5. Wprowadzenie do nauki o języku 3003-11A1NJ * 3003-K1A1NJ Studia stacjonarne 2011/2012 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego Instytut Języka Polskiego UW e-mail: m.r.swidzinski@uw.edu.pl Konsultacje: środa 14.00-15.00, pok. 1 Strona przedmiotu — szukaj pod: http://www.mswidz.republika.pl/

Program wykładu Przedmiot językoznawstwa. Cechy definicyjne języka naturalnego.  Struktura języka I: morfologia. Struktura języka II: składnia.  Formalne rozumienie języka. Podstawy leksykologii. Leksykografia. Zróżnicowanie języków świata. Podstawy typologii.

Formalne rozumienie języka naturalnego Wykład 5 Formalne rozumienie języka naturalnego

Intuicja opisu formalnego Model — urządzenie funkcjonujące jak oryginał. Co jest tym oryginałem (= obiektem opisu)? Umowa: JN – zbiór wszystkich zdań poprawnych. Co modelujemy? Ten zbiór. Opis języka to definicja zbioru wszystkich zdań poprawnych i tylko takich. Język jest zbiorem nieskończonym. Język = gramatyka. Opis języka jest również konwencjonalny i arbitralny. Istnieje nieograniczenie wiele poprawnych gramatyk (= opisów) danego języka.

Lingwistyka formalna i informatyczna Lingwistyka do początków XX wieku – filologia: analiza tekstów minionych epok, egzegeza, interpretacje historyczne (etymologia). Lingwistyka I połowy XX wieku – strukturalizm (J.N. Baudouin de Courtenay, F. de Saussure, M. Kruszewski, O. Jespersen, N. Trubeckoj, L. Hjelmslev, L. Tesniére, J. Kuryłowicz, L. Bloomfield, Z. S. Harris): opis struktury, nie genezy.

Lingwistyka formalna i informatyczna Lingwistyka formalna: opisy matematyczne – twierdzenia, dowody, rachunki. Opis na papierze!!! Wynik: definicja drzew struktury. Lingwistyka informatyczna: zadania inżynierskie – automatyczna analiza tekstu, przetwarzanie tekstów, przeszukiwanie itp. Opis jest urządzeniem – na przykład programem komputerowym. Wynik: rzeczywiste drzewa struktury dla danego wyrażenia (parsing trees). Pojęcie implementacji opisu (formalnego).

Inny system dwuklasowy [Zbiór_zdań] = {1, 17, 909, 1889, 39976145,...}   [Zbiór_zdań] to język!!! [Zbiór _znaków_prostych] = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} Wyrażenia niepoprawne (= nie należące do języka): *01 *017 *0000953,...

Gramatyka formalna Gramatyka formalna = instrukcja: Napisz dowolną cyfrę. Zakończ. Napisz dowolną cyfrę różną od 0. Ewentualnie dopisz dowolną cyfrę do wyniku instrukcji c. Operację d. możesz ewentualnie powtórzyć dowolnie wiele razy. Napisz KONIEC.

Derywacje Nasze derywacje [1] KONIEC

Derywacje [2] 5 58 KONIEC

Derywacje [3] 5 58 589 5890 58900 589009 .......... KONIEC

Zapis formalny Gramatyka formalna – pewien rachunek. Wiele szczegółowych formalizmów. Jedna z postaci gramatyki formalnej: gramatyka struktur frazowych, PS-grammar). G: <V, V', , P> gdzie: V słownik terminalny V' słownik nieterminalny (pomocniczy)  symbol początkowy P zbiór produkcji

Zapis formalny Przykładowa gramatyka formalna V = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} V' = {Cyfra, Cyfra1, Liczba, Liczba1}  = Liczba P: (1) Liczba  Cyfra (2) Liczba  Cyfra1 Liczba1 (3) Liczba1  Cyfra (4) Liczba1  Cyfra Liczba1 (5) Cyfra  0, 1, 2, 3, 4, 5, 6, 7, 8, 9 (6) Cyfra1  1, 2, 3, 4, 5, 6, 7, 8, 9 gdzie  — 'przepisz to, co po lewej, na to, co po prawej stronie produkcji'. (4): produkcja rekurencyjna!!!

Derywacje Nasze derywacje [1] Liczba Cyfra (1) 0 [2] Cyfra1 Liczba1 (2) 5 Liczba1 (6) 5 Cyfra (3) 58 (5)

5 8 9 0 0 4 5 (5) Derywacje [3] Liczba Cyfra1 Liczba1 (2) 5 8 9 0 0 4 5 (5)

Derywacje Synteza i analiza Derywacja to również opis analizy. Interpretacja wyrażenia *058: Reguła Liczba  Cyfra Liczba TAKIEJ REGUŁY NIE MA!!! Więc: wyrażenie się nie analizuje. Wyrażenie jest dewiacyjne (= nie istniejące, niepoprawne).

Gramatyka formalna jako model języka Co taka gramatyka „robi”? a. odróżnia wyrażenia poprawne od niepoprawnych (= nie należących do języka), b. interpretuje wyrażenia poprawne, c. wytwarza wyrażenia poprawne. Gramatyka robi to samo, co użytkownik tego języka!!!

Gramatyka formalna jako model języka W taki sam sposób można opisywać JN!!!

Formalne rozumienie języka Język formalny Formalne rozumienie języka   Język formalny: zbiór wszystkich wyrażeń poprawnych zbudowanych z elementów danego słownika (zbiór wszystkich wyrażeń nad danym alfabetem).  Gramatyka formalna: definicja języka formalnego, czyli instrukcja budowy (lub rozbioru) tych i tylko tych zdań, które należą do danego języka. Słownik należy do gramatyki!!!  Opis formalny danego JN: zdefiniowanie pewnego języka formalnego i dopasowanie go do opisywanego JN.

Przewrót kopernikański w lingwistyce Generatywizm Przewrót kopernikański w lingwistyce Noam Chomsky (1928-), profesor MIT. Syntactic Structures, Cambridge (Mass.) 1957. Gramatyka generatywno-transformacyjna. Gramatyka generatywna: każda gramatyka formalna. gramatyka Chomsky’ego. ST: Standard Theory Idea: składnik frazowy: definicja zbioru drzew składnik transformacyjny: przekształcenia drzew interpretacja fonologiczna i semantyczna

Generatywizm Przykładowe reguły frazowe S => NP — AUX — VP VP => V — NP — PP NP => (Det) — N PP => P — NP N => Jeeves, employer, castle V => meet AUX => will P => at DET => the, his

Generatywizm

Generatywizm Intuicja transformacji Przekształcają drzewo w inne drzewo: At the castle, Jeeves will meet his employer. His employer, Jeeves will meet at the castle. Meet his employer at the castle, Jeeves will (indeed).

Generatywizm Aspects of the Theory of Syntax, Cambridge (Mass.) 1965. [Po polsku: Zagadnienia składni ogólnej, Warszawa 1976] EST: Extended Standard Theory. Idea: drzewo – struktura głęboka drzewo przekształcone – struktura powierzchniowa zachowanie znaczenia ograniczenia selekcyjne interpretacja semantyczna

Generatywizm Lectures on Government and Binding, Dordrecht 1981. GB: teoria rządu i wiązania. Idea: proces nabywania języka: 3 składniki wstępne doświadczenia językowe UG (zbiór zasad i parametrów) gramatyka danego języka wszystkie języki świata mają tę samą UG gramatyka: składnik frazowy (z warunkami), jedna transformacja (Move )

Generatywizm Aparat pojęciowy subkategoryzacja teoria Theta role tematyczne zasada projekcji rozszerzona zasada projekcji rzut (projekcja) przypisywanie przypadka c-command teoria wiązania ograniczenia lokalne łańcuchy A przesunięcie NP punkt lądowania bariera ..........................

Generatywizm Inne teorie Gerald Gazdar (lata 1980) GPSG (Generalized Phrase Structure Grammar) Ivan A. Sag, Carl J. Pollard (koniec lat 1980) HPSG (Head-Driven Phrase Structure Grammar) Noam Chomsky (1995) The Minimalist Program

Generatywizm Jest bardzo obfita literatura generatywistyczna: opisy wielu języków – także egzotycznych; także polszczyzny. Głównie: GB i HPSG. Pionier: I. Bobrowski GB: P. Bański. J. Błaszczak, K. Dziwirek, B. Rozwadowska, E. Willim, J. Waltoś HPSG: A. Przepiórkowski, A. Kupść, A. Marciniak, A. Mykowiecka

Gramatyka metamorficzna PROLOG i MG w Polsce A. Colmerauer (1978) – gramatyka metamorficzna i język programowania PROLOG. S. Szpakowicz, Formalny opis składniowy zdań polskich (1983, 1986) M. Świdziński, Gramatyka formalna języka polskiego (1992) GM = prawie gotowy parser!!!

Gramatyka metamorficzna Przykładowe reguły GFJP FNO (p,rl,o,neg,i,z,kl) = KNODOP (p,rl,o,neg,i,z,kl) FZD (KTÓRY,k,a,c,t,neg1,rl) PRZEC $ RÓŻNE (kl,CO.KTO.WZ) = KNODOP (p,rl,o,neg,i,z,kl) FZD (tfz,k,a,c,t,neg1,rl) $ RÓWNE (kl,CO.KTO) $ RÓWNE (tfz,kl.KTÓRY). Chłopiec, którego znam, umarł. Nie mam tego, czym się szczycisz, ani pieniędzy.

Gramatyka metamorficzna FW1 (BIER,k,a,c,rl,o,neg,i,z) = FNO (DOP,rl1,o1,neg,i,z,kl). $ RÓWNE (neg,ANI.NIE). FW1 (BIER,k,a,c,rl,o,TAK,i,z) = FNO (BIER,rl1,o1,neg,i,z,kl). Nie kupili żadnej książki . Ciekawą książkę kupili.

DCG zdanie(Wf,A,C,T,Rl,O,Neg,Dest,I,Pk,Sub) --> s(ze1), ff(Wf,A,C,T,Rl,O,Wym1,Neg,Dest1,I1,Pk1,na), { sprawdz_wf(Wf,Wym1,Wym) }, sequence_of([ fw(W2,A,C,Rl,O,post,Neg,Dest2,I2,Pk2,po) ^[oblwym_iter,Wym,W2,ResztaWym], fl(A,C,Rl,O,Neg,Dest2,I2,Pk2,po) ^[najwyżej3,0,_,_] ] ^[obldest_iter,Dest1,Dest2,Dest] ^[oblink_iter,I1,I2,I] ^[sprawdz_pk_iter,Pk1,Pk2,Pk] ), { ResztaWym = wym([],OW),resztawym(OW) }.  

Implementacje Opis formalny może być zrealizowany w praktyce, czyli zaimplementowany. Implementacja: napisanie programu, sam ten program (aplikacja)

Implementacje Analizator morfologiczny AMOR (1999-2002) (Michał Rudolf, Joanna Rabiega-Wiśniewska)

Implementacje Analizator morfologiczny POMOR (po 1987) (dr Robert Wołosz, Pecs)

Implementacje Analizator morfologiczny Morfeusz (dr Marcin Woliński, Warszawa) http://sgjp.pl/morfeusz/ http://www.ipipan.waw.pl/~wolinski/

Implementacje Analizator składniowy Marcina Wolińskiego Świgra Marcin Woliński, Komputerowa weryfikacja gramatyki Świdzińskiego. Rozprawa doktorska, Instytut Podstaw Informatyki PAN, Warszawa, grudzień 2004 Promotor: J.S. Bień. http://nlp.ipipan.waw.pl/~wolinski/swigra/

Implementacje Projekt składniowy: Budowa banku drzew składniowych dla języka polskiego z wykorzystaniem automatycznej analizy składniowej, Nr N 104 2247 35. Kierownik projektu: dr Marcin Woliński. Od 14.10.2008 do 13.10.2011.

Produkty Zastosowania Złota encyklopedia PWN Komputerowy Słownik Języka Polskiego Słownik gramatyczny języka polskiego Korpus PWN Korpus IPI PAN

Produkty Wyszukiwarka HOLMES (Michał Rudolf) Wyszukiwarka Poliqarp (Marcin Woliński, IPI PAN)

Podsumowanie Druga połowa XX wieku: początek ery lingwistyki formalnej. Wybitne nazwiska: N. Chomsky, G. Gazdar, I. Sag, A. Colmerauer, C. Pollard. W Polsce: I. Bobrowski, E. Willim, A. Przepiórkowski. Ważne teorie: gramatyka generatywno-transformacyjna – teoria standardowa, rozszerzona teoria standardowa, teoria rzadu i wiązania, minimalizm; uogólniona gramatyka struktur frazowych; gramatyka struktur frazowych ze sterowaniem od nadrzędnika; gramatyka metamorficzna. Lingwistyka informatyczna: wykorzystanie gramatyk formalnych jako narzędzia NLP.