Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

3. W PROWADZENIE DO NAUKI O JĘZYKU 3003-11A1NJ * 3003-K1A1NJ S TUDIA STACJONARNE 2011/2012 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego.

Podobne prezentacje


Prezentacja na temat: "3. W PROWADZENIE DO NAUKI O JĘZYKU 3003-11A1NJ * 3003-K1A1NJ S TUDIA STACJONARNE 2011/2012 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego."— Zapis prezentacji:

1 3. W PROWADZENIE DO NAUKI O JĘZYKU A1NJ * 3003-K1A1NJ S TUDIA STACJONARNE 2011/2012 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego Instytut Języka Polskiego UW Konsultacje: środa , pok. 1 Strona przedmiotu szukaj pod:

2 1. Przedmiot językoznawstwa. 2. Cechy definicyjne języka naturalnego. 3. Struktura języka I: morfologia. 4. Struktura języka II: składnia. 5. Formalne rozumienie języka. 6. Podstawy leksykologii. Leksykografia. 7. Zróżnicowanie języków świata. Podstawy typologii. –2–2 Program wykładu

3 Wykład 3: Struktura języka I: morfologia.

4 Łacina: ARMAVIRUMQUECANOTROIAEQUIPRIMU SABORISITALIAMFATOPROFUGUSLAVIN AQUEVENITLITORA Arma virumque cano, Troiae qui primus ab oris Italiam, fato profugus, Lavinaque venit litora czyny męża-i śpiewam, Troi który pierwszy od wybrzeży do-Italii, losem miotany, lawińskich-i przybył brzegów –4–4 Analiza tekstu

5 Angielski: Our Father who art in heaven, hallowed be thy name. Thy kingdom come. Thy will be done on earth, as it is in heaven. Give us this day our daily bread, and forgive us our trespasses, as we forgive those who trespass against us, and lead us not into temptation, but deliver us from evil. –5–5 Analiza tekstu

6 Koreański: anna-nun ku-eykey pyenci-lul sey-pen-ul ponay-ess-ta. Anna-TOP on-dla list-OB trzy-raz-OB posłać-PRZE-OZN Anna to mu trzykrotnie list wysłała. –6–6 Analiza tekstu

7 Polski: Goście są uwiedzeni urodą ich najmłodszych córek. –7–7 Analiza tekstu

8 Szukanie słówek w słowniku Arma virumque cano Troiae qui primus ab oris Italiam fato profugus Lavinaque venit litora virumque => VIR Italiam => ITALIA venit => VENIO –8–8 Lematyzacja

9 Our Father who art in heaven, hallowed be thy name. Thy kingdom come. Thy will be done on earth, as it is in heaven. Give us this day our daily bread, and forgive us our trespasses, as we forgive those who trespass against us, and lead us not into temptation, but deliver us from evil. art => BE thy => THOU (???) trespasses => TRESPASS –9–9 Lematyzacja

10 anna-nun ku-eykey pyenci-lul sey-pen-ul ponay-ess- ta. anna => ANNA ku => KU ponay => PONAY ul => UL –10 Lematyzacja

11 Polski: Goście są uwiedzeni urodą ich najmłodszych córek. goście => GOŚĆ są => BYĆ uwiedzeni => UWIEŚĆ // UWIEDZIONY urodą => URODA ich => ONI // ONE najmłodszych => MŁODY córek => CÓRKA –11 Lematyzacja

12 Wnioski: Słownik nie jest zbiorem słów (wypisanych z tekstu). Słowa są upakowane w leksemy (= hasła słownikowe). Dotyczy to przytłaczającej większości JN w świecie. Słowa nie są najprostszymi znakami. W gramatyce są reguły: budowy słów (MORFOLOGIA) budowy wyrażeń (SKŁADNIA). –12 Słowa a znaki proste

13 Słownik morfemów M = {-ank-, -ą, -czyta-, dyskretn-, dziś, -ent-, -i, -k-, koch-, -ł-, od, ość-, prze-, -y, -ów, stud-, wiadom-, - } Konstrukcje morfologiczne: o Surowiec: morfemy, konstrukcje morfologiczne. o Produkt: słowa. –13 Punkt wyjścia: morfemy

14 Poprawne: studentki przeczytały dyskretną wiadomość kochanków Dewiacyjne: *studentanki *czytałk *dyskretn *przewiadomośćą *kochów –14 Konstrukcje morfemowe

15 Gramatyka słów: morfologia. Są języki, dla których Gramatyka = Morfologia –15 Gramatyka słów

16 Słownik słów: S = {dyskretną, dziś, przeczytały, kochanków, od, studentki, wiadomość} Konstrukcje składniowe: o Surowiec: słowa, konstrukcje składniowe. o Produkt: wyrażenia (frazy lub zdania). –16 Punkt wyjścia: słowa

17 Poprawne: Studentki przeczytały dziś dyskretną wiadomość od kochanków. Dyskretną od kochanków wiadomość studentki dziś przeczytały. Przeczytały dziś od kochanków wiadomość dyskretną studentki. Dewiacyjne: *Studentki wiadomość dziś od dyskretną kochanków przeczytały. –17 Konstrukcje składniowe

18 Gramatyka wyrażeń: składnia. Są języki, dla których Gramatyka = Składnia. –18 Gramatyka wyrażeń

19 Gramatyka języka polskiego obejmuje: morfologię i składnię. Polski język wysoce fleksyjny (HIL = highly inflecting language). Słowa polskie przeważnie nie są znakami prostymi. –19 Języki wysoce fleksyjne

20 Co to znaczy słowo? Ile słów mamy mamy poniższym zdaniu: Mamy mamy, drogie mamy, młodsze od niejednej mamy, ale mamy lubią wasze mamy. –20 Słowo, forma wyrazowa, leksem

21 Odpowiedzi: –21 Słowo, forma wyrazowa, leksem

22 Rozróżnienia: a. jednostki konkretnej (fizycznego wystąpienia pewnego obiektu) i jednostki abstrakcyjnej klasy wystąpień; [ang. token type] b. jednostki niezinterpretowanej i jednostki zinterpretowanej. –22 Słowo, forma wyrazowa, leksem

23 słowo napis między spacjami lub znakami interpunkcyjnymi; forma wyrazowa słowo z interpretacją gramatyczną (część mowy, ewentualne wartości kategorii fleksyjnych, ewentualnie nazwa jednostki słownikowej); leksem zbiór form wyrazowych o tym samym odniesieniu do rzeczywistości (i o podobnym kształcie). –23 Słowo, forma wyrazowa, leksem

24 Słowo mamy reprezentuje 5 różnych form wyrazowych: (a) czasownikową o wartości pierwszej osoby liczby mnogiej czasu teraźniejszego (mamy(1os,mno,ter)) (b) rzeczownikową o wartości dopełniacza liczby pojedynczej (mamy(dop,poj)); (c) rzeczownikowa o wartości mianownika liczby mnogiej (mamy(mian,mno)); (d) rzeczownikowa o wartości biernika liczby mnogiej (mamy(bier,mno) ); (e) rzeczownikowa o wartości wołacza liczby mnogiej (mamy(woł,mno)). –24 Słowo, forma wyrazowa, leksem

25 o Słowa typu mamy homonimy. o Rozwiązywanie homonimii: dehomonimizacja o LEKSEM hasło słownikowe. o Odgadywanie leksemu: lematyzacja o SŁOWNIK (składnik systemu językowego): zbiór form wyrazowych. o Zbiór leksemów (a więc zbiór zbiorów form wyrazowych) LEKSYKON. –25 Słowo, forma wyrazowa, leksem

26 Typ A: STUDENTKA, PRZECZYTAĆ, WIADOMOŚĆ, KOCHANEK Typ B: DZIŚ, DYSKRETNY, OD Typ A.: podzielne słowotwórczo (derywaty). Typ B.: niepodzielne słowotwórczo. –26 Reguły gramatyki

27 Gramatyka – zbiór reguł, które robią: słowa z morfemówFLEKSJA [ leksemy z leksemów słowotwórstwo ] wyrażenia ze słów i innych wyrażeńSKŁADNIA Słowotwórstwo – słabo gramatyczne. –27 Reguły gramatyki

28 Leksemy zbiory form wyrazowych: STUDENTKA = {studentka,studentki, studentce,..., studentki, studentek, studentkom,...} PRZECZYTAĆ = {przeczytam, przeczytasz, przeczyta,..., przeczytałem, przeczytałam, przeczytałeś,..., przeczytaj, przeczytajmy,..., przeczytałbym, przeczytałabym, przeczytałbyś,..., przeczytać, przeczytawszy} –28 Przedmiot fleksji

29 WIADOMOŚĆ = {wiadomość, wiadomości, wiadomości,..., wiadomościom,...} KOCHANEK = {kochanek, kochanka, kochankowi,..., kochankowie, kochanków, kochankom,...} DZIŚ = {dziś} DYSKRETNY = {dyskretny, dyskretna, dyskretne, dyskretnego, dyskretnej, dyskretnego, dyskretnemu, dyskretnej, dyskretnemu,..., dyskretni, dyskretne, dyskretnych, dyskretnym,..., dyskretniejszy,..., najdyskretniejszy,...} OD = {od, ode} –29 Przedmiot fleksji

30 Fleksja – opis leksemów jako zbiorów form wyrazowych. –30 Zadanie opisu fleksyjnego

31 Jak zinterpretować // odczytać słowo tonie, żeby znaleźć w leksykonie odpowiedni leksem? TON TONA TOŃ TONĄĆ 1. Rozpoznać słowo jako formę wyrazową. 2. Podzielić na składniki (temat fleksyjny, końcówka). Lub inaczej: podzielić na część wspólną i część różną. 3. Poszukać w leksykonie. –31 Analiza morfologiczna

32 Ad 1.: To jest w dobrym tonie. Jasio tonie w rzece. Tonie się rozstąpiły przed Świtezianką. Przyglądałem się tonie. Poprzestali na tonie. W złym środowisku Jan pływa, w dobrym tonie. Jasio zgłębia tonie w rzece. –32 Analiza morfologiczna

33 Ad 2.: tonie ton(i)--elub: ton/ie tonie--Ø to/nie Analogicznie jak trop(i)--e chuc(i)--e słom(i)--e pęknie--Ø –33 Analiza morfologiczna

34 Ad 3.: tonie Leksem A TONjakTROP TONAjakSŁOMA TOŃjakCHUĆ TONĄĆjakPĘKNĄĆ –34 Analiza morfologiczna

35 Fleksja jako fragment opisu gramatycznego fleksja głębinowa: opis uporządkowania form wyrazowych w leksemy (= szkolny rozbiór gramatyczny); fleksja powierzchniowa: opis struktury morfemowej form wyrazowych i klasyfikacja leksemów odmiennych ze względu na strukturę morfemową jego form (= szkolne tematy, końcówki i wymiany głoskowe). –35 Dwa poziomy fleksji

36 Leksemy odmienne i nieodmienne STUDENTKA, PRZECZYTAĆ, WIADOMOŚĆ, DYSKRETNY, WIADOMOŚĆ, KOCHANEK DZIŚ A następujące leksemy: EMU, OD, MUZEUM, STEREO, SUPER ??? –36 Odmienność // nieodmienność

37 Jaki mamy pożytek z fleksji? Semantyczny: Chłopiec śpi. : Chłopcy śpią. Śpię. : Śpisz. : Śpi. Mży. : Mżyło. : Będzie mżyło –37 Funkcje opozycji fleksyjnych

38 Składniowy: Ten chłopiec śpi. : Ci chłopcy śpią. Ten chłopiec śpi. : Ta dziewczyna śpi. : To widmo śpi. bez mamy : o mamie : za mamę Semantyczno-składniowy: Mama zabiła gęś. : Mamę zabiła gęś. : Zabił gęś mamą. Pięć mam płacze. : Kuzynka mamy płacze. –38 Funkcje opozycji fleksyjnych

39 Kategorie gramatyczne fleksyjne Kategorie fleksyjne: opozycje w zbiorze form wyrazowych w poprzek leksemu. Wartości kategorii fleksyjnych: człony takich opozycji. Przypadek, Osoba, Czas ale: mianownik, trzecia, przyszły Język fleksyjny: taki, w którym fleksja służy składni. –39 Opozycja = kategoria fleksyjna

40 Klasyfikacja gramatyczna leksemów polskich Zygmunta Saloniego Mamy leksem LX. Pytamy kolejno: (1) czy jest odmienny; (2) czy odmienia się przez przypadek; (3) czy odmienia się przez osobę; (4) czy odmienia się przez rodzaj; (5) czy odmienia się przez liczbę; (6) czy jest samodzielny składniowo; (7) czy pełni funkcję łączącą; (8) czy ma rząd. –40 Typologia leksemów: części mowy

41 –41 Typologia leksemów: części mowy

42 Paradygmat –42

43 –43

44 –44

45 Problem wypełnienie klatek paradygmatu. Czyli: - jak wyglądają formy wyrazowe danego leksemu; - jak utworzyć dana formę na podstawie innej formy? Typy form fleksyjnych: formy syntetyczne formy analityczne (w tym: aglutynacyjne). Fleksja powierzchniowa

46 Rozbiór: temat fleksyjny (= część wspólna) i część gramatyczna (= część różna). Część gramatyczna: a. pojedynczy morfem końcówka b. sekwencja morfemów (końcówek) c. osobne słowo (być może, wraz z a. lub b.). Fleksja powierzchniowa

47 Formy syntetyczne: dziewczyny: dziewczyn- -y chłopiec: chłopiec- - najmłodszy: naj- -młod- -sz- -y AGL czytałaś: czyta- -ł- -a- -ś AGL czytali: czyta- -l- -i- - [Formy analityczne: AGL (ty)ś... czytała: -ś... czyta- -ł- -a AGL byśmy... czytały: by- -śmy.... czyta- -ł- -y będę czytać: będ- -ę czyta- -ć AGL czytało będzie: czyta- -ł- -o będzie- - ] Fleksja powierzchniowa

48 –48 Problemy: a. końcówki wspólnofunkcyjne i ich dystrybucja, b. alternacje w tematach i ich dystrybucja, c. wzorce odmiany (klasyfikacja leksemów). Ad a.: (mianownik liczby mnogiej) -e (drwale, arbitraże, dworzanie, ciemnie, stolice, kasze) -y (starcy, robotnicy, brzuchy, stoły, dziewczyny, myszy) -i (króliki, hetmani, podłogi, kości) -owie (paziowie, widzowie, wrogowie, panowie) -a (akta, pola, okna) Fleksja powierzchniowa

49 Ad b.:(alternacje w temacie) CZYTAĆ:czytam, czytasz,..., czytają,..., czytałem,... WIEŹĆ: wiozę, wieziesz,..., wiozłem,..., wiózł,..., wieźli,..., wieziono,... ROBOTNIK: robotnik,..., robotnikiem,..., robotnicy,... SZKOŁA:szkoła,..., szkole,..., szkół,... MAŁY: mały,..., mali,..., mniejszego,... Fleksja powierzchniowa

50 –50 Uwaga: w polszczyźnie odmieniaja się tematy! To się nazywa morfonologia droga: drog- + -a drodze: 1. drog- => drodz-, 2. drodz- + -e dróg: 1. drog- => dróg-, 2. dróg- + - kupował: kupowa- + -ł kupujesz: 1. kupowa- => kupuje-, 2. kupuje- + -sz kupując: 1. kupowa- => kupuj-, 2. kupuj- + -ąc ciąć: cią- + -ć tnę: 1. cią- => tn-, 2. tn- + -ę tnął: 1. cią- => tną-, 2. tną- + -ł 50 Fleksja powierzchniowa

51 Ad c.:(wzorce odmiany) Klasyfikacja fleksyjna leksemów oparta na regularnych odpowiedniościach typu a. i typu b.: generowanie tematów od tematów, dopasowywanie końcówek. Systematyzacja fleksji polskiej dzieło Jana Tokarskiego. Fleksja powierzchniowa

52 1. Znajomość języka A: znajomość słówek i reguł budowy / rozbioru wyrażeń. 2. Słownik to zbiór leksemów (= haseł słownikowych). 3. Dla słownika morfemów – gramatyka słów: morfologia. 4. Dla słownika słów – gramatyka wyrażeń: składnia. 5. Polski – język wysoce fleksyjny (HIL = Highly Inflecting Language). 6. Terminy: słowo – forma wyrazowa – leksem. 7. Słowotwórstwo jest w niewielkim stopniu gramatyczne. 8. Gramatyka języka polskiego obejmuje morfologię (= fleksję) i składnię. 9. Fleksja głęboka (paradygmaty) i powierzchniowa (wypełnienie klatek paradygmatu). –52 Podsumowanie


Pobierz ppt "3. W PROWADZENIE DO NAUKI O JĘZYKU 3003-11A1NJ * 3003-K1A1NJ S TUDIA STACJONARNE 2011/2012 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego."

Podobne prezentacje


Reklamy Google