Wstęp do językoznawstwa synchronicznego 3003-11A1WS Filologia polska, I rok * 2013/2014 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego Instytut Języka Polskiego UW e-mail: m.r.swidzinski@uw.edu.pl Konsultacje w pok. 1: środa 16.30-17.30 Strona przedmiotu — szukaj pod: www.mswidz.republika.pl/
Program Przedmiot językoznawstwa. Cechy definicyjne języka naturalnego. Formalne rozumienie języka. Lingwistyka formalna i informatyczna. Komunikacja językowa. Struktura języka I: słownik i morfologia. Struktura języka II: składnia. Podstawy leksykologii. Leksykografia. Słowniki – analiza zawartości, klasyfikacja. Zróżnicowanie języków świata. Podstawy typologii. Typy badań lingwistycznych. Kolokwium.
Struktura języka I: słownik morfologia. Temat 5 Struktura języka I: słownik morfologia.
Analiza tekstu Łacina: ARMAVIRUMQUECANOTROIAEQUIPRIMU SABORISITALIAMFATOPROFUGUSLAVIN AQUEVENITLITORA Arma virumque cano, Troiae qui primus ab oris Italiam, fato profugus, Lavinaque venit litora ‘czyny męża-i śpiewam, Troi który pierwszy od wybrzeży do-Italii, losem miotany, lawińskich-i przybył brzegów’
Analiza tekstu Angielski: Our Father who art in heaven, hallowed be thy name. Thy kingdom come. Thy will be done on earth, as it is in heaven. Give us this day our daily bread, and forgive us our trespasses, as we forgive those who trespass against us, and lead us not into temptation, but deliver us from evil.
Analiza tekstu Koreański: anna-nun ku-eykey pyenci-lul sey-pen-ul ponay-ess-ta. ‘Anna-TOP on-dla list-OB trzy-raz-OB posłać-PRZE-OZN’ Anna to mu trzykrotnie list wysłała.
Analiza tekstu Polski: Goście są urzeczeni urodą ich najmłodszych córek.
Lematyzacja Szukanie słówek w słowniku Arma virumque cano Troiae qui primus ab oris Italiam fato profugus Lavinaque venit litora virumque => VIR Italiam => ITALIA venit => VENIO
Lematyzacja Our Father who art in heaven, hallowed be thy name. Thy kingdom come. Thy will be done on earth, as it is in heaven. Give us this day our daily bread, and forgive us our trespasses, as we forgive those who trespass against us, and lead us not into temptation, but deliver us from evil. art => BE thy => THOU (???) trespasses => TRESPASS
Lematyzacja Polski: Goście są urzeczeni urodą ich najmłodszych córek. goście => GOŚĆ są => BYĆ uwiedzeni => UWIEŚĆ // UWIEDZIONY urodą => URODA ich => ONI // ONE najmłodszych => MŁODY córek => CÓRKA
Konstrukcje morfologiczne Pierwszy typ: tonie weselszego hat gefunden czytalibyśmy cats Wielkiejnocy (dawno)ś przyszło will wait waiting psal jsem będę rzygać
Konstrukcje morfologiczne A to: stolarza Wielkanoc actress podomka Sprachwissenschaft skladatele żebyśmy streetworker szkoła średnia po polsku
Morfologia gramatyczna i słownikowa Morfologia w węższym rozumieniu: to, co się dzieje wewnątrz słowa Morfologia gramatyczna = fleksja Morfologia słownikowa = słowotwórstwo (derywacja) Są języki bez morfologii
Słowa a znaki proste Wnioski: Słownik nie jest zbiorem słów (wypisanych z tekstu). Słowa są upakowane w leksemy (= hasła słownikowe). Dotyczy to przytłaczającej większości JN w świecie. Słowa nie są najprostszymi znakami.
Punkt wyjścia: morfemy „Słownik” morfemów M = {-ank-, -ą, -czyta-, dyskretn-, dziś, -ent-, -i, -k-, koch-, -ł-, od, ‑ość-, prze-, -y, -ów, stud-, wiadom-, -} Konstrukcje morfologiczne: Surowiec: morfemy, konstrukcje morfologiczne. Produkt: słowa.
Konstrukcje morfemowe Poprawne: studentki przeczytały dyskretną wiadomość kochanków Dewiacyjne: *studentanki *czytałk *dyskretn *przewiadomośćą *kochów
Gramatyka słów Gramatyka słów: morfologia. Są języki, dla których Gramatyka = Morfologia
Punkt wyjścia: słowa „Słownik” słów: S = {dyskretną, dziś, przeczytały, kochanków, od, studentki, wiadomość} Konstrukcje składniowe: Surowiec: słowa, konstrukcje składniowe. Produkt: wyrażenia (frazy lub zdania).
Konstrukcje składniowe Poprawne: Studentki przeczytały dziś dyskretną wiadomość od kochanków. Dyskretną od kochanków wiadomość studentki dziś przeczytały. Przeczytały dziś od kochanków wiadomość dyskretną studentki. Dewiacyjne: *Studentki wiadomość dziś od dyskretną kochanków przeczytały.
Gramatyka wyrażeń Gramatyka wyrażeń: składnia. Są języki, dla których Gramatyka = Składnia.
Języki wysoce fleksyjne Gramatyka języka polskiego obejmuje: morfologię i składnię. Polski — język wysoce fleksyjny (HIL = highly inflected language). Słowa polskie przeważnie nie są znakami prostymi.
Słowo, forma wyrazowa, leksem Co to znaczy słowo? Ile słów mamy mamy poniższym zdaniu: Mamy mamy, drogie mamy, młodsze od niejednej mamy, ale mamy lubią wasze mamy.
Słowo, forma wyrazowa, leksem Odpowiedzi: 6 - 5 - 4 - 3 - 2 - 1 - 0...
Słowo, forma wyrazowa, leksem Rozróżnienia: a. jednostki konkretnej (fizycznego wystąpienia pewnego obiektu) i jednostki abstrakcyjnej — klasy wystąpień; [ang. token — type] b. jednostki niezinterpretowanej i jednostki zinterpretowanej.
Słowo, forma wyrazowa, leksem słowo — napis między spacjami lub znakami interpunkcyjnymi; forma wyrazowa — słowo z interpretacją gramatyczną (część mowy, ewentualne wartości kategorii fleksyjnych, ewentualnie nazwa jednostki słownikowej); leksem — zbiór form wyrazowych o tym samym odniesieniu do rzeczywistości (i o podobnym kształcie).
Słowo, forma wyrazowa, leksem Słowo mamy reprezentuje 5 różnych form wyrazowych: (a) czasownikową o wartości pierwszej osoby liczby mnogiej czasu teraźniejszego (mamy(1os,mno,ter)) (b) rzeczownikową o wartości dopełniacza liczby pojedynczej (mamy(dop,poj)); (c) rzeczownikowa o wartości mianownika liczby mnogiej (mamy(mian,mno)); (d) rzeczownikowa o wartości biernika liczby mnogiej (mamy(bier,mno) ); (e) rzeczownikowa o wartości wołacza liczby mnogiej (mamy(woł,mno)).
Słowo, forma wyrazowa, leksem Słowa typu mamy — homonimy. Rozwiązywanie homonimii: dehomonimizacja LEKSEM hasło słownikowe. Odgadywanie leksemu: lematyzacja SŁOWNIK (składnik systemu językowego): zbiór form wyrazowych. Zbiór leksemów (a więc — zbiór zbiorów form wyrazowych) — LEKSYKON.
Reguły gramatyki Typ A: STUDENTKA, PRZECZYTAĆ, WIADOMOŚĆ, KOCHANEK Typ B: DZIŚ, DYSKRETNY, OD Typ A.: podzielne słowotwórczo (derywaty). Typ B.: niepodzielne słowotwórczo.
Reguły gramatyki Gramatyka – zbiór reguł, które robią: słowa z morfemów FLEKSJA [ leksemy z leksemów słowotwórstwo ] wyrażenia ze słów i innych wyrażeń SKŁADNIA Słowotwórstwo – słabo gramatyczne.
Przedmiot fleksji Leksemy — zbiory form wyrazowych: STUDENTKA = {studentka,studentki, studentce,..., studentki, studentek, studentkom,...} PRZECZYTAĆ = {przeczytam, przeczytasz, przeczyta,..., przeczytałem, przeczytałam, przeczytałeś,..., przeczytaj, przeczytajmy,..., przeczytałbym, przeczytałabym, przeczytałbyś,..., przeczytać, przeczytawszy}
Przedmiot fleksji WIADOMOŚĆ = {wiadomość, wiadomości, wiadomości,..., wiadomościom,...} KOCHANEK = {kochanek, kochanka, kochankowi,..., kochankowie, kochanków, kochankom,...} DZIŚ = {dziś} DYSKRETNY = {dyskretny, dyskretna, dyskretne, dyskretnego, dyskretnej, dyskretnego, dyskretnemu, dyskretnej, dyskretnemu,..., dyskretni, dyskretne, dyskretnych, dyskretnym,..., dyskretniejszy,..., najdyskretniejszy,...} OD = {od, ode}
Co to jest fleksja? Fleksja Jak zinterpretować słowo tonie, żeby znaleźć w leksykonie odpowiedni leksem? TON TONA TOŃ TONĄĆ Rozpoznać słowo jako formę wyrazową. Podzielić na składniki (temat fleksyjny, końcówka, alternacje). Poszukać w leksykonie.
Ad 1.: To jest w dobrym tonie. Jasio tonie w rzece. Tonie się rozstąpiły przed Świtezianką. Przyglądałem się tonie. Poprzestali na tonie. W złym środowisku Jan pływa, w dobrym tonie. Jasio zgłębia i tonie w rzece.
Ad 2.: Analogicznie jak trop(i)- -e tonie ton(i)- -e tonie- -Ø chuc(i)- -e słom(i)- -e pęknie- -Ø
Ad 3.: tonie Leksem A TON jak TROP TONA jak SŁOMA TOŃ jak CHUĆ TONĄĆ jak PĘKNĄĆ
Dwie fleksje fleksja głębinowa: opis uporządkowania form wyrazowych w leksemy (= szkolny rozbiór gramatyczny); fleksja powierzchniowa: opis struktury morfemowej form wyrazowych i klasyfikacja leksemów odmiennych ze względu na strukturę morfemową jego form (= szkolne „tematy”, „końcówki” i „wymiany głoskowe”).
Leksemy odmienne i nieodmienne Odmienność Leksemy odmienne i nieodmienne STUDENTKA, PRZECZYTAĆ, WIADOMOŚĆ, DYSKRETNY, WIADOMOŚĆ, KOCHANEK DZIŚ A następujące leksemy: EMU, OD, MUZEUM, STEREO, SUPER ???
Jaki mamy pożytek z fleksji? Semantyczny: Fleksja: po co??? Jaki mamy pożytek z fleksji? Semantyczny: Chłopiec śpi. : Chłopcy śpią. Śpię. : Śpisz. : Śpi. Mży. : Mżyło. : Będzie mżyło. ............................
Składniowy: Fleksja: po co??? Ten chłopiec śpi. : Ci chłopcy śpią. Ten chłopiec śpi. : Ta dziewczyna śpi. : To widmo śpi. bez mamy : o mamie : za mamę Semantyczno-składniowy: Mama zabiła gęś. : Mamę zabiła gęś. : Zabił gęś mamą. Pięć mam płacze. : Kuzynka mamy płacze.
Kategorie gramatyczne Kategorie gramatyczne fleksyjne Kategorie fleksyjne: opozycje w zbiorze form wyrazowych wewnątrz leksemu. Wartości kategorii fleksyjnych: człony takich opozycji. Przypadek, Osoba, Czas ale mianownik, trzecia, przyszły Język fleksyjny — taki, w którym fleksja służy składni
Kategorie gramatyczne Osoba 1os 2os 3os poj jem jesz je mno jemy jecie jedzą [poj będę jeść będziesz jeść będzie jeść mno będziemy jeść będziecie jeść będą jeść] poj ________ jedz [niech je] mno jedzmy jedzcie [niech jedzą]
Kategorie gramatyczne Tryb JEŚĆ ZBIĆ ozn jadły zbiły roz jedzmy zbijmy war jedlibyście zbilibyście [bylibyście [bylibyśmy jedli] zbili]
Paradygmat
Klasyfikacja leksemów Części mowy Klasyfikacja leksemów Część mowy — jakaś klasa leksemów. Klasyfikacja leksemów jest niezbędna teoretycznie i praktycznie. Powinna być poprawna logicznie i dobrze zaprojektowana technicznie.
Szkolne rozpoznawanie części mowy: CHŁOPIEC, GÓRA, SMOK, PODJADANIE, SZCZEROŚĆ, SZÓSTKA MAŁY, WIETRZNY, SZCZERY, PALĄCY, PIERWSZY, WINIEN CZYTAĆ, PREZESOWAĆ, PODJADAĆ, PALIĆ, PRZEWYŻSZAĆ, BYĆ DWA, SZEŚĆ, PIERWSZY, DWOJAKI DOBRZE, WYSOKO, WCZORAJ
Jakie to leksemy: ON, COŚ, TEN, TAKI, KIEDY, TYLE TRZEBA, CZAS, NIEPODOBNA ŻE, DOPÓKI, I, ZARÓWNO NA, MIĘDZY, Z POWODU, TEMU BYNAJMNIEJ, OKOŁO, DOŚĆ
Jakie kryteria? Zwykle — luźno semantyczne: Kto? co? Co robi? Jaki? Jak? Gdzie? Kiedy? Ile? Który? Zaimek coś zastępuje
Czasem — składniowe: Typy zaimków Typy liczebników MAŁY JASIO ROBI BŁĘDY W ROZBIORZE GRAMATYCZNYM...
Czy znamy inne części mowy („niepolskie”)?
Rodzajnik Determinator Partykuła przyczasownikowa Słowo posiłkowe Czasownik modalny Przymiotnik przyczasownikowy
Części mowy formalnie(j) Klasyfikacja gramatyczna leksemów polskich Zygmunta Saloniego Mamy leksem LX. Pytamy kolejno: (1) czy jest odmienny; (2) czy odmienia się przez przypadek; (3) czy odmienia się przez osobę; (4) czy odmienia się przez rodzaj; (5) czy odmienia się przez liczbę; (6) czy jest samodzielny składniowo; (7) czy pełni funkcję łączącą; (8) czy ma rząd.
Klasy gramatyczne: RZECZowniki PRZYMiotniki LICZebniki CZASowniki RZECZowniki PRZYMiotniki LICZebniki CZASowniki CZAS NIEWL — czasowniki niewłaściwe PART-PRZYS — partykuło-przysłówki SPOJ — spójniki PRZYIMki WYKrzykniki
Typologia Z. Saloniego a typologia szkolna Nie ma osobnej klasy zaimków. Imiesłowy przymiotnikowe to leksemy przymiotnikowe. Przymiotnikami są również liczebniki porządkowe. Przysłówki odprzymiotnikowe włączamy do leksemów przymiotnikowych.
Fleksja powierzchniowa Paradygmatyka Fleksja powierzchniowa Problem — wypełnienia klatek paradygmatu. Typy form fleksyjnych: formy syntetyczne formy analityczne (w tym: aglutynacyjne). Rozbiór: temat fleksyjny i część gramatyczna. Część gramatyczna: pojedynczy morfem — końcówka sekwencja morfemów (końcówek) osobne słowo (być może, wraz z a. lub b.).
[Formy analityczne: Formy syntetyczne: chłopiec: chłopiec- - dziewczyny: dziewczyn- -y chłopiec: chłopiec- - najmłodszy: naj- -młod- -sz- -y AGL czytałaś: czyta- -ł- -a- -ś AGL czytali: czyta- -l- -i- - [Formy analityczne: AGL (ty)ś ... czytałła: -ś ... czyta- -ł- -a AGL byśmy... czytały: by- -śmy.... czyta- -ł- -y będę czytać: będ- -ę czyta- -ć AGL czytało będzie: czyta- -ł- -o będzie- -]
Problemy fleksji powierzchniowej: a Problemy fleksji powierzchniowej: a. końcówki wspólnofunkcyjne i ich dystrybucja, b. alternacje w tematach i ich dystrybucja, c. wzorce odmiany (klasyfikacja leksemów). Ad a.: -e (drwale, arbitraże, dworzanie, ciemnie, stolice, kasze) -y (starcy, robotnicy, brzuchy, stoły, dziewczyny, myszy) -i (króliki, hetmani, podłogi, kości) -owie (paziowie, widzowie, wrogowie, panowie) -a (akta, pola, okna)
Ad b.: CZYTAĆ: czytam, czytasz,..., czytają,..., czytałem,... WIEŹĆ: wiozę, wieziesz,..., wiozłem,..., wiózł,..., wieźli,..., wieziono,... ROBOTNIK: robotnik,..., robotnikiem, ..., robotnicy,... SZKOŁA: szkoła,..., szkole,..., szkół,... MAŁY: mały,..., mali,..., mniejszego, ...
Uwaga: w polszczyźnie odmieniaja się tematy! Morfonologia droga: drog- + -a drodze: 1. drog- => drodz-, 2. drodz- + -e dróg: 1. drog- => dróg-, 2. dróg- + - kupował: kupowa- + -ł kupujesz: 1. kupowa- => kupuje-, 2. kupuje- + -sz kupując: 1. kupowa- => kupuj-, 2. kupuj- + -ąc ciąć: cią- + -ć tnę: 1. cią- => tn-, 2. tn- + -ę tnął: 1. cią- => tną-, 2. tną- + -ł
Systematyzacja fleksji polskiej — dzieło Jana Tokarskiego. Ad c.: Klasyfikacja fleksyjna leksemów — oparta na regularnych odpowiedniościach typu a. i typu b. generowanie tematów od tematów, dopasowywanie końcówek. Systematyzacja fleksji polskiej — dzieło Jana Tokarskiego.