Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego

Podobne prezentacje


Prezentacja na temat: "Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego"— Zapis prezentacji:

1 Wstęp do językoznawstwa synchronicznego 3003-11A1WS Filologia polska, I rok * 2015/2016
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego Instytut Języka Polskiego UW Konsultacje w pok. 1: wtorek Strona przedmiotu — szukaj pod:

2 Program Przedmiot językoznawstwa.
Cechy definicyjne języka naturalnego.  Struktura języka I: słownik i morfologia. Struktura języka II: składnia.  Formalne rozumienie języka. Lingwistyka formalna i informatyczna. Komunikacja językowa. Podstawy leksykologii. Leksykografia. Słowniki – analiza zawartości, klasyfikacja. Zróżnicowanie języków świata. Podstawy typologii. Typy badań lingwistycznych. Kolokwium.

3 Struktura języka I: słownik morfologia.
Temat 3 Struktura języka I: słownik morfologia.

4 Analiza tekstu Łacina: ARMAVIRUMQUECANOTROIAEQUIPRIMU SABORISITALIAMFATOPROFUGUSLAVIN AQUEVENITLITORA Arma virumque cano, Troiae qui primus ab oris Italiam, fato profugus, Lavinaque venit litora ‘czyny męża-i śpiewam, Troi który pierwszy od wybrzeży do-Italii, losem miotany, lawińskich-i przybył brzegów’

5 Analiza tekstu Angielski: Our Father who art in heaven, hallowed be thy name. Thy kingdom come. Thy will be done on earth, as it is in heaven. Give us this day our daily bread, and forgive us our trespasses, as we forgive those who trespass against us, and lead us not into temptation, but deliver us from evil.

6 Analiza tekstu Koreański: anna-nun ku-eykey pyenci-lul sey-pen-ul ponay-ess-ta. ‘Anna-TOP on-dla list-OB trzy-raz-OB posłać-PRZE-OZN’ Anna to mu trzykrotnie list wysłała.

7 Analiza tekstu Polski: Goście są urzeczeni urodą ich najmłodszych córek.

8 Lematyzacja Szukanie słówek w słowniku Arma virumque cano Troiae qui primus ab oris Italiam fato profugus Lavinaque venit litora virumque => VIR Italiam => ITALIA venit => VENIO

9 Lematyzacja Our Father who art in heaven, hallowed be thy name. Thy kingdom come. Thy will be done on earth, as it is in heaven. Give us this day our daily bread, and forgive us our trespasses, as we forgive those who trespass against us, and lead us not into temptation, but deliver us from evil. art => BE thy => THOU (???) trespasses => TRESPASS

10 Lematyzacja Polski: Goście są urzeczeni urodą ich najmłodszych córek. goście => GOŚĆ są => BYĆ uwiedzeni => UWIEŚĆ // UWIEDZIONY urodą => URODA ich => ONI // ONE najmłodszych => MŁODY córek => CÓRKA

11 Konstrukcje morfologiczne
Pierwszy typ: tonie weselszego hat gefunden czytalibyśmy cats Wielkiejnocy (dawno)ś przyszło will wait waiting psal jsem będę rzygać

12 Konstrukcje morfologiczne
A to: stolarza Wielkanoc actress podomka Sprachwissenschaft skladatele żebyśmy streetworker szkoła średnia po polsku

13 Morfologia gramatyczna i słownikowa
Morfologia w węższym rozumieniu: to, co się dzieje wewnątrz słowa Morfologia gramatyczna = fleksja Morfologia słownikowa = słowotwórstwo (derywacja) Są języki bez morfologii

14 Słowa a znaki proste Wnioski: Słownik nie jest zbiorem słów (wypisanych z tekstu). Słowa są upakowane w leksemy (= hasła słownikowe). Dotyczy to przytłaczającej większości JN w świecie. Słowa nie są najprostszymi znakami.

15 Punkt wyjścia: morfemy
„Słownik” morfemów M = {-ank-, -ą, -czyta-, dyskretn-, dziś, -ent-, -i, -k-, koch-, -ł-, od, ‑ość-, prze-, -y, -ów, stud-, wiadom-, -} Konstrukcje morfologiczne: Surowiec: morfemy, konstrukcje morfologiczne. Produkt: słowa.

16 Konstrukcje morfemowe
Poprawne: studentki przeczytały dyskretną wiadomość kochanków Dewiacyjne: *studentanki *czytałk *dyskretn *przewiadomośćą *kochów

17 Gramatyka słów Gramatyka słów: morfologia. Są języki, dla których Gramatyka = Morfologia

18 Punkt wyjścia: słowa „Słownik” słów: S = {dyskretną, dziś, przeczytały, kochanków, od, studentki, wiadomość} Konstrukcje składniowe: Surowiec: słowa, konstrukcje składniowe. Produkt: wyrażenia (frazy lub zdania).

19 Konstrukcje składniowe
Poprawne: Studentki przeczytały dziś dyskretną wiadomość od kochanków. Dyskretną od kochanków wiadomość studentki dziś przeczytały. Przeczytały dziś od kochanków wiadomość dyskretną studentki. Dewiacyjne: *Studentki wiadomość dziś od dyskretną kochanków przeczytały.

20 Gramatyka wyrażeń Gramatyka wyrażeń: składnia. Są języki, dla których Gramatyka = Składnia.

21 Języki wysoce fleksyjne
Gramatyka języka polskiego obejmuje: morfologię i składnię. Polski — język wysoce fleksyjny (HIL = highly inflected language). Słowa polskie przeważnie nie są znakami prostymi.

22 Słowo, forma wyrazowa, leksem
Co to znaczy słowo? Ile słów mamy mamy poniższym zdaniu: Mamy mamy, drogie mamy, młodsze od niejednej mamy, ale mamy lubią wasze mamy.

23 Słowo, forma wyrazowa, leksem
Odpowiedzi:

24 Słowo, forma wyrazowa, leksem
Rozróżnienia: a. jednostki konkretnej (fizycznego wystąpienia pewnego obiektu) i jednostki abstrakcyjnej — klasy wystąpień; [ang. token — type] b. jednostki niezinterpretowanej i jednostki zinterpretowanej.

25 Słowo, forma wyrazowa, leksem
słowo — napis między spacjami lub znakami interpunkcyjnymi; forma wyrazowa — słowo z interpretacją gramatyczną (część mowy, ewentualne wartości kategorii fleksyjnych, ewentualnie nazwa jednostki słownikowej); leksem — zbiór form wyrazowych o tym samym odniesieniu do rzeczywistości (i o podobnym kształcie).

26 Słowo, forma wyrazowa, leksem
Słowo mamy reprezentuje 5 różnych form wyrazowych: (a) czasownikową o wartości pierwszej osoby liczby mnogiej czasu teraźniejszego (mamy(1os,mno,ter)) (b) rzeczownikową o wartości dopełniacza liczby pojedynczej (mamy(dop,poj)); (c) rzeczownikowa o wartości mianownika liczby mnogiej (mamy(mian,mno)); (d) rzeczownikowa o wartości biernika liczby mnogiej (mamy(bier,mno) ); (e) rzeczownikowa o wartości wołacza liczby mnogiej (mamy(woł,mno)).

27 Słowo, forma wyrazowa, leksem
Słowa typu mamy — homonimy. Rozwiązywanie homonimii: dehomonimizacja LEKSEM  hasło słownikowe. Odgadywanie leksemu: lematyzacja SŁOWNIK (składnik systemu językowego): zbiór form wyrazowych. Zbiór leksemów (a więc — zbiór zbiorów form wyrazowych) — LEKSYKON.

28 Reguły gramatyki Typ A: STUDENTKA, PRZECZYTAĆ, WIADOMOŚĆ, KOCHANEK Typ B: DZIŚ, DYSKRETNY, OD Typ A.: podzielne słowotwórczo (derywaty). Typ B.: niepodzielne słowotwórczo.

29 Reguły gramatyki Gramatyka – zbiór reguł, które robią: słowa z morfemów FLEKSJA [ leksemy z leksemów słowotwórstwo ] wyrażenia ze słów i innych wyrażeń SKŁADNIA Słowotwórstwo – słabo gramatyczne.

30 Leksemy — zbiory form wyrazowych:
Przedmiot fleksji Leksemy — zbiory form wyrazowych:  STUDENTKA = {studentka,studentki, studentce,..., studentki, studentek, studentkom,...} PRZECZYTAĆ = {przeczytam, przeczytasz, przeczyta,..., przeczytałem, przeczytałam, przeczytałeś,..., przeczytaj, przeczytajmy,..., przeczytałbym, przeczytałabym, przeczytałbyś,..., przeczytać, przeczytawszy}

31 Przedmiot fleksji WIADOMOŚĆ = {wiadomość, wiadomości, wiadomości,..., wiadomościom,...} KOCHANEK = {kochanek, kochanka, kochankowi,..., kochankowie, kochanków, kochankom,...} DZIŚ = {dziś} DYSKRETNY = {dyskretny, dyskretna, dyskretne, dyskretnego, dyskretnej, dyskretnego, dyskretnemu, dyskretnej, dyskretnemu,..., dyskretni, dyskretne, dyskretnych, dyskretnym,..., dyskretniejszy,..., najdyskretniejszy,...} OD = {od, ode}

32 Co to jest fleksja? Fleksja
Jak zinterpretować słowo tonie, żeby znaleźć w leksykonie odpowiedni leksem? TON TONA TONIA TOŃ TONĄĆ Rozpoznać słowo jako formę wyrazową. Podzielić na składniki (temat fleksyjny, końcówka, alternacje). Poszukać w leksykonie.

33 Ad 1.: To jest w dobrym tonie. Jasio tonie w rzece.
Tonie się rozstąpiły przed Świtezianką. Przyglądałem się tonie. Poprzestali na tonie. Obie Tonie toną. W złym środowisku Jan pływa, w dobrym tonie. Jasio zgłębia i tonie w rzece.

34 Ad 2.: Analogicznie jak trop(i)- -e tonie ton(i)- -e tonie- -Ø
chuc(i)- -e słom(i)- -e pęknie- -Ø

35 Ad 3.: tonie  Leksem A TON jak TROP TONA jak SŁOMA TOŃ jak CHUĆ
TONĄĆ jak PĘKNĄĆ TONIA jak KANIA

36 Dwie fleksje fleksja głębinowa: opis uporządkowania form wyrazowych w leksemy (= szkolny rozbiór gramatyczny); fleksja powierzchniowa: opis struktury morfemowej form wyrazowych i klasyfikacja leksemów odmiennych ze względu na strukturę morfemową jego form (= szkolne „tematy”, „końcówki” i „wymiany głoskowe”).

37 Leksemy odmienne i nieodmienne
Odmienność Leksemy odmienne i nieodmienne STUDENTKA, PRZECZYTAĆ, WIADOMOŚĆ, DYSKRETNY, WIADOMOŚĆ, KOCHANEK DZIŚ A następujące leksemy: EMU, OD, MUZEUM, STEREO, SUPER ???

38 Jaki mamy pożytek z fleksji? Semantyczny:
Fleksja: po co??? Jaki mamy pożytek z fleksji? Semantyczny: Chłopiec śpi. : Chłopcy śpią. Śpię. : Śpisz. : Śpi. Mży. : Mżyło. : Będzie mżyło.

39 Składniowy: Fleksja: po co??? Ten chłopiec śpi. : Ci chłopcy śpią.
Ten chłopiec śpi. : Ta dziewczyna śpi. : To widmo śpi. bez mamy : o mamie : za mamę Semantyczno-składniowy: Mama zabiła gęś. : Mamę zabiła gęś. : Zabił gęś mamą. Pięć mam płacze. : Kuzynka mamy płacze.

40 Kategorie gramatyczne
Kategorie gramatyczne fleksyjne   Kategorie fleksyjne: opozycje w zbiorze form wyrazowych wewnątrz leksemu. Wartości kategorii fleksyjnych: człony takich opozycji. Przypadek, Osoba, Czas ale mianownik, trzecia, przyszły Język fleksyjny — taki, w którym fleksja służy składni

41 Kategorie gramatyczne
Osoba 1os 2os 3os poj jem jesz je mno jemy jecie jedzą [poj będę jeść będziesz jeść będzie jeść mno będziemy jeść będziecie jeść będą jeść] poj ________ jedz [niech je] mno jedzmy jedzcie [niech jedzą]

42 Kategorie gramatyczne
Tryb JEŚĆ ZBIĆ ozn jadły zbiły roz jedzmy zbijmy war jedlibyście zbilibyście [bylibyście [bylibyśmy jedli] zbili]

43 Paradygmat

44

45

46 Klasyfikacja leksemów
Części mowy Klasyfikacja leksemów Część mowy — jakaś klasa leksemów. Klasyfikacja leksemów jest niezbędna teoretycznie i praktycznie. Powinna być poprawna logicznie i dobrze zaprojektowana technicznie.

47 Szkolne rozpoznawanie części mowy:
CHŁOPIEC, GÓRA, SMOK, PODJADANIE, SZCZEROŚĆ, SZÓSTKA MAŁY, WIETRZNY, SZCZERY, PALĄCY, PIERWSZY, WINIEN CZYTAĆ, PREZESOWAĆ, PODJADAĆ, PALIĆ, PRZEWYŻSZAĆ, BYĆ DWA, SZEŚĆ, PIERWSZY, DWOJAKI DOBRZE, WYSOKO, WCZORAJ

48 Jakie to leksemy: ON, COŚ, TEN, TAKI, KIEDY, TYLE
TRZEBA, CZAS, NIEPODOBNA ŻE, DOPÓKI, I, ZARÓWNO NA, MIĘDZY, Z POWODU, TEMU BYNAJMNIEJ, OKOŁO, DOŚĆ

49 Jakie kryteria? Zwykle — luźno semantyczne: Kto? co? Co robi? Jaki?
Jak? Gdzie? Kiedy? Ile? Który? Zaimek coś zastępuje

50 Czasem — składniowe: Typy zaimków Typy liczebników MAŁY JASIO ROBI BŁĘDY W ROZBIORZE GRAMATYCZNYM...

51 Czy znamy inne części mowy („niepolskie”)?

52 Rodzajnik Determinator Partykuła przyczasownikowa Słowo posiłkowe Czasownik modalny Przymiotnik przyczasownikowy

53 Części mowy formalnie(j)
Klasyfikacja gramatyczna leksemów polskich Zygmunta Saloniego Mamy leksem LX. Pytamy kolejno:   (1) czy jest odmienny; (2) czy odmienia się przez przypadek; (3) czy odmienia się przez osobę; (4) czy odmienia się przez rodzaj; (5) czy odmienia się przez liczbę; (6) czy jest samodzielny składniowo; (7) czy pełni funkcję łączącą; (8) czy ma rząd.

54

55 Klasy gramatyczne: RZECZowniki PRZYMiotniki LICZebniki CZASowniki
RZECZowniki PRZYMiotniki LICZebniki CZASowniki CZAS NIEWL — czasowniki niewłaściwe PART-PRZYS — partykuło-przysłówki SPOJ — spójniki PRZYIMki WYKrzykniki

56 Typologia Z. Saloniego a typologia szkolna
Nie ma osobnej klasy zaimków. Imiesłowy przymiotnikowe to leksemy przymiotnikowe. Przymiotnikami są również liczebniki porządkowe. Przysłówki odprzymiotnikowe włączamy do leksemów przymiotnikowych.

57 Fleksja powierzchniowa
Paradygmatyka Fleksja powierzchniowa Problem — wypełnienia klatek paradygmatu. Typy form fleksyjnych: formy syntetyczne formy analityczne (w tym: aglutynacyjne).  Rozbiór: temat fleksyjny i część gramatyczna. Część gramatyczna: pojedynczy morfem — końcówka sekwencja morfemów (końcówek) osobne słowo (być może, wraz z a. lub b.).

58 [Formy analityczne: Formy syntetyczne: chłopiec: chłopiec- -
dziewczyny: dziewczyn- -y chłopiec: chłopiec- - najmłodszy: naj- -młod- -sz- -y AGL czytałaś: czyta- -ł- -a- -ś AGL czytali: czyta- -l- -i- - [Formy analityczne: AGL (ty)ś ... czytałła: -ś ... czyta- -ł- -a AGL byśmy... czytały: by- -śmy.... czyta- -ł- -y będę czytać: będ- -ę czyta- -ć AGL czytało będzie: czyta- -ł- -o będzie- -]

59 Problemy fleksji powierzchniowej: a
Problemy fleksji powierzchniowej: a. końcówki wspólnofunkcyjne i ich dystrybucja, b. alternacje w tematach i ich dystrybucja, c. wzorce odmiany (klasyfikacja leksemów). Ad a.:  -e (drwale, arbitraże, dworzanie, ciemnie, stolice, kasze)  -y (starcy, robotnicy, brzuchy, stoły, dziewczyny, myszy)  -i (króliki, hetmani, podłogi, kości)  -owie (paziowie, widzowie, wrogowie, panowie)  -a (akta, pola, okna)

60 Ad b.: CZYTAĆ: czytam, czytasz,..., czytają,..., czytałem,...
WIEŹĆ: wiozę, wieziesz,..., wiozłem,..., wiózł,..., wieźli,..., wieziono,... ROBOTNIK: robotnik,..., robotnikiem, ..., robotnicy,... SZKOŁA: szkoła,..., szkole,..., szkół,... MAŁY: mały,..., mali,..., mniejszego, ...

61 Uwaga: w polszczyźnie odmieniaja się tematy! Morfonologia
droga: drog- + -a drodze: 1. drog- => drodz-, 2. drodz- + -e dróg: 1. drog- => dróg-, 2. dróg- + - kupował: kupowa- + -ł kupujesz: 1. kupowa- => kupuje-, 2. kupuje- + -sz kupując: 1. kupowa- => kupuj-, 2. kupuj- + -ąc ciąć: cią- + -ć tnę: 1. cią- => tn-, 2. tn- + -ę tnął: 1. cią- => tną-, 2. tną- + -ł

62 Systematyzacja fleksji polskiej — dzieło Jana Tokarskiego.
Ad c.: Klasyfikacja fleksyjna leksemów — oparta na regularnych odpowiedniościach typu a. i typu b. generowanie tematów od tematów, dopasowywanie końcówek. Systematyzacja fleksji polskiej — dzieło Jana Tokarskiego.

63 Grupy koniugacyjne Jana Tokarskiego
(por. SJP Dor.: lxiii-lxxiv, Tokarski (1973: )): 1: CZYTAĆ czytać, ~am, ~asz, ~ają, ~aj, ~ał, ~ali, ~ano 2: UMIEĆ umieć, ~em, ~esz, ~eją, ~ej, ~ał, ~eli, ~ano 3: SZALEĆ szaleć, ~eję, ~ejesz, ~eją, ~ej, ~ał, ~eli, ~ano 4: KUPOWAĆ kupować, ~uję, ~ujesz, ~ują, ~uj, ~ował, ~owa­li, ~owano 5a: CIĄGNĄĆ ciągnąć, ~nę, ~niesz, ~ną, ~nij, ~nął, ~nęli, ~nięto 5b: SUNĄĆ sunąć, ~nę, ~niesz, ~ną, ~ń, ~nął, ~nęli, ~nięto 5c: CHUDNĄĆ chudnąć, ~nę, ~niesz, ~ną, ~nij, ~ł, ~li, ~nięto 6a: MÓWIĆ mówić, ~ię, ~isz, ~ią, ~, ~ił, ~ili, ~iono 6b: WARZYĆ warzyć, ~ę, ~ysz, ~ą, ~, ~ył, ~yli, ~ono

64 7a: MYŚLEĆ myśleć, ~ę, ~isz, ~ą, ~, ~ał, ~eli, ~ano
7b: SŁYSZEĆ słyszeć, ~ę, ~ysz, ~ą, ~, ~ał, ~eli, ~ano 8a: PISYWAĆ pisywać, ~uję, ~ujesz, ~ują, ~uj, ~ywał, ~ywa­li, ~ywano 8b: OPUKIWAĆ opukiwać, ~uję, ~ujesz, ~ują, ~uj, ~iwał, ~iwali, ~iwano 9: PISAĆ pisać, ~ę, ~esz, ~ą, ~, ~ał, ~ali, ~ano 10a: ŻYĆ żyć, ~ję, ~jesz, ~ją, ~j, ~ł, ~li, ~to 10b: GRZAĆ grzać, ~eję, ~ejesz, ~eją, ~ej, ~ał, ~eli, ~ano 10c: DĄĆ dąć, ~mę, ~miesz, ~mą, ~mij, ~ął, ~ęli, ~ęto 11: NIEŚĆ nieść, ~ę, ~iesz, ~ą, ~, ~ł, ~li, ~iono

65 Mnemotechnika m Drwal (1) do kuśnierza (2) rzekł: – Ten koniak (3) drogi Na stół (4) tu postaw (tak czynią mieszczanie (5)...), ż A ciemni (1) niszę (2) rozsuń do podłogi (3): Damę (4) mam przyjąć chęć (5), gdy noc (6) nastanie. n Szczęściem (1) na udka (2) wrażliwe mam ciało (3). Dziewczę (4) w ramiona (5) fatum (6) mi zesłało!

66 Zadania domowe Czym się różnią fleksyjnie: HETMAN – TARTAN
TONIA – KANIA DZIECKO – PŁUCKO Poszukaj ich opisu w słownikach. Co to jest idiosynkrazja w lingwistyce? Jaka to klasa gramatyczna (= część mowy według Saloniego)? KTOKOLWIEK, WOLNO, SIÓDMY, DUŻO, JA


Pobierz ppt "Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego"

Podobne prezentacje


Reklamy Google