Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

ZDYSCYPLINOWANY OPIS JĘZYKÓW NATURALNYCH I KORPUSY TEKSTÓW Proseminarium doktoranckie 2013/2014, semestr letni Prof. dr hab. Marek Świdziński Zakład Językoznawstwa.

Podobne prezentacje


Prezentacja na temat: "ZDYSCYPLINOWANY OPIS JĘZYKÓW NATURALNYCH I KORPUSY TEKSTÓW Proseminarium doktoranckie 2013/2014, semestr letni Prof. dr hab. Marek Świdziński Zakład Językoznawstwa."— Zapis prezentacji:

1 ZDYSCYPLINOWANY OPIS JĘZYKÓW NATURALNYCH I KORPUSY TEKSTÓW Proseminarium doktoranckie 2013/2014, semestr letni Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego Instytut Języka Polskiego UW wt , pok. 1 Konsultacje: wt , pok. 1 Strona internetowa:

2 Spotkanie 4 Słownik gramatyczny języka polskiego

3 SGJP 3

4 4 SGJP

5 Historia i poprzednicy 5 Jan Tokarski, Czasowniki polskie, Warszawa Jan Tokarski, Fleksja polska, Warszawa 19 Słownik Języka polskiego PAN ( ) (SJPDor.) Andrej Zaliznyak, Grammatičeskij slovar russkogo yazyka (Moskva 1967 i późniejsze wydania) Włodzimierz Gruszczyński, Fleksja rzeczowników we współczesnym języku polskim. Opis i próba jego zastosowania w słowniku. Warszawa Jan Tokarski, Schematyczny indeks a tergo polskich form wyrazowych. Opracowanie i redakcja Zygmunt Saloni, Warszawa Zygmunt Saloni, Czasownik polski, Warszawa 2003.

6 Jan Tokarski (Wikipedia) 6 Jan Tokarski (ur. 24 marca 1909 w Ortelu Królewskim, zm. 16 stycznia 1982 w Warszawie) – językoznawca polski, profesor Uniwersytetu Warszawskiego, współpracownik Witolda Doroszewskiego, autor i współautor wielu publikacji z dziedziny fleksji, słowotwórstwa, dialektologii i metodyki nauczania gramatyki oraz słowników.24 marca1909Ortelu Królewskim16 stycznia1982Warszawiejęzykoznawca Uniwersytetu WarszawskiegoWitolda Doroszewskiego Jan Tokarski jest twórcą powszechnie używanej w językoznawstwie i informatyce klasyfikacji polskiej fleksji (odmiany wyrazów).fleksji

7 Jan Tokarski (Wikipedia) 7 Niektóre publikacje: Czasowniki polskie (1951) Gwara Serpelic. Fonetyka. Fleksja (1964) Gramatyka w szkole. Podstawowe zagadnienia metodyki (1966) Fleksja polska (1973) Słownictwo (teoria wyrazu)(1971) Traktat o ortografii polskiej (1979) Zarys leksykologii i leksykografii polskiej - wspólnie ze Stanisławem Kanią (1984) Słowniki: Słownik wyrazów obcych - red. (1971) Schematyczny indeks a tergo polskich form wyrazowych - opr. i red. Zygmunt Saloni (1993)Zygmunt Saloni

8 Jan Tokarski 8 Pierwszy strukturalista wśród gramatyków polskich. Metodologia: opis jawny i wyczerpujący, gramatyka i słownik – dwa moduły opisu, cechy gramatyczne wchodzą do słownika, odrzucenie segmentacji morfemowej: forma wyrazowa jako napis. Pionier lingwistyki informatycznej : notacja Tokarskiego.

9 Fleksja jako fragment opisu gramatycznego fleksja głębinowa: opis uporządkowania form wyrazowych w leksemy (= szkolny rozbiór gramatyczny); fleksja powierzchniowa: opis struktury morfemowej form wyrazowych i klasyfikacja leksemów odmiennych ze względu na strukturę morfemową jego form (= szkolne tematy, końcówki i wymiany głoskowe). 9 Dwa poziomy fleksji

10 Klasyfikacja gramatyczna leksemów polskich Zygmunta Saloniego Mamy leksem LX. Pytamy kolejno: (1) czy jest odmienny; (2) czy odmienia się przez przypadek; (3) czy odmienia się przez osobę; (4) czy odmienia się przez rodzaj; (5) czy odmienia się przez liczbę; (6) czy jest samodzielny składniowo; (7) czy pełni funkcję łączącą; (8) czy ma rząd. 10 Typologia leksemów: części mowy

11 11 Typologia leksemów: części mowy

12 Problem wypełnienie klatek paradygmatu. Czyli: - jak wyglądają formy wyrazowe danego leksemu; - jak utworzyć dana formę na podstawie innej formy? Typy form fleksyjnych: formy syntetyczne formy analityczne (w tym: aglutynacyjne). Fleksja powierzchniowa

13 Rozbiór: temat fleksyjny (= część wspólna) i część gramatyczna (= część różna). Część gramatyczna: a. pojedynczy morfem końcówka b. sekwencja morfemów (końcówek) c. osobne słowo (być może, wraz z a. lub b.). Fleksja powierzchniowa

14 Formy syntetyczne: dziewczyny: dziewczyn- -y chłopiec: chłopiec- - najmłodszy: naj- -młod- -sz- -y AGL czytałaś: czyta- -ł- -a- -ś AGL czytali: czyta- -l- -i- - [Formy analityczne: AGL (ty)ś... czytała: -ś... czyta- -ł- -a AGL byśmy... czytały: by- -śmy.... czyta- -ł- -y będę czytać: będ- -ę czyta- -ć AGL czytało będzie: czyta- -ł- -o będzie- - ] Fleksja powierzchniowa

15 15 Problemy: a. końcówki wspólnofunkcyjne i ich dystrybucja, b. alternacje w tematach i ich dystrybucja, c. wzorce odmiany (klasyfikacja leksemów). Ad a.: (mianownik liczby mnogiej) -e (drwale, arbitraże, dworzanie, ciemnie, stolice, kasze) -y (starcy, robotnicy, brzuchy, stoły, dziewczyny, myszy) -i (króliki, hetmani, podłogi, kości) -owie (paziowie, widzowie, wrogowie, panowie) -a (akta, pola, okna) Fleksja powierzchniowa

16 Ad b.:(alternacje w temacie) CZYTAĆ:czytam, czytasz,..., czytają,..., czytałem,... WIEŹĆ: wiozę, wieziesz,..., wiozłem,..., wiózł,..., wieźli,..., wieziono,... ROBOTNIK: robotnik,..., robotnikiem,..., robotnicy,... SZKOŁA:szkoła,..., szkole,..., szkół,... MAŁY: mały,..., mali,..., mniejszego,... Fleksja powierzchniowa

17 17 Uwaga: w polszczyźnie odmieniaja się tematy! Morfonologia droga: drog- + -a drodze: 1. drog- => drodz-, 2. drodz- + -e dróg: 1. drog- => dróg-, 2. dróg- + - kupował: kupowa- + -ł kupujesz: 1. kupowa- => kupuje-, 2. kupuje- + -sz kupując: 1. kupowa- => kupuj-, 2. kupuj- + -ąc ciąć: cią- + -ć tnę: 1. cią- => tn-, 2. tn- + -ę tnął: 1. cią- => tną-, 2. tną- + -ł Fleksja powierzchniowa

18 Ad c.:(wzorce odmiany) Klasyfikacja fleksyjna leksemów oparta na regularnych odpowiedniościach typu a. i typu b.: generowanie tematów od tematów, dopasowywanie końcówek. Systematyzacja fleksji polskiej dzieło Jana Tokarskiego. Fleksja powierzchniowa

19 Trzy techniki: wzorce paradygmatyczne + odsyłacze (kody) reguły przekształcania form: formy bazowe paradygmat z wypełnieniami dla każdego leksemu Opis słownikowy fleksji

20 20 Grupy deklinacyjne Jana Tokarskiego Rodzaj męski m1 LIŚĆ: liść, liścia, liściem, liściu, liście, liści; m2 ŻOŁNIERZ: żołnierz, żołnierza, żołnierzem, żołnierzu, żołnierze, żołnierzy; m3 BYK: byk, byka, bykiem, byku, byki, byków; m4 KOT: kot, kota, kotem, kocie, koty, kotów; m5 MIESZCZANIN: mieszczanin, mieszczanina, mieszczaninem, mieszczaninie, mieszczanie, mieszczan.

21 21 Grupy deklinacyjne Jana Tokarskiego Rodzaj żeński ż1 ZIEMIA: ziemia, ziemi, ziemią, ziemi, ziemie, ziem; ż2TĘCZA: tęcza, tęczy, tęczą, tęczy, tęcze, tęcz; ż3ŁĄKA: łąka, łąki, łąką, łące, łąki, łąk; ż4KOBIETA: kobieta, kobiety, kobietą, kobiecie, kobiety, kobiet; ż5NIĆ: nić, nici, nicią, nici, nici, nici; ż6MYSZ: mysz, myszy, myszą, myszy, myszy.

22 22 Grupy deklinacyjne Jana Tokarskiego Rodzaj nijaki n1 ZDJĘCIE: zdjęcie, zdjęcia, zdjęciem, zdjęciu, zdjęcia, zdjęć; n2ŁYKO: łyko, łyka, łykiem, łyku, łyka, łyk; n3OKNO: okno, okna, oknem, oknie, okna, okien; n4PISKLĘ: pisklę, pisklęcia, pisklęciem, pisklęciu, pisklęta, piskląt; n5IMIĘ: imię, imienia, imieniem, imieniu, imiona, imion; n6MUZEUM: muzeum, muzeum, muzeum, muzeum, muzea, muzeów.

23 23 Grupy koniugacyjne Jana Tokarskiego Formy podstawowe: bezokolicznik, pierwsza i druga osoba liczby pojedynczej, trzecia osoba liczby mnogiej czasu teraźniejszego lub przyszłego syntetycznego, druga osoba liczby pojedynczej trybu rozkazującego, trzecia osoba liczby pojedynczej rodzaju męskiego i trzecia osoba liczby mnogiej rodzaju męskoosobowego czasu przeszłego oraz bezosobnik.

24 24 Grupy koniugacyjne Jana Tokarskiego (por. SJP Dor.: lxiii-lxxiv, Tokarski (1973: )): 1:CZYTAĆczytać, ~am, ~asz, ~ają, ~aj, ~ał, ~ali, ~ano 2:UMIEĆumieć, ~em, ~esz, ~eją, ~ej, ~ał, ~eli, ~ano 3:SZALEĆszaleć, ~eję, ~ejesz, ~eją, ~ej, ~ał, ~eli, ~ano 4:KUPOWAĆkupować, ~uję, ~ujesz, ~ują, ~uj, ~ował, ~owa­li, ~owano 5a: CIĄGNĄĆciągnąć, ~nę, ~niesz, ~ną, ~nij, ~nął, ~nęli, ~nięto 5b: SUNĄĆsunąć, ~nę, ~niesz, ~ną, ~ń, ~nął, ~nęli, ~nięto 5c: CHUDNĄĆchudnąć, ~nę, ~niesz, ~ną, ~nij, ~ł, ~li, ~nięto 6a: MÓWIĆmówić, ~ię, ~isz, ~ią, ~, ~ił, ~ili, ~iono 6b: WARZYĆwarzyć, ~ę, ~ysz, ~ą, ~, ~ył, ~yli, ~ono

25 25 Grupy koniugacyjne Jana Tokarskiego 7a: MYŚLEĆ myśleć, ~ę, ~isz, ~ą, ~, ~ał, ~eli, ~ano 7b: SŁYSZEĆ słyszeć, ~ę, ~ysz, ~ą, ~, ~ał, ~eli, ~ano 8a: PISYWAĆ pisywać, ~uję, ~ujesz, ~ują, ~uj, ~ywał, ~ywa­li, ~ywano 8b: OPUKIWAĆ opukiwać, ~uję, ~ujesz, ~ują, ~uj, ~iwał, ~iwali, ~iwano 9: PISAĆ pisać, ~ę, ~esz, ~ą, ~, ~ał, ~ali, ~ano 10a: ŻYĆ żyć, ~ję, ~jesz, ~ją, ~j, ~ł, ~li, ~to 10b: GRZAĆ grzać, ~eję, ~ejesz, ~eją, ~ej, ~ał, ~eli, ~ano 10c: DĄĆ dąć, ~mę, ~miesz, ~mą, ~mij, ~ął, ~ęli, ~ęto 11: NIEŚĆ nieść, ~ę, ~iesz, ~ą, ~, ~ł, ~li, ~iono

26 26 Czasownik polski

27 27 Czasownik polski

28 28 SGJP Zasób: 250 tys. leksemów. Źródło: SJP Dor., korpusy. Hasła: leksemy, skróty, afiksy. Informacja slownikowa: fleksyjna, podstawowa słowotwórcza, podstawowa skladniowa. Leksemy nieodmienne (poza spójnikami, partykułami, przyimkami, przysłówkami): o dopowiedzenia (TAK, AJUŚCI, OK). o tzw. zaimki przysłowne: TAM, KIEDYŚ, NIGDY. o przysłówki lczebnikowe: SAMOWTÓR. o oretatory trybu:NIECH, BYLE, o operatory deklaratywności: NIE, ALBO, NUŻ, NO, o operatory adnumeratywne: NIESPEŁNA.


Pobierz ppt "ZDYSCYPLINOWANY OPIS JĘZYKÓW NATURALNYCH I KORPUSY TEKSTÓW Proseminarium doktoranckie 2013/2014, semestr letni Prof. dr hab. Marek Świdziński Zakład Językoznawstwa."

Podobne prezentacje


Reklamy Google