ZDYSCYPLINOWANY OPIS JĘZYKÓW NATURALNYCH I KORPUSY TEKSTÓW Proseminarium doktoranckie 2013/2014, semestr letni Prof. dr hab. Marek Świdziński Zakład.

Slides:



Advertisements
Podobne prezentacje
I część 1.
Advertisements

Lingwistyka Matematyczna
Klasyfikacja roczna w roku szkolnym 2012/2013
Matematyka w życiu codziennym
Włodzimierz Puchalski
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
O odmiennych i nieodmiennych częściach mowy
Materiały pochodzą z Platformy Edukacyjnej Portalu
Zagadnienia leksykalne, fleksja
Wykorzystanie Platformy Moodle w dydaktyce języków obcych
KONKURS WIEDZY O SZTUCE
JĘZYK POLSKI KLASY IV - VI
Definicja rzeczownika
Wyższa Szkoła Informatyki i Zarządzania
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
1. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
2. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
1. Wprowadzenie do nauki o języku A1NJ
3. Wprowadzenie do nauki o języku A1NJ
4. Wprowadzenie do nauki o języku A1NJ
5. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
CZASOWNIK- odmienna część mowy. Jego odmiana nazywa się KONIUGACJĄ
OPIS PRZEDMIOTU (ZAJĘĆ)
Odmienne i nieodmienne części mowy
Projekt LOG-IN Wspólne działania szkoleniowe z zakresu zastosowania nowych mediów i technologii w nauczaniu języków obcych ukierunkowane na tworzenie innowacyjnych.
CZĘŚCI MOWY Lekcja gramatyki Szymon Szymura Klasa VI a klik.
Mój plan dnia czynności codzienne.
ENCYKLOPEDIE I SŁOWNIKI
Kalendarz 2011 Real Madryt Autor: Bartosz Trzciński.
KALENDARZ 2011r. Autor: Alicja Chałupka klasa III a.
Imienia Marii Sk ł odowskiej-Curie.
Powtórka z polskiego dla klas 5-6
Łączna długość pielgrzymkowych dróg Jana Pawła II wynosi ok
Nauczanie osób niesłyszących języka obcego
Przygotowali uczniowie kl.VIb
UTWORZENIE SPÓJNEJ ANTYTERRORYSTYCZNEJ STRATEGII INFORMACYJNEJ
Lekcja 13 Strona 15. Lekcja 13 Strona 16 Lekcja 13 Strona 17 Vertical primary and secondary Tesla coil Jacobs ladder.
Kalendarz 2011r. styczeń pn wt śr czw pt sb nd
11. Wiedza o języku Studia Podyplomowe „Polski Język Migowy” 2013/2014
NIEODMIENNE CZĘŚCI MOWY
ODMIENNE CZĘŚCI MOWY Aneta Woźniak.
CZĘŚCI MOWY Autor Anita Rejch.
Temat: Utrwalenie wiadomości o czasowniku.
MODU Ł II- KUPUJESZ? Dlaczego chcesz kupi ć ? (25) – Czy jeste ś gotowy na zakup? Sk ą d wiesz na co Ci ę sta ć ? Kryteria wyboru- matryca.
5. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
Opracowała: mgr Joanna Pastuszka Szkoła Podstawowa w LipowcuKościelnym
Emilia Korycińska klasa 5a
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
Projekt Comenius Nie tylko budowa ć mosty, lecz tak ż e z nich korzysta ć - zawody i ich ś rodowiska pracy W projekcie uczestniczą.
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
GRAMATYKA ŁATWA I PRZYJEMNA.
Encyklopedie i słowniki jako podstawowe źródło informacji Oprac
Kalendarz 2020.
ZDYSCYPLINOWANY OPIS JĘZYKÓW NATURALNYCH Proseminarium doktoranckie 2014/2015, semestr letni Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego.
Spotkanie 5 Poliqarp.. Znakowanie – tagging Narzędzie do znakowania – tager Znakowanie: przypisywanie jednostkom tekstowym jakichś kodów (tagów): 1. lokalizacja.
10. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
9. Wiedza o języku Studia Podyplomowe „Polski Język Migowy” 2013/2014
Spotkanie 5 Poliqarp.. Znakowanie – tagging Narzędzie do znakowania – tager Znakowanie: przypisywanie jednostkom tekstowym jakichś kodów (tagów): 1. lokalizacja.
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
Części mowy Edyta Sawicka.
Wstęp do językoznawstwa synchronicznego A1WS Filologia polska, I rok * 2015/2016 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego.
Lingwistyka korpusowa. korpus m IV, D. -u, Ms. ~sie; lm M. -y 1. «ciało człowieka lub zwierzęcia prócz kończyn i głowy; tułów» 2. => garmond 3. archit.
Kształtowanie kompetencji komunikacyjnych wiedza o języku w szkole podstawowej i gimnazjum.
CZASOWNIK- odmienna część mowy. Jego odmiana nazywa się KONIUGACJĄ
KANCLERZ PRZYMIOTNIK Wykonali:
Rozwój mowy dziecka.
Zapis prezentacji:

ZDYSCYPLINOWANY OPIS JĘZYKÓW NATURALNYCH I KORPUSY TEKSTÓW Proseminarium doktoranckie 2013/2014, semestr letni Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego Instytut Języka Polskiego UW e-mail: m.r.swidzinski@uw.edu.pl Konsultacje: wt 15.30-16.30, pok. 1 Strona internetowa: www.mswidz.republika.pl

Słownik gramatyczny języka polskiego Spotkanie 4 Słownik gramatyczny języka polskiego

SGJP

SGJP 4

Historia i poprzednicy Jan Tokarski, Czasowniki polskie, Warszawa 1951. Jan Tokarski, Fleksja polska, Warszawa 19 Słownik Języka polskiego PAN (1958-1970) (SJPDor.) Andrej Zaliznyak, Grammatičeskij slovar’ russkogo yazyka (Moskva 1967 i późniejsze wydania) Włodzimierz Gruszczyński, Fleksja rzeczowników we współczesnym języku polskim. Opis i próba jego zastosowania w słowniku. Warszawa 1986. Jan Tokarski, Schematyczny indeks a tergo polskich form wyrazowych. Opracowanie i redakcja Zygmunt Saloni, Warszawa 1993. Zygmunt Saloni, Czasownik polski, Warszawa 2003.

Jan Tokarski (Wikipedia) Jan Tokarski (ur. 24 marca 1909 w Ortelu Królewskim, zm. 16 stycznia 1982 w Warszawie) – językoznawca polski, profesor Uniwersytetu Warszawskiego, współpracownik Witolda Doroszewskiego, autor i współautor wielu publikacji z dziedziny fleksji, słowotwórstwa, dialektologii i metodyki nauczania gramatyki oraz słowników. Jan Tokarski jest twórcą powszechnie używanej w językoznawstwie i informatyce klasyfikacji polskiej fleksji (odmiany wyrazów).

Jan Tokarski (Wikipedia) Niektóre publikacje: Czasowniki polskie (1951) Gwara Serpelic. Fonetyka. Fleksja (1964) Gramatyka w szkole. Podstawowe zagadnienia metodyki (1966) Fleksja polska (1973) Słownictwo (teoria wyrazu)(1971) Traktat o ortografii polskiej (1979) Zarys leksykologii i leksykografii polskiej - wspólnie ze Stanisławem Kanią (1984) Słowniki: Słownik wyrazów obcych - red. (1971) Schematyczny indeks a tergo polskich form wyrazowych - opr. i red. Zygmunt Saloni (1993)

Jan Tokarski Pierwszy strukturalista wśród gramatyków polskich. Metodologia: opis jawny i wyczerpujący, gramatyka i słownik – dwa moduły opisu, cechy gramatyczne wchodzą do słownika, odrzucenie segmentacji morfemowej: forma wyrazowa jako napis. Pionier lingwistyki informatycznej: notacja Tokarskiego.

Dwa poziomy fleksji Fleksja jako fragment opisu gramatycznego fleksja głębinowa: opis uporządkowania form wyrazowych w leksemy (= szkolny rozbiór gramatyczny); fleksja powierzchniowa: opis struktury morfemowej form wyrazowych i klasyfikacja leksemów odmiennych ze względu na strukturę morfemową jego form (= szkolne „tematy”, „końcówki” i „wymiany głoskowe”).

Typologia leksemów: części mowy Klasyfikacja gramatyczna leksemów polskich Zygmunta Saloniego Mamy leksem LX. Pytamy kolejno:   (1) czy jest odmienny; (2) czy odmienia się przez przypadek; (3) czy odmienia się przez osobę; (4) czy odmienia się przez rodzaj; (5) czy odmienia się przez liczbę; (6) czy jest samodzielny składniowo; (7) czy pełni funkcję łączącą; (8) czy ma rząd.

Typologia leksemów: części mowy

Fleksja powierzchniowa Problem — wypełnienie klatek paradygmatu. Czyli: - jak wyglądają formy wyrazowe danego leksemu; - jak utworzyć dana formę na podstawie innej formy?   Typy form fleksyjnych: formy syntetyczne formy analityczne (w tym: aglutynacyjne).

Fleksja powierzchniowa  Rozbiór: temat fleksyjny (= część wspólna) i część gramatyczna (= część różna).   Część gramatyczna: pojedynczy morfem — końcówka sekwencja morfemów (końcówek) osobne słowo (być może, wraz z a. lub b.).

Fleksja powierzchniowa Formy syntetyczne: dziewczyny: dziewczyn- -y chłopiec: chłopiec- - najmłodszy: naj- -młod- -sz- -y AGL czytałaś: czyta- -ł- -a- -ś AGL czytali: czyta- -l- -i- -   [Formy analityczne: AGL (ty)ś ... czytała: -ś ... czyta- -ł- -a AGL byśmy... czytały: by- -śmy.... czyta- -ł- -y będę czytać: będ- -ę czyta- -ć AGL czytało będzie: czyta- -ł- -o będzie- -]

Problemy: Fleksja powierzchniowa a. końcówki wspólnofunkcyjne i ich dystrybucja, b. alternacje w tematach i ich dystrybucja, c. wzorce odmiany (klasyfikacja leksemów).   Ad a.: (mianownik liczby mnogiej)  -e (drwale, arbitraże, dworzanie, ciemnie, stolice, kasze)  -y (starcy, robotnicy, brzuchy, stoły, dziewczyny, myszy)  -i (króliki, hetmani, podłogi, kości)  -owie (paziowie, widzowie, wrogowie, panowie)  -a (akta, pola, okna)

Ad b.: (alternacje w temacie) Fleksja powierzchniowa Ad b.: (alternacje w temacie) CZYTAĆ: czytam, czytasz,..., czytają,..., czytałem,... WIEŹĆ: wiozę, wieziesz,..., wiozłem,..., wiózł,..., wieźli,..., wieziono,... ROBOTNIK: robotnik,..., robotnikiem, ..., robotnicy,... SZKOŁA: szkoła,..., szkole,..., szkół,... MAŁY: mały,..., mali,..., mniejszego, ...

Fleksja powierzchniowa Uwaga: w polszczyźnie odmieniaja się tematy! Morfonologia droga: drog- + -a drodze: 1. drog- => drodz-, 2. drodz- + -e dróg: 1. drog- => dróg-, 2. dróg- + - kupował: kupowa- + -ł kupujesz: 1. kupowa- => kupuje-, 2. kupuje- + -sz kupując: 1. kupowa- => kupuj-, 2. kupuj- + -ąc ciąć: cią- + -ć tnę: 1. cią- => tn-, 2. tn- + -ę tnął: 1. cią- => tną-, 2. tną- + -ł

Ad c.: (wzorce odmiany) Fleksja powierzchniowa Klasyfikacja fleksyjna leksemów — oparta na regularnych odpowiedniościach typu a. i typu b.: generowanie tematów od tematów, dopasowywanie końcówek. Systematyzacja fleksji polskiej — dzieło Jana Tokarskiego.

Opis słownikowy fleksji Trzy techniki: wzorce paradygmatyczne + odsyłacze (kody) reguły przekształcania form: formy bazowe paradygmat z wypełnieniami dla każdego leksemu

Grupy deklinacyjne Jana Tokarskiego Rodzaj męski m1 LIŚĆ: liść, liścia, liściem, liściu, liście, liści; m2 ŻOŁNIERZ: żołnierz, żołnierza, żołnierzem, żołnierzu, żołnierze, żołnierzy; m3 BYK: byk, byka, bykiem, byku, byki, byków; m4 KOT: kot, kota, kotem, kocie, koty, kotów; m5 MIESZCZANIN: mieszczanin, mieszczanina, mieszczaninem, mieszczaninie, mieszczanie, mieszczan.

Grupy deklinacyjne Jana Tokarskiego Rodzaj żeński ż1 ZIEMIA: ziemia, ziemi, ziemią, ziemi, ziemie, ziem; ż2 TĘCZA: tęcza, tęczy, tęczą, tęczy, tęcze, tęcz; ż3 ŁĄKA: łąka, łąki, łąką, łące, łąki, łąk; ż4 KOBIETA: kobieta, kobiety, kobietą, kobiecie, kobiety, kobiet; ż5 NIĆ: nić, nici, nicią, nici, nici, nici; ż6 MYSZ: mysz, myszy, myszą, myszy, myszy.

Grupy deklinacyjne Jana Tokarskiego Rodzaj nijaki n1 ZDJĘCIE: zdjęcie, zdjęcia, zdjęciem, zdjęciu, zdjęcia, zdjęć; n2 ŁYKO: łyko, łyka, łykiem, łyku, łyka, łyk; n3 OKNO: okno, okna, oknem, oknie, okna, okien; n4 PISKLĘ: pisklę, pisklęcia, pisklęciem, pisklęciu, pisklęta, piskląt; n5 IMIĘ: imię, imienia, imieniem, imieniu, imiona, imion; n6 MUZEUM: muzeum, muzeum, muzeum, muzeum, muzea, muzeów.

Grupy koniugacyjne Jana Tokarskiego Formy podstawowe: bezokolicznik, pierwsza i druga osoba liczby pojedynczej, trzecia osoba liczby mnogiej czasu teraźniejszego lub przyszłego syntetycznego, druga osoba liczby pojedynczej trybu rozkazującego, trzecia osoba liczby pojedynczej rodzaju męskiego i trzecia osoba liczby mnogiej rodzaju męskoosobowego czasu przeszłego oraz bezosobnik.

Grupy koniugacyjne Jana Tokarskiego (por. SJP Dor.: lxiii-lxxiv, Tokarski (1973: 213-230)): 1: CZYTAĆ czytać, ~am, ~asz, ~ają, ~aj, ~ał, ~ali, ~ano 2: UMIEĆ umieć, ~em, ~esz, ~eją, ~ej, ~ał, ~eli, ~ano 3: SZALEĆ szaleć, ~eję, ~ejesz, ~eją, ~ej, ~ał, ~eli, ~ano 4: KUPOWAĆ kupować, ~uję, ~ujesz, ~ują, ~uj, ~ował, ~owa­li, ~owano 5a: CIĄGNĄĆ ciągnąć, ~nę, ~niesz, ~ną, ~nij, ~nął, ~nęli, ~nięto 5b: SUNĄĆ sunąć, ~nę, ~niesz, ~ną, ~ń, ~nął, ~nęli, ~nięto 5c: CHUDNĄĆ chudnąć, ~nę, ~niesz, ~ną, ~nij, ~ł, ~li, ~nięto 6a: MÓWIĆ mówić, ~ię, ~isz, ~ią, ~, ~ił, ~ili, ~iono 6b: WARZYĆ warzyć, ~ę, ~ysz, ~ą, ~, ~ył, ~yli, ~ono

Grupy koniugacyjne Jana Tokarskiego 7a: MYŚLEĆ myśleć, ~ę, ~isz, ~ą, ~, ~ał, ~eli, ~ano 7b: SŁYSZEĆ słyszeć, ~ę, ~ysz, ~ą, ~, ~ał, ~eli, ~ano 8a: PISYWAĆ pisywać, ~uję, ~ujesz, ~ują, ~uj, ~ywał, ~ywa­li, ~ywano 8b: OPUKIWAĆ opukiwać, ~uję, ~ujesz, ~ują, ~uj, ~iwał, ~iwali, ~iwano 9: PISAĆ pisać, ~ę, ~esz, ~ą, ~, ~ał, ~ali, ~ano 10a: ŻYĆ żyć, ~ję, ~jesz, ~ją, ~j, ~ł, ~li, ~to 10b: GRZAĆ grzać, ~eję, ~ejesz, ~eją, ~ej, ~ał, ~eli, ~ano 10c: DĄĆ dąć, ~mę, ~miesz, ~mą, ~mij, ~ął, ~ęli, ~ęto 11: NIEŚĆ nieść, ~ę, ~iesz, ~ą, ~, ~ł, ~li, ~iono

Czasownik polski

Czasownik polski

SGJP Zasób: 250 tys. leksemów. Źródło: SJP Dor., korpusy. Hasła: leksemy, skróty, afiksy. Informacja slownikowa: fleksyjna, podstawowa słowotwórcza, podstawowa skladniowa. Leksemy nieodmienne (poza spójnikami, partykułami, przyimkami, przysłówkami): dopowiedzenia (TAK, AJUŚCI, OK). tzw. zaimki przysłowne: TAM, KIEDYŚ, NIGDY. przysłówki lczebnikowe: SAMOWTÓR. oretatory trybu:NIECH, BYLE, operatory deklaratywności: NIE, ALBO, NUŻ, NO, operatory adnumeratywne: NIESPEŁNA.