Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego

Slides:



Advertisements
Podobne prezentacje
I część 1.
Advertisements

Lingwistyka Matematyczna
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
O odmiennych i nieodmiennych częściach mowy
Domy Na Wodzie - metoda na wlasne M
® System do analizy tekstów ortograficznych Cezary Dołęga,
(na podstawie badań ankietowych)
KONKURS WIEDZY O SZTUCE
JĘZYK POLSKI KLASY IV - VI
Ministerstwo Gospodarki Poland'sexperience Waldemar Pawlak Deputy Prime Minister, Minister of Economy March 2010.
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
1. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
6. Wiedza o języku Studia Podyplomowe „Polski Język Migowy” 2013/2014
2. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
4. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
1. Wprowadzenie do nauki o języku A1NJ
3. Wprowadzenie do nauki o języku A1NJ
3. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
4. Wprowadzenie do nauki o języku A1NJ
5. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
CZASOWNIK- odmienna część mowy. Jego odmiana nazywa się KONIUGACJĄ
Opracował: Zespół Humanistyczny. Klasa Średnia ww - wielokrotnego wyboru (na 20 p) Średnia KO - krótkie odpowiedzi (na 10 p) Średnia za zaproszenie (na.
Jak wypadliśmy na maturze z matematyki w 2010 roku?
Odmienne i nieodmienne części mowy
CZĘŚCI MOWY Lekcja gramatyki Szymon Szymura Klasa VI a klik.
Powtórka z polskiego dla klas 5-6
EGZAMIN GIMNAZJALNY W SUWAŁKACH 2009 Liczba uczniów przystępująca do egzaminu gimnazjalnego w 2009r. Lp.GimnazjumLiczba uczniów 1Gimnazjum Nr 1 w Zespole.
w ramach projektu Szkoła z Klasą 2.0
KOMUNIKACJA ALTERNATYWNA - PIKTOGRAMY
Kategorie słowotwórcze rzeczowników odprzymiotnikowych
11. Wiedza o języku Studia Podyplomowe „Polski Język Migowy” 2013/2014
NIEODMIENNE CZĘŚCI MOWY
ODMIENNE CZĘŚCI MOWY Aneta Woźniak.
ZDYSCYPLINOWANY OPIS JĘZYKÓW NATURALNYCH I KORPUSY TEKSTÓW Proseminarium doktoranckie 2013/2014, semestr letni Prof. dr hab. Marek Świdziński Zakład.
CZĘŚCI MOWY Autor Anita Rejch.
Temat: Utrwalenie wiadomości o czasowniku.
EGZAMINU GIMNAZJALNEGO 2013
EcoCondens Kompakt BBK 7-22 E.
WYNIKI EGZAMINU MATURALNEGO W ZESPOLE SZKÓŁ TECHNICZNYCH
Testogranie TESTOGRANIE Bogdana Berezy.
Czy wiesz już wszystko o częściach mowy?
5. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
Opracowała: mgr Joanna Pastuszka Szkoła Podstawowa w LipowcuKościelnym
Wstęp do językoznawstwa synchronicznego A1WS Filologia polska, I rok * 2014/2015 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego.
Emilia Korycińska klasa 5a
Dr hab. Renata Babińska- Górecka
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
7. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
GRAMATYKA ŁATWA I PRZYJEMNA.
6. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
Modelowanie Kognitywne
Kalendarz 2020.
Elementy geometryczne i relacje
ZDYSCYPLINOWANY OPIS JĘZYKÓW NATURALNYCH Proseminarium doktoranckie 2014/2015, semestr letni Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego.
Spotkanie 5 Poliqarp.. Znakowanie – tagging Narzędzie do znakowania – tager Znakowanie: przypisywanie jednostkom tekstowym jakichś kodów (tagów): 1. lokalizacja.
10. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
9. Wiedza o języku Studia Podyplomowe „Polski Język Migowy” 2013/2014
Spotkanie 5 Wstęp do GFJP: jak to chodzi....  Definicja pewnego zbioru wyrażeń (np. zbioru „język polski”).  Różne aparaty: ST, EST, GB, GPSG, HPSG,…
Spotkanie 5 Poliqarp.. Znakowanie – tagging Narzędzie do znakowania – tager Znakowanie: przypisywanie jednostkom tekstowym jakichś kodów (tagów): 1. lokalizacja.
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
Wstęp do programowania Wykład 9
Części mowy Edyta Sawicka.
Wstęp do językoznawstwa synchronicznego A1WS Filologia polska, I rok * 2015/2016 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego.
Kształtowanie kompetencji komunikacyjnych wiedza o języku w szkole podstawowej i gimnazjum.
CZASOWNIK- odmienna część mowy. Jego odmiana nazywa się KONIUGACJĄ
Rozwój mowy dziecka.
Zapis prezentacji:

Wstęp do językoznawstwa synchronicznego 3003-11A1WS Filologia polska, I rok * 2013/2014 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego Instytut Języka Polskiego UW e-mail: m.r.swidzinski@uw.edu.pl Konsultacje w pok. 1: środa 16.30-17.30 Strona przedmiotu — szukaj pod: www.mswidz.republika.pl/

Program Przedmiot językoznawstwa. Cechy definicyjne języka naturalnego.  Formalne rozumienie języka. Lingwistyka formalna i informatyczna. Komunikacja językowa. Struktura języka I: słownik i morfologia. Struktura języka II: składnia.  Podstawy leksykologii. Leksykografia. Słowniki – analiza zawartości, klasyfikacja. Zróżnicowanie języków świata. Podstawy typologii. Typy badań lingwistycznych. Kolokwium.

Struktura języka I: słownik morfologia. Temat 5 Struktura języka I: słownik morfologia.

Analiza tekstu Łacina: ARMAVIRUMQUECANOTROIAEQUIPRIMU SABORISITALIAMFATOPROFUGUSLAVIN AQUEVENITLITORA Arma virumque cano, Troiae qui primus ab oris Italiam, fato profugus, Lavinaque venit litora ‘czyny męża-i śpiewam, Troi który pierwszy od wybrzeży do-Italii, losem miotany, lawińskich-i przybył brzegów’

Analiza tekstu Angielski: Our Father who art in heaven, hallowed be thy name. Thy kingdom come. Thy will be done on earth, as it is in heaven. Give us this day our daily bread, and forgive us our trespasses, as we forgive those who trespass against us, and lead us not into temptation, but deliver us from evil.

Analiza tekstu Koreański: anna-nun ku-eykey pyenci-lul sey-pen-ul ponay-ess-ta. ‘Anna-TOP on-dla list-OB trzy-raz-OB posłać-PRZE-OZN’ Anna to mu trzykrotnie list wysłała.

Analiza tekstu Polski: Goście są urzeczeni urodą ich najmłodszych córek.

Lematyzacja Szukanie słówek w słowniku Arma virumque cano Troiae qui primus ab oris Italiam fato profugus Lavinaque venit litora virumque => VIR Italiam => ITALIA venit => VENIO

Lematyzacja Our Father who art in heaven, hallowed be thy name. Thy kingdom come. Thy will be done on earth, as it is in heaven. Give us this day our daily bread, and forgive us our trespasses, as we forgive those who trespass against us, and lead us not into temptation, but deliver us from evil. art => BE thy => THOU (???) trespasses => TRESPASS

Lematyzacja Polski: Goście są urzeczeni urodą ich najmłodszych córek. goście => GOŚĆ są => BYĆ uwiedzeni => UWIEŚĆ // UWIEDZIONY urodą => URODA ich => ONI // ONE najmłodszych => MŁODY córek => CÓRKA

Konstrukcje morfologiczne Pierwszy typ: tonie weselszego hat gefunden czytalibyśmy cats Wielkiejnocy (dawno)ś przyszło will wait waiting psal jsem będę rzygać

Konstrukcje morfologiczne A to: stolarza Wielkanoc actress podomka Sprachwissenschaft skladatele żebyśmy streetworker szkoła średnia po polsku

Morfologia gramatyczna i słownikowa Morfologia w węższym rozumieniu: to, co się dzieje wewnątrz słowa Morfologia gramatyczna = fleksja Morfologia słownikowa = słowotwórstwo (derywacja) Są języki bez morfologii

Słowa a znaki proste Wnioski: Słownik nie jest zbiorem słów (wypisanych z tekstu). Słowa są upakowane w leksemy (= hasła słownikowe). Dotyczy to przytłaczającej większości JN w świecie. Słowa nie są najprostszymi znakami.

Punkt wyjścia: morfemy „Słownik” morfemów M = {-ank-, -ą, -czyta-, dyskretn-, dziś, -ent-, -i, -k-, koch-, -ł-, od, ‑ość-, prze-, -y, -ów, stud-, wiadom-, -} Konstrukcje morfologiczne: Surowiec: morfemy, konstrukcje morfologiczne. Produkt: słowa.

Konstrukcje morfemowe Poprawne: studentki przeczytały dyskretną wiadomość kochanków Dewiacyjne: *studentanki *czytałk *dyskretn *przewiadomośćą *kochów

Gramatyka słów Gramatyka słów: morfologia. Są języki, dla których Gramatyka = Morfologia

Punkt wyjścia: słowa „Słownik” słów:   S = {dyskretną, dziś, przeczytały, kochanków, od, studentki, wiadomość} Konstrukcje składniowe: Surowiec: słowa, konstrukcje składniowe. Produkt: wyrażenia (frazy lub zdania).

Konstrukcje składniowe Poprawne: Studentki przeczytały dziś dyskretną wiadomość od kochanków. Dyskretną od kochanków wiadomość studentki dziś przeczytały. Przeczytały dziś od kochanków wiadomość dyskretną studentki. Dewiacyjne: *Studentki wiadomość dziś od dyskretną kochanków przeczytały.

Gramatyka wyrażeń Gramatyka wyrażeń: składnia. Są języki, dla których Gramatyka = Składnia.

Języki wysoce fleksyjne Gramatyka języka polskiego obejmuje: morfologię i składnię. Polski — język wysoce fleksyjny (HIL = highly inflected language).   Słowa polskie przeważnie nie są znakami prostymi.

Słowo, forma wyrazowa, leksem Co to znaczy słowo? Ile słów mamy mamy poniższym zdaniu:   Mamy mamy, drogie mamy, młodsze od niejednej mamy, ale mamy lubią wasze mamy.

Słowo, forma wyrazowa, leksem Odpowiedzi: 6 - 5 - 4 - 3 - 2 - 1 - 0...

Słowo, forma wyrazowa, leksem Rozróżnienia: a. jednostki konkretnej (fizycznego wystąpienia pewnego obiektu) i jednostki abstrakcyjnej — klasy wystąpień; [ang. token — type] b. jednostki niezinterpretowanej i jednostki zinterpretowanej.

Słowo, forma wyrazowa, leksem słowo — napis między spacjami lub znakami interpunkcyjnymi; forma wyrazowa — słowo z interpretacją gramatyczną (część mowy, ewentualne wartości kategorii fleksyjnych, ewentualnie nazwa jednostki słownikowej); leksem — zbiór form wyrazowych o tym samym odniesieniu do rzeczywistości (i o podobnym kształcie).

Słowo, forma wyrazowa, leksem Słowo mamy reprezentuje 5 różnych form wyrazowych: (a) czasownikową o wartości pierwszej osoby liczby mnogiej czasu teraźniejszego (mamy(1os,mno,ter)) (b) rzeczownikową o wartości dopełniacza liczby pojedynczej (mamy(dop,poj)); (c) rzeczownikowa o wartości mianownika liczby mnogiej (mamy(mian,mno)); (d) rzeczownikowa o wartości biernika liczby mnogiej (mamy(bier,mno) ); (e) rzeczownikowa o wartości wołacza liczby mnogiej (mamy(woł,mno)).

Słowo, forma wyrazowa, leksem Słowa typu mamy — homonimy. Rozwiązywanie homonimii: dehomonimizacja LEKSEM  hasło słownikowe. Odgadywanie leksemu: lematyzacja SŁOWNIK (składnik systemu językowego): zbiór form wyrazowych. Zbiór leksemów (a więc — zbiór zbiorów form wyrazowych) — LEKSYKON.

Reguły gramatyki Typ A: STUDENTKA, PRZECZYTAĆ, WIADOMOŚĆ, KOCHANEK Typ B: DZIŚ, DYSKRETNY, OD Typ A.: podzielne słowotwórczo (derywaty). Typ B.: niepodzielne słowotwórczo.

Reguły gramatyki Gramatyka – zbiór reguł, które robią: słowa z morfemów FLEKSJA [ leksemy z leksemów słowotwórstwo ] wyrażenia ze słów i innych wyrażeń SKŁADNIA Słowotwórstwo – słabo gramatyczne.

Przedmiot fleksji Leksemy — zbiory form wyrazowych: STUDENTKA = {studentka,studentki, studentce,..., studentki, studentek, studentkom,...} PRZECZYTAĆ = {przeczytam, przeczytasz, przeczyta,..., przeczytałem, przeczytałam, przeczytałeś,..., przeczytaj, przeczytajmy,..., przeczytałbym, przeczytałabym, przeczytałbyś,..., przeczytać, przeczytawszy}

Przedmiot fleksji WIADOMOŚĆ = {wiadomość, wiadomości, wiadomości,..., wiadomościom,...} KOCHANEK = {kochanek, kochanka, kochankowi,..., kochankowie, kochanków, kochankom,...} DZIŚ = {dziś} DYSKRETNY = {dyskretny, dyskretna, dyskretne, dyskretnego, dyskretnej, dyskretnego, dyskretnemu, dyskretnej, dyskretnemu,..., dyskretni, dyskretne, dyskretnych, dyskretnym,..., dyskretniejszy,..., najdyskretniejszy,...} OD = {od, ode}

Co to jest fleksja? Fleksja Jak zinterpretować słowo tonie, żeby znaleźć w leksykonie odpowiedni leksem? TON TONA TOŃ TONĄĆ Rozpoznać słowo jako formę wyrazową. Podzielić na składniki (temat fleksyjny, końcówka, alternacje). Poszukać w leksykonie.

Ad 1.: To jest w dobrym tonie. Jasio tonie w rzece. Tonie się rozstąpiły przed Świtezianką. Przyglądałem się tonie. Poprzestali na tonie. W złym środowisku Jan pływa, w dobrym tonie. Jasio zgłębia i tonie w rzece.

Ad 2.: Analogicznie jak trop(i)- -e tonie ton(i)- -e tonie- -Ø chuc(i)- -e słom(i)- -e pęknie- -Ø

Ad 3.: tonie  Leksem A TON jak TROP TONA jak SŁOMA TOŃ jak CHUĆ TONĄĆ jak PĘKNĄĆ

Dwie fleksje fleksja głębinowa: opis uporządkowania form wyrazowych w leksemy (= szkolny rozbiór gramatyczny); fleksja powierzchniowa: opis struktury morfemowej form wyrazowych i klasyfikacja leksemów odmiennych ze względu na strukturę morfemową jego form (= szkolne „tematy”, „końcówki” i „wymiany głoskowe”).

Leksemy odmienne i nieodmienne Odmienność Leksemy odmienne i nieodmienne STUDENTKA, PRZECZYTAĆ, WIADOMOŚĆ, DYSKRETNY, WIADOMOŚĆ, KOCHANEK DZIŚ A następujące leksemy: EMU, OD, MUZEUM, STEREO, SUPER ???

Jaki mamy pożytek z fleksji? Semantyczny: Fleksja: po co??? Jaki mamy pożytek z fleksji? Semantyczny: Chłopiec śpi. : Chłopcy śpią. Śpię. : Śpisz. : Śpi. Mży. : Mżyło. : Będzie mżyło. ............................

Składniowy: Fleksja: po co??? Ten chłopiec śpi. : Ci chłopcy śpią. Ten chłopiec śpi. : Ta dziewczyna śpi. : To widmo śpi. bez mamy : o mamie : za mamę Semantyczno-składniowy: Mama zabiła gęś. : Mamę zabiła gęś. : Zabił gęś mamą. Pięć mam płacze. : Kuzynka mamy płacze.

Kategorie gramatyczne Kategorie gramatyczne fleksyjne   Kategorie fleksyjne: opozycje w zbiorze form wyrazowych wewnątrz leksemu. Wartości kategorii fleksyjnych: człony takich opozycji. Przypadek, Osoba, Czas ale mianownik, trzecia, przyszły Język fleksyjny — taki, w którym fleksja służy składni

Kategorie gramatyczne Osoba 1os 2os 3os poj jem jesz je mno jemy jecie jedzą [poj będę jeść będziesz jeść będzie jeść mno będziemy jeść będziecie jeść będą jeść] poj ________ jedz [niech je] mno jedzmy jedzcie [niech jedzą]

Kategorie gramatyczne Tryb JEŚĆ ZBIĆ ozn jadły zbiły roz jedzmy zbijmy war jedlibyście zbilibyście [bylibyście [bylibyśmy jedli] zbili]

Paradygmat

Klasyfikacja leksemów Części mowy Klasyfikacja leksemów Część mowy — jakaś klasa leksemów. Klasyfikacja leksemów jest niezbędna teoretycznie i praktycznie. Powinna być poprawna logicznie i dobrze zaprojektowana technicznie.

Szkolne rozpoznawanie części mowy: CHŁOPIEC, GÓRA, SMOK, PODJADANIE, SZCZEROŚĆ, SZÓSTKA MAŁY, WIETRZNY, SZCZERY, PALĄCY, PIERWSZY, WINIEN CZYTAĆ, PREZESOWAĆ, PODJADAĆ, PALIĆ, PRZEWYŻSZAĆ, BYĆ DWA, SZEŚĆ, PIERWSZY, DWOJAKI DOBRZE, WYSOKO, WCZORAJ

Jakie to leksemy: ON, COŚ, TEN, TAKI, KIEDY, TYLE TRZEBA, CZAS, NIEPODOBNA ŻE, DOPÓKI, I, ZARÓWNO NA, MIĘDZY, Z POWODU, TEMU BYNAJMNIEJ, OKOŁO, DOŚĆ

Jakie kryteria? Zwykle — luźno semantyczne: Kto? co? Co robi? Jaki? Jak? Gdzie? Kiedy? Ile? Który? Zaimek coś zastępuje

Czasem — składniowe: Typy zaimków Typy liczebników MAŁY JASIO ROBI BŁĘDY W ROZBIORZE GRAMATYCZNYM...

Czy znamy inne części mowy („niepolskie”)?

Rodzajnik Determinator Partykuła przyczasownikowa Słowo posiłkowe Czasownik modalny Przymiotnik przyczasownikowy

Części mowy formalnie(j) Klasyfikacja gramatyczna leksemów polskich Zygmunta Saloniego Mamy leksem LX. Pytamy kolejno:   (1) czy jest odmienny; (2) czy odmienia się przez przypadek; (3) czy odmienia się przez osobę; (4) czy odmienia się przez rodzaj; (5) czy odmienia się przez liczbę; (6) czy jest samodzielny składniowo; (7) czy pełni funkcję łączącą; (8) czy ma rząd.

Klasy gramatyczne: RZECZowniki PRZYMiotniki LICZebniki CZASowniki   RZECZowniki PRZYMiotniki LICZebniki CZASowniki CZAS NIEWL — czasowniki niewłaściwe PART-PRZYS — partykuło-przysłówki SPOJ — spójniki PRZYIMki WYKrzykniki

Typologia Z. Saloniego a typologia szkolna Nie ma osobnej klasy zaimków. Imiesłowy przymiotnikowe to leksemy przymiotnikowe. Przymiotnikami są również liczebniki porządkowe. Przysłówki odprzymiotnikowe włączamy do leksemów przymiotnikowych.

Fleksja powierzchniowa Paradygmatyka Fleksja powierzchniowa Problem — wypełnienia klatek paradygmatu.   Typy form fleksyjnych: formy syntetyczne formy analityczne (w tym: aglutynacyjne).  Rozbiór: temat fleksyjny i część gramatyczna. Część gramatyczna: pojedynczy morfem — końcówka sekwencja morfemów (końcówek) osobne słowo (być może, wraz z a. lub b.).

[Formy analityczne: Formy syntetyczne: chłopiec: chłopiec- - dziewczyny: dziewczyn- -y chłopiec: chłopiec- - najmłodszy: naj- -młod- -sz- -y AGL czytałaś: czyta- -ł- -a- -ś AGL czytali: czyta- -l- -i- -   [Formy analityczne: AGL (ty)ś ... czytałła: -ś ... czyta- -ł- -a AGL byśmy... czytały: by- -śmy.... czyta- -ł- -y będę czytać: będ- -ę czyta- -ć AGL czytało będzie: czyta- -ł- -o będzie- -]

Problemy fleksji powierzchniowej: a Problemy fleksji powierzchniowej: a. końcówki wspólnofunkcyjne i ich dystrybucja, b. alternacje w tematach i ich dystrybucja, c. wzorce odmiany (klasyfikacja leksemów). Ad a.:  -e (drwale, arbitraże, dworzanie, ciemnie, stolice, kasze)  -y (starcy, robotnicy, brzuchy, stoły, dziewczyny, myszy)  -i (króliki, hetmani, podłogi, kości)  -owie (paziowie, widzowie, wrogowie, panowie)  -a (akta, pola, okna)

Ad b.: CZYTAĆ: czytam, czytasz,..., czytają,..., czytałem,... WIEŹĆ: wiozę, wieziesz,..., wiozłem,..., wiózł,..., wieźli,..., wieziono,... ROBOTNIK: robotnik,..., robotnikiem, ..., robotnicy,... SZKOŁA: szkoła,..., szkole,..., szkół,... MAŁY: mały,..., mali,..., mniejszego, ...

Uwaga: w polszczyźnie odmieniaja się tematy! Morfonologia droga: drog- + -a drodze: 1. drog- => drodz-, 2. drodz- + -e dróg: 1. drog- => dróg-, 2. dróg- + - kupował: kupowa- + -ł kupujesz: 1. kupowa- => kupuje-, 2. kupuje- + -sz kupując: 1. kupowa- => kupuj-, 2. kupuj- + -ąc ciąć: cią- + -ć tnę: 1. cią- => tn-, 2. tn- + -ę tnął: 1. cią- => tną-, 2. tną- + -ł

Systematyzacja fleksji polskiej — dzieło Jana Tokarskiego. Ad c.: Klasyfikacja fleksyjna leksemów — oparta na regularnych odpowiedniościach typu a. i typu b. generowanie tematów od tematów, dopasowywanie końcówek. Systematyzacja fleksji polskiej — dzieło Jana Tokarskiego.