3. Wprowadzenie do nauki o języku A1NJ

Slides:



Advertisements
Podobne prezentacje
WYNIKI EGZAMINU GIMNAZJALNEGO Z JĘZYKA NOWOŻYTNEGO ROK SZKOLNY 2009/2010.
Advertisements

Lingwistyka Matematyczna
Klasyfikacja roczna w roku szkolnym 2012/2013
Nowa” Matura 2015 Języki obce
Znaki informacyjne.
Obserwowalność System ciągły System dyskretny
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
WYKŁAD 6 ATOM WODORU W MECHANICE KWANTOWEJ (równanie Schrődingera dla atomu wodoru, separacja zmiennych, stan podstawowy 1s, stany wzbudzone 2s i 2p,
Ludwik Antal - Numeryczna analiza pól elektromagnetycznych –W10
Liczby pierwsze.
1 mgr inż. Sylwester Laskowski Opiekun Naukowy: prof. dr hab. inż. Andrzej P. Wierzbicki.
1 Stan rozwoju Systemu Analiz Samorządowych czerwiec 2009 Dr Tomasz Potkański Z-ca Dyrektora Biura Związku Miast Polskich Warszawa,
(na podstawie badań ankietowych)
KONKURS WIEDZY O SZTUCE
PREPARATYWNA CHROMATOGRAFIA CIECZOWA.
Ministerstwo Gospodarki Poland'sexperience Waldemar Pawlak Deputy Prime Minister, Minister of Economy March 2010.
Podstawowe pojęcia akustyki
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
1. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
6. Wiedza o języku Studia Podyplomowe „Polski Język Migowy” 2013/2014
2. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
UKŁADY SZEREGOWO-RÓWNOLEGŁE
4. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
1. Wprowadzenie do nauki o języku A1NJ
3. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
4. Wprowadzenie do nauki o języku A1NJ
2. W PROWADZENIE DO NAUKI O JĘZYKU A1NJ * 3003-K1A1NJ S TUDIA STACJONARNE 2011/2012 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego.
5. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
Klasyfikacja systemów
Transformacja Z (13.6).
Opracował: Zespół Humanistyczny. Klasa Średnia ww - wielokrotnego wyboru (na 20 p) Średnia KO - krótkie odpowiedzi (na 10 p) Średnia za zaproszenie (na.
Pytania konkursowe.
Ogólnopolski Konkurs Wiedzy Biblijnej Analiza wyników IV i V edycji Michał M. Stępień
Wyrażenia algebraiczne
Wskazówki konkursowe.
Galeria zdjęć Projekt edukacyjny „Wiem, co jem” realizowany w ramach
1/34 HISTORIA BUDOWY /34 3/34 6 MAJA 2011.
KOLEKTOR ZASOBNIK 2 ZASOBNIK 1 POMPA P2 POMPA P1 30°C Zasada działanie instalacji solarnej.
ŻYWE JĘZYKI PROGRAMOWANIA LIVING IT UP WITH A LIVE PROGRAMMING LANGUAGE Sean McDirmid Ecole Polytechnique Fédérale de Lausanne (EPFL)
Analiza wpływu regulatora na jakość regulacji (1)
Wskazówki konkursowe.
„Klucz do uczenia się” L.Wygotskiego
1.
1. ŁATWOŚĆ ZADANIA (umiejętności) 2. ŁATWOŚĆ ZESTAWU ZADAŃ (ARKUSZA)
Obserwowalność i odtwarzalność
11. Wiedza o języku Studia Podyplomowe „Polski Język Migowy” 2013/2014
-17 Oczekiwania gospodarcze – Europa Wrzesień 2013 Wskaźnik > +20 Wskaźnik 0 a +20 Wskaźnik 0 a -20 Wskaźnik < -20 Unia Europejska ogółem: +6 Wskaźnik.
ZDYSCYPLINOWANY OPIS JĘZYKÓW NATURALNYCH I KORPUSY TEKSTÓW Proseminarium doktoranckie 2013/2014, semestr letni Prof. dr hab. Marek Świdziński Zakład.
EGZAMINU GIMNAZJALNEGO 2013
EcoCondens Kompakt BBK 7-22 E.
W2 Modelowanie fenomenologiczne I
Obliczalność czyli co da się policzyć i jak Model obliczeń sieci liczące dr Kamila Barylska.
Testogranie TESTOGRANIE Bogdana Berezy.
5. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
Wstęp do językoznawstwa synchronicznego A1WS Filologia polska, I rok * 2014/2015 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego.
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
ZOSTAŃ SPORTOWYM KOKSEM SP 11 TYM KTÓRY OCZARUJE KOMISJĘ SĘDZIOWSKĄ.
Systemy dynamiczne 2014/2015Obserwowalno ść i odtwarzalno ść  Kazimierz Duzinkiewicz, dr hab. in ż. Katedra In ż ynierii Systemów Sterowania 1 Obserwowalność.
7. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
6. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
Kalendarz 2020.
Elementy geometryczne i relacje
Spotkanie 5 Poliqarp.. Znakowanie – tagging Narzędzie do znakowania – tager Znakowanie: przypisywanie jednostkom tekstowym jakichś kodów (tagów): 1. lokalizacja.
10. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
Spotkanie 5 Poliqarp.. Znakowanie – tagging Narzędzie do znakowania – tager Znakowanie: przypisywanie jednostkom tekstowym jakichś kodów (tagów): 1. lokalizacja.
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
Wstęp do językoznawstwa synchronicznego A1WS Filologia polska, I rok * 2015/2016 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego.
Zapis prezentacji:

3. Wprowadzenie do nauki o języku 3003-11A1NJ 3. Wprowadzenie do nauki o języku 3003-11A1NJ * 3003-K1A1NJ Studia stacjonarne 2011/2012 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego Instytut Języka Polskiego UW e-mail: m.r.swidzinski@uw.edu.pl Konsultacje: środa 14.00-15.00, pok. 1 Strona przedmiotu — szukaj pod: http://www.mswidz.republika.pl/

Program wykładu Przedmiot językoznawstwa. Cechy definicyjne języka naturalnego.  Struktura języka I: morfologia. Struktura języka II: składnia.  Formalne rozumienie języka. Podstawy leksykologii. Leksykografia. Zróżnicowanie języków świata. Podstawy typologii.

Wykład 3: Struktura języka I: morfologia.

Analiza tekstu Łacina: ARMAVIRUMQUECANOTROIAEQUIPRIMU SABORISITALIAMFATOPROFUGUSLAVIN AQUEVENITLITORA Arma virumque cano, Troiae qui primus ab oris Italiam, fato profugus, Lavinaque venit litora ‘czyny męża-i śpiewam, Troi który pierwszy od wybrzeży do-Italii, losem miotany, lawińskich-i przybył brzegów’

Analiza tekstu Angielski: Our Father who art in heaven, hallowed be thy name. Thy kingdom come. Thy will be done on earth, as it is in heaven. Give us this day our daily bread, and forgive us our trespasses, as we forgive those who trespass against us, and lead us not into temptation, but deliver us from evil.

Analiza tekstu Koreański: anna-nun ku-eykey pyenci-lul sey-pen-ul ponay-ess-ta. ‘Anna-TOP on-dla list-OB trzy-raz-OB posłać-PRZE-OZN’ Anna to mu trzykrotnie list wysłała.

Analiza tekstu Polski: Goście są uwiedzeni urodą ich najmłodszych córek.

Lematyzacja Szukanie słówek w słowniku Arma virumque cano Troiae qui primus ab oris Italiam fato profugus Lavinaque venit litora virumque => VIR Italiam => ITALIA venit => VENIO

Lematyzacja Our Father who art in heaven, hallowed be thy name. Thy kingdom come. Thy will be done on earth, as it is in heaven. Give us this day our daily bread, and forgive us our trespasses, as we forgive those who trespass against us, and lead us not into temptation, but deliver us from evil. art => BE thy => THOU (???) trespasses => TRESPASS

Lematyzacja anna-nun ku-eykey pyenci-lul sey-pen-ul ponay-ess- ta. anna => ANNA ku => KU ponay => PONAY ul => UL

Lematyzacja Polski: Goście są uwiedzeni urodą ich najmłodszych córek. goście => GOŚĆ są => BYĆ uwiedzeni => UWIEŚĆ // UWIEDZIONY urodą => URODA ich => ONI // ONE najmłodszych => MŁODY córek => CÓRKA

Słowa a znaki proste Wnioski: Słownik nie jest zbiorem słów (wypisanych z tekstu). Słowa są upakowane w leksemy (= hasła słownikowe). Dotyczy to przytłaczającej większości JN w świecie. Słowa nie są najprostszymi znakami. W gramatyce są reguły: budowy słów (MORFOLOGIA) budowy wyrażeń (SKŁADNIA).

Punkt wyjścia: morfemy „Słownik” morfemów M = {-ank-, -ą, -czyta-, dyskretn-, dziś, -ent-, -i, -k-, koch-, -ł-, od, ‑ość-, prze-, -y, -ów, stud-, wiadom-, -} Konstrukcje morfologiczne: Surowiec: morfemy, konstrukcje morfologiczne. Produkt: słowa.

Konstrukcje morfemowe Poprawne: studentki przeczytały dyskretną wiadomość kochanków Dewiacyjne: *studentanki *czytałk *dyskretn *przewiadomośćą *kochów

Gramatyka słów Gramatyka słów: morfologia. Są języki, dla których Gramatyka = Morfologia

Punkt wyjścia: słowa „Słownik” słów:   S = {dyskretną, dziś, przeczytały, kochanków, od, studentki, wiadomość} Konstrukcje składniowe: Surowiec: słowa, konstrukcje składniowe. Produkt: wyrażenia (frazy lub zdania).

Konstrukcje składniowe Poprawne: Studentki przeczytały dziś dyskretną wiadomość od kochanków. Dyskretną od kochanków wiadomość studentki dziś przeczytały. Przeczytały dziś od kochanków wiadomość dyskretną studentki. Dewiacyjne: *Studentki wiadomość dziś od dyskretną kochanków przeczytały.

Gramatyka wyrażeń Gramatyka wyrażeń: składnia. Są języki, dla których Gramatyka = Składnia.

Języki wysoce fleksyjne Gramatyka języka polskiego obejmuje: morfologię i składnię. Polski — język wysoce fleksyjny (HIL = highly inflecting language).   Słowa polskie przeważnie nie są znakami prostymi.

Słowo, forma wyrazowa, leksem Co to znaczy słowo? Ile słów mamy mamy poniższym zdaniu:   Mamy mamy, drogie mamy, młodsze od niejednej mamy, ale mamy lubią wasze mamy.

Słowo, forma wyrazowa, leksem Odpowiedzi: 6 - 5 - 4 - 3 - 2 - 1 - 0...

Słowo, forma wyrazowa, leksem Rozróżnienia: a. jednostki konkretnej (fizycznego wystąpienia pewnego obiektu) i jednostki abstrakcyjnej — klasy wystąpień; [ang. token — type] b. jednostki niezinterpretowanej i jednostki zinterpretowanej.

Słowo, forma wyrazowa, leksem słowo — napis między spacjami lub znakami interpunkcyjnymi; forma wyrazowa — słowo z interpretacją gramatyczną (część mowy, ewentualne wartości kategorii fleksyjnych, ewentualnie nazwa jednostki słownikowej); leksem — zbiór form wyrazowych o tym samym odniesieniu do rzeczywistości (i o podobnym kształcie).

Słowo, forma wyrazowa, leksem Słowo mamy reprezentuje 5 różnych form wyrazowych: (a) czasownikową o wartości pierwszej osoby liczby mnogiej czasu teraźniejszego (mamy(1os,mno,ter)) (b) rzeczownikową o wartości dopełniacza liczby pojedynczej (mamy(dop,poj)); (c) rzeczownikowa o wartości mianownika liczby mnogiej (mamy(mian,mno)); (d) rzeczownikowa o wartości biernika liczby mnogiej (mamy(bier,mno) ); (e) rzeczownikowa o wartości wołacza liczby mnogiej (mamy(woł,mno)).

Słowo, forma wyrazowa, leksem Słowa typu mamy — homonimy. Rozwiązywanie homonimii: dehomonimizacja LEKSEM  hasło słownikowe. Odgadywanie leksemu: lematyzacja SŁOWNIK (składnik systemu językowego): zbiór form wyrazowych. Zbiór leksemów (a więc — zbiór zbiorów form wyrazowych) — LEKSYKON.

Reguły gramatyki Typ A: STUDENTKA, PRZECZYTAĆ, WIADOMOŚĆ, KOCHANEK Typ B: DZIŚ, DYSKRETNY, OD Typ A.: podzielne słowotwórczo (derywaty). Typ B.: niepodzielne słowotwórczo.

Reguły gramatyki Gramatyka – zbiór reguł, które robią: słowa z morfemów FLEKSJA [ leksemy z leksemów słowotwórstwo ] wyrażenia ze słów i innych wyrażeń SKŁADNIA Słowotwórstwo – słabo gramatyczne.

Przedmiot fleksji Leksemy — zbiory form wyrazowych: STUDENTKA = {studentka,studentki, studentce,..., studentki, studentek, studentkom,...} PRZECZYTAĆ = {przeczytam, przeczytasz, przeczyta,..., przeczytałem, przeczytałam, przeczytałeś,..., przeczytaj, przeczytajmy,..., przeczytałbym, przeczytałabym, przeczytałbyś,..., przeczytać, przeczytawszy}

Przedmiot fleksji WIADOMOŚĆ = {wiadomość, wiadomości, wiadomości,..., wiadomościom,...} KOCHANEK = {kochanek, kochanka, kochankowi,..., kochankowie, kochanków, kochankom,...} DZIŚ = {dziś} DYSKRETNY = {dyskretny, dyskretna, dyskretne, dyskretnego, dyskretnej, dyskretnego, dyskretnemu, dyskretnej, dyskretnemu,..., dyskretni, dyskretne, dyskretnych, dyskretnym,..., dyskretniejszy,..., najdyskretniejszy,...} OD = {od, ode}

Zadanie opisu fleksyjnego Fleksja – opis leksemów jako zbiorów form wyrazowych.

Analiza morfologiczna Jak zinterpretować // odczytać słowo tonie, żeby znaleźć w leksykonie odpowiedni leksem? TON TONA TOŃ TONĄĆ Rozpoznać słowo jako formę wyrazową. Podzielić na składniki (temat fleksyjny, końcówka). Lub inaczej: podzielić na część wspólną i część różną. Poszukać w leksykonie.

Analiza morfologiczna Ad 1.: To jest w dobrym tonie. Jasio tonie w rzece. Tonie się rozstąpiły przed Świtezianką. Przyglądałem się tonie. Poprzestali na tonie. W złym środowisku Jan pływa, w dobrym tonie. Jasio zgłębia tonie w rzece.

Analiza morfologiczna Ad 2.: tonie ton(i)- -e lub: ton/ie tonie- -Ø to/nie Analogicznie jak trop(i)- -e chuc(i)- -e słom(i)- -e pęknie- -Ø

Analiza morfologiczna Ad 3.: tonie  Leksem A TON jak TROP TONA jak SŁOMA TOŃ jak CHUĆ TONĄĆ jak PĘKNĄĆ

Dwa poziomy fleksji Fleksja jako fragment opisu gramatycznego fleksja głębinowa: opis uporządkowania form wyrazowych w leksemy (= szkolny rozbiór gramatyczny); fleksja powierzchniowa: opis struktury morfemowej form wyrazowych i klasyfikacja leksemów odmiennych ze względu na strukturę morfemową jego form (= szkolne „tematy”, „końcówki” i „wymiany głoskowe”).

Odmienność // nieodmienność Leksemy odmienne i nieodmienne STUDENTKA, PRZECZYTAĆ, WIADOMOŚĆ, DYSKRETNY, WIADOMOŚĆ, KOCHANEK DZIŚ A następujące leksemy: EMU, OD, MUZEUM, STEREO, SUPER ???

Funkcje opozycji fleksyjnych Jaki mamy pożytek z fleksji? Semantyczny: Chłopiec śpi. : Chłopcy śpią. Śpię. : Śpisz. : Śpi. Mży. : Mżyło. : Będzie mżyło. ............................

Funkcje opozycji fleksyjnych Składniowy: Ten chłopiec śpi. : Ci chłopcy śpią. Ten chłopiec śpi. : Ta dziewczyna śpi. : To widmo śpi. bez mamy : o mamie : za mamę Semantyczno-składniowy: Mama zabiła gęś. : Mamę zabiła gęś. : Zabił gęś mamą. Pięć mam płacze. : Kuzynka mamy płacze.

Opozycja = kategoria fleksyjna mianownik, trzecia, przyszły Kategorie gramatyczne fleksyjne Kategorie fleksyjne: opozycje w zbiorze form wyrazowych w poprzek leksemu. Wartości kategorii fleksyjnych: człony takich opozycji. Przypadek, Osoba, Czas ale: mianownik, trzecia, przyszły Język fleksyjny: taki, w którym fleksja służy składni.

Typologia leksemów: części mowy Klasyfikacja gramatyczna leksemów polskich Zygmunta Saloniego Mamy leksem LX. Pytamy kolejno:   (1) czy jest odmienny; (2) czy odmienia się przez przypadek; (3) czy odmienia się przez osobę; (4) czy odmienia się przez rodzaj; (5) czy odmienia się przez liczbę; (6) czy jest samodzielny składniowo; (7) czy pełni funkcję łączącą; (8) czy ma rząd.

Typologia leksemów: części mowy

Paradygmat

Fleksja powierzchniowa Problem — wypełnienie klatek paradygmatu. Czyli: - jak wyglądają formy wyrazowe danego leksemu; - jak utworzyć dana formę na podstawie innej formy?   Typy form fleksyjnych: formy syntetyczne formy analityczne (w tym: aglutynacyjne).

Fleksja powierzchniowa  Rozbiór: temat fleksyjny (= część wspólna) i część gramatyczna (= część różna).   Część gramatyczna: pojedynczy morfem — końcówka sekwencja morfemów (końcówek) osobne słowo (być może, wraz z a. lub b.).

Fleksja powierzchniowa Formy syntetyczne: dziewczyny: dziewczyn- -y chłopiec: chłopiec- - najmłodszy: naj- -młod- -sz- -y AGL czytałaś: czyta- -ł- -a- -ś AGL czytali: czyta- -l- -i- -   [Formy analityczne: AGL (ty)ś ... czytała: -ś ... czyta- -ł- -a AGL byśmy... czytały: by- -śmy.... czyta- -ł- -y będę czytać: będ- -ę czyta- -ć AGL czytało będzie: czyta- -ł- -o będzie- -]

Fleksja powierzchniowa Problemy: a. końcówki wspólnofunkcyjne i ich dystrybucja, b. alternacje w tematach i ich dystrybucja, c. wzorce odmiany (klasyfikacja leksemów).   Ad a.: (mianownik liczby mnogiej)  -e (drwale, arbitraże, dworzanie, ciemnie, stolice, kasze)  -y (starcy, robotnicy, brzuchy, stoły, dziewczyny, myszy)  -i (króliki, hetmani, podłogi, kości)  -owie (paziowie, widzowie, wrogowie, panowie)  -a (akta, pola, okna)

Fleksja powierzchniowa Ad b.: (alternacje w temacie) CZYTAĆ: czytam, czytasz,..., czytają,..., czytałem,... WIEŹĆ: wiozę, wieziesz,..., wiozłem,..., wiózł,..., wieźli,..., wieziono,... ROBOTNIK: robotnik,..., robotnikiem, ..., robotnicy,... SZKOŁA: szkoła,..., szkole,..., szkół,... MAŁY: mały,..., mali,..., mniejszego, ...

Fleksja powierzchniowa Uwaga: w polszczyźnie odmieniaja się tematy! To się nazywa morfonologia droga: drog- + -a drodze: 1. drog- => drodz-, 2. drodz- + -e dróg: 1. drog- => dróg-, 2. dróg- + - kupował: kupowa- + -ł kupujesz: 1. kupowa- => kupuje-, 2. kupuje- + -sz kupując: 1. kupowa- => kupuj-, 2. kupuj- + -ąc ciąć: cią- + -ć tnę: 1. cią- => tn-, 2. tn- + -ę tnął: 1. cią- => tną-, 2. tną- + -ł50

Fleksja powierzchniowa Ad c.: (wzorce odmiany) Klasyfikacja fleksyjna leksemów — oparta na regularnych odpowiedniościach typu a. i typu b.: generowanie tematów od tematów, dopasowywanie końcówek. Systematyzacja fleksji polskiej — dzieło Jana Tokarskiego.

Podsumowanie Znajomość języka A: znajomość słówek i reguł budowy / rozbioru wyrażeń. Słownik to zbiór leksemów (= haseł słownikowych). Dla „słownika” morfemów – gramatyka słów: morfologia. Dla „słownika” słów – gramatyka wyrażeń: składnia. Polski – język wysoce fleksyjny (HIL = Highly Inflecting Language). Terminy: słowo – forma wyrazowa – leksem. Słowotwórstwo jest w niewielkim stopniu gramatyczne. Gramatyka języka polskiego obejmuje morfologię (= fleksję) i składnię. Fleksja głęboka (paradygmaty) i powierzchniowa (wypełnienie klatek paradygmatu).