Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

2. W PROWADZENIE DO NAUKI O JĘZYKU 3003-11A1NJ * 3003-K1A1NJ S TUDIA STACJONARNE 2011/2012 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego.

Podobne prezentacje


Prezentacja na temat: "2. W PROWADZENIE DO NAUKI O JĘZYKU 3003-11A1NJ * 3003-K1A1NJ S TUDIA STACJONARNE 2011/2012 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego."— Zapis prezentacji:

1 2. W PROWADZENIE DO NAUKI O JĘZYKU 3003-11A1NJ * 3003-K1A1NJ S TUDIA STACJONARNE 2011/2012 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego Instytut Języka Polskiego UW e-mail: m.r.swidzinski@uw.edu.pl Konsultacje: środa 14.00-15.00, pok. 1 Strona przedmiotu szukaj pod: http://www.mswidz.republika.pl/

2 1. Przedmiot językoznawstwa. 2. Cechy definicyjne języka naturalnego. 3. Struktura języka I: morfologia. 4. Struktura języka II: składnia. 5. Formalne rozumienie języka. 6. Podstawy leksykologii. Leksykografia. 7. Zróżnicowanie języków świata. Podstawy typologii. –2–2 Program wykładu

3 Wykład 2 Cechy definicyjne języka naturalnego –3–3

4 Jak opisać JN strukturalnie? Model urządzenie funkcjonujące jak oryginał. Co jest tym oryginałem (= obiektem opisu)? Umowa: JN NS. Co modelujemy? Kompetencja idealnego NSa. –4–4 Modelowanie

5 Kompetencja NSa umiejętność: a. odróżniania wyrażeń poprawnych od niepoprawnych, b. interpretowania ( rozumienia) wyrażeń poprawnych, c. wytwarzania wyrażeń poprawnych. –5–5 Kompetencja językowa

6 Zdanie poprawne nie musi być sensowne: Słowiki pokąsały nas po ołówku. Colorless green ideas sleep furiously. Umarł ten nieśmiertelny żonaty kawaler. Wyrażenie sensowne nie musi być zdaniem poprawnym: * Słowikie kląskać w ogrodu. * … you is my baby… * Kupi pan pięć kilogramy cementu? –6–6 Poprawność a sensowność

7 –7–7 Opis JN to przy pewnych założeniach jego gramatyka. Jest konwencjonalny i arbitralny. Model to idealizacja: wyostrzenie uogólnienie uproszczenie Istnieje nieograniczenie wiele poprawnych modeli (= opisów) danego JN. Model JN

8 Opisywany obiekt to czarna skrzynka. Językoznawca potrzebuje danych empirycznych. Dane: teksty rzeczywiste, teksty preparowane, sądy NSa o nich. Zbiór tekstów – korpus. –8–8 Dane empiryczne

9 Korpusy tekstów Dziś – bardzo wiele korpusów na nośniku informacji. Na przykład: http://korpus.pwn.pl/ http://korpus.pl/ PELCRA LOB Corpus (LancasterOslo/Bergen) 1971-1978 BNC (British National Corpus)..... –9–9 Korpusy

10 –10 Korpusy Korpus PWN

11 –11 Korpus PWN Korpusy

12 –12 Korpus PWN Korpusy Korpus IPI PAN

13 –13 –PELCRA Polish-English Language Corpora for Research and Application (Uniwersytet Łódzki) Korpusy

14 –14 BNC Korpusy

15 Tekst – wytwór NSa: produkt kompetencji językowej. Po rzeczach ich poznacie je (Ewangelia). Rozróżnienie langue – parole (F. de Saussure) mowa – mówienie system – tekst –15 Tekst

16 System:jeden jedyny abstrakcyjny zamknięty pozaczasowy Tekst: jeden z bardzo wielu konkretny będący elementem zbioru otwartego zlokalizowany w czasie i przestrzeni linearny –16 System a tekst

17 Teksty: mówione pisane (śpiewane) brajlowskie e-mailowe sms-owe migane (SJM)......... Reprezentują one odmiany diakrytyczne JN. –17 Typologia tekstów

18 Dwu-(trój-)poziomowość znaku Znak ma: kształt (formę) treść (funkcję) Składniki kształtu znaku – cegiełki asemantyczne: diakryty. Hierarchia składników tekstu: diakryty znaki proste znak złożone –18 Poziomy znaku

19 Jan pije od wczoraj. Znaki Znak złożony: od + wczoraj Znaki proste: od wczoraj Nieznaki Diakryty: o, d, w, c, z, o, r, a, j –19 Znaki i diakryty

20 Diakryty Diakryty języka naturalnego: głoski, allofony, fonemy litery, grafemy sześciopunkty....... Ale także: elementy składowe cegiełek: piksele, krzywe, pociągnięcia pędzla,..., cechy artykulacyjne lub akustyczne,... –20 Znaki i diakryty

21 Jednostki tekstu reprezentują jednostki systemu. JT – okaz (token), JS – typ (type). Jakie JS są reprezentowane przez następujące JT: mamami, MAMAMI, mamami kot, kota, kotu kupić, napisać, jeść Kto przyszedł?, Umrzesz ty., Wszyscy tu wczoraj rzygali. –21 Okaz i typ

22 Empirysta ogląda próbki (okazy) widzi typy opisuje typy Procedury analityczne: segmentacja (= wyodrębnienie najprostszych składników) strukturyzacja (= uchwycenie konstrukcji) Główne techniki: substytucja hipotezy analogii –22 Badanie empiryczne: podstawy

23 mamyczas, mamygotówkę, mamydużodługów: czas = gotówkę = dużodługów śpimy, czytamy, jemy: śpi = czyta = je śpię, śpisz, śpi: ę = sz = Symbol =: równoważność dystrybucyjna (swobodna wymienność). Polowanie na opozycję... –23 Substytucja

24 małego, nowego, drugiego: mał- = now- = drugi- dzieciśpią, wszyscyśpią, czterykobietyśpią: dzieci = wszyscy = czterykobiety śpiiśpi, mamęiojca, wczorajiprzedwczoraj: ZDANIE + i + ZDANIE = RZECZOWNIK + i + RZECZOWNIK = PRZYSŁÓWEK + i + PRZYSŁÓWEK –24 Hipoteza analogii

25 Jaświdziałwczorajżukazczarnymiskrzydełkami wtedyśmystanęliwpoprzekjezdni mójsynsięwszystkiegoboi żydkarabinnosi –25 Segmentacja

26 Jaś widziałwczorajżukazczarnymiskrzydełkami Bo: On widziałwczorajżukazczarnymiskrzydełkami Jaś umarł Jaświdziałwczorajżukazczarnymi skrzydełkami Bo: Jaświdziałwczorajżukazczarnymi nóżkami skrzydełkami = nóżkami –26 Segmentacja

27 Jaświdział wczoraj żukazczarnymiskrzydełkami Bo: Jaświdział przeddziesięciomadniami żukazczarnymiskrzydełkami wczoraj = przeddziesięciomadniami Substytucja udana!!! –27 Segmentacja

28 Nie: Jaświdziałw czorajżukazczarnymiskrzydełkami Nie: Jaświdział wczorajżuka zczarnymiskrzydełkami Nie: Jaświdziałwczorajżukazczarnymiskrzydeł kami –28 Segmentacja

29 wtedyśmy stanęli w poprzek jezdni -śmy... stanęli(nieciągłość) w poprzek (całość) mój syn się wszystkiego boi \---------------------------/ się... boi (nieciągłość) żydka rabin nosi czy żyd karabin nosi –29 Segmentacja

30 Postulat: staramy się dzielić na dwa... Technika substytucji. Równoważność dystrybucyjna = swobodna wymienność. Polowanie na opozycję – szukanie minimalnych różnic kształtu: par minimalnych. –30 Segmentacja

31 Szukamy różnic kształtu. Najmniejsza różnica: a. COŚ – NIC. b. cecha a – cecha nie-a a. Doniczka z pelargonią w oknie jako znak: możesz wejść. Opozycja DONICZKA : –31 Szukanie opozycji

32 1. Znaki zerowe (puste): Jaś- (bo: Jasia, Jasiowi, Jasiem,...) czytał- - (bo: czytałem, czytało, czytaliśmy,...) Końcówki zerowe (puste) umarł (bo: Jan umarł) Podmiot domyślny ale nie: wczoraj- (miałem czas) nie: że- (przyjdę, nie mówiłem) nie: za- (domem jest sad) –32 Kłopoty z parami minimalnymi

33 2. Wariancja (= synomimia) Kształt1 Kształt2, ale Znaczenie1 = Znaczenie2 (profesorz)y – (profesor)owie (stoł)ów – (kosz)y – (szkół) – (kośc)i (nauczy)ciel – (gr)acz – (piek)arz – (łow)ca – (mont)er taksówkarz – złotówa – taryfiarz Masz czas? – Czy masz czas? –33 Kłopoty z parami minimalnymi

34 Wariancja – zabezpieczenie systemu. Problem: które różnice kształtu są funkcjonalnie istotne (= relewantne)? Nieistotne (nierelewantne): profesorz- – profesor-; -owie – -y -ciel – -acz – -arz – -ca – -er Istotne (relewantne): nauczy- – gr- – pie- – łow- – mont -owie – ów – -om... –34 Kłopoty z parami minimalnymi

35 –35 = Kłopoty z parami minimalnymi

36 3. Neutralizacja (= honomimia, wieloznaczność, polisemia) Kształt1 = Kształt2, ale Znaczenie1 Znaczenie2 dziewczyny: dop, poj – mian, mno – bier, mno – woł, mno od DZIEWCZYNA mam: dop, mno od MAMA; 1os, poj, ter od MIEĆ; 2os, poj, roz od MAMIĆ Strzeż kolegi ojca.: ojca (czyjego?) – kolegi (czyjego?) Neutralizacja opozycji – defekt systemu. Wszystkie JN mają ten defekt!!! –36 Kłopoty z parami minimalnymi

37 –37 Zepsuty semafor Kłopoty z parami minimalnymi

38 Jaświdziałwczorajżukazczarnymiskrzydełkami Jaś widziałwczorajżukazczarnymiskrzydełkami widziałwczoraj żukazczarnymiskrzydełkami widział wczoraj żuka zczarnymiskrzydełkami –38 Strukturyzacja

39 * Jaświdziałwczorajżuka zczarnymiskrzydełkami ? widział wczorajżukazczarnymiskrzydełkami * żukaz czarnymiskrzydełkami * zczarnymi skrzydełkami * skrzydeł kami –39 Strukturyzacja

40 –40 Strukturyzacja

41 Z czego jest zrobiony (lub: robi się) tekst: a. z liter, głosek lub sylab,DIAKRYTY b. z morfemów,ZNAKI c. ze słów, d. z fraz, e. ze zdań, f. z wypowiedzeń? –41 Jednostki elementarne

42 Nasi nowi fleciści, których wysłano na urlop, powiedzieli swemu dyrygentowi, że nie wrócą. Ad a.: diakryty Litery n/a/s/i n/o/w/i f/l/e/c/i/ś/c/i k/t/ó/r/y/c/h w/y/s/ł/a/n/o n/a u/r/l/o/p –42 Jednostki elementarne

43 Głoski n/a/ś/i/n/o/v/i/f/l/e/ć/i/ś/ć/i/k/t/u/r/ y/ /v/y/s/u,/a/n/o/n/a/u,/u/r/l/o/p... Sylaby na/śi/no/vi/fle/ći/śći/ktu/ry /vy/su,a/no/na/u,ur/lop... Tekstu nie robi się z diakrytów!!! Opis diakrytów nie należy do gramatyki. –43 Jednostki elementarne

44 Ad b.-f.: znaki Morfemy nas/i now/i flec/iśc/i któr/ych wy/sła/no na urlop/ powiedzie/l/i/ sw/emu dyryg/ent/ow/i że nie wróc/ą Słowa Nasi nowi fleciści, których wysłano na urlop, powiedzieli swemu dyrygentowi, że nie wrócą. –44 Jednostki elementarne

45 Frazy a. o nasi nowi fleciści, których wysłano na urlop, o powiedzieli o swemu dyrygentowi o, że nie wrócą b. o nasi nowi fleciści o, których wysłano na urlop –45 Jednostki elementarne

46 o nasi o nowi fleciści o nowi o fleciści o których o wysłano o na urlop o na o urlop o swemu o dyrygentowi –46 Jednostki elementarne

47 Zdania nasi nowi fleciści, których wysłano na urlop, powiedzieli swemu dyrygentowi, że nie wrócą, których wysłano na urlop, że nie wrócą –47 Jednostki elementarne

48 Konstrukcje Znak złożony to konstrukcja. Podstawowy problem: łączliwość. Dwa typy konstrukcji: -konstrukcje morfologiczne, -konstrukcje składniowe. Gramatyka JN typu polszczyzny: - morfologia, - składnia. –48 Znaki złożone

49 Tematy: fleciśc- wysła-SŁOWOTWÓRSTWO dyrygent- Formy wyrazowe: nasi fleciści którychFLEKSJA wysłano urlop –49 Morfologia

50 Frazy: SKŁADNIA o nasi nowi fleciści, których wysłano na urlop, o nasi nowi fleciści o nowi fleciści Zdania:SKŁADNIA o nasi nowi fleciści, których wysłano na urlop, powiedzieli swemu dyrygentowi, że nie wrócą o których wysłano na urlop o że nie wrócą –50 Składnia

51 1. Językoznawca opisuje kompetencję językową NSa, czyli buduje model JN. 2. Opis JN to jego gramatyka. 3. Dane empiryczne: korpus tekstów. 4. Znaki mają trzy poziomy struktury: [diakryt –] znak prosty – znak złożony. 5. Poziomy abstrakcji: okazy i typy. 6. Rozbieżności między kształtem a znaczeniem: wariancja i neutralizacja. 7. Dwa typy konstrukcji (czyli: znaków złożonych): konstrukcje morfologiczne i konstrukcje składniowe. 8. Gramatyka języka polskiego obejmuje morfologię i składnię. –51 Podsumowanie


Pobierz ppt "2. W PROWADZENIE DO NAUKI O JĘZYKU 3003-11A1NJ * 3003-K1A1NJ S TUDIA STACJONARNE 2011/2012 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego."

Podobne prezentacje


Reklamy Google