Pobierz prezentację
Pobieranie prezentacji. Proszę czekać
OpublikowałRuta Palczewski Został zmieniony 10 lat temu
1
Wstęp do językoznawstwa synchronicznego 3003-11A1WS Filologia polska, I rok * 2013/2014
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego Instytut Języka Polskiego UW Konsultacje w pok. 1: środa Strona przedmiotu — szukaj pod:
2
Program Przedmiot językoznawstwa.
Cechy definicyjne języka naturalnego. Formalne rozumienie języka. Lingwistyka formalna i informatyczna. Komunikacja językowa. Struktura języka I: słownik i gramatyka. Struktura języka II: składnia. Podstawy leksykologii. Leksykografia. Słowniki – analiza zawartości, klasyfikacja. Zróżnicowanie języków świata. Podstawy typologii. Typy badań lingwistycznych. Kolokwium.
3
Cechy definicyjne języka naturalnego
Temat 2 Cechy definicyjne języka naturalnego
4
Modelowanie Jak opisać JN — strukturalnie? Model — urządzenie funkcjonujące jak oryginał. Co jest tym oryginałem (= obiektem opisu)? Umowa: JN NS. Co modelujemy? Kompetencję idealnego NS’a, czyli umiejętność: odróżniania wyrażeń poprawnych od niepoprawnych, interpretowania ( rozumienia) wyrażeń poprawnych, wytwarzania wyrażeń poprawnych.
5
Poprawność a sensowność
Zdanie poprawne nie musi być sensowne: Wyrażenie sensowne nie musi być zdaniem poprawnym:
6
Poprawność a sensowność
Ten kawaler ma za żonę bezdzietną matkę. Wyrażenie sensowne nie musi być zdaniem poprawnym:
7
Poprawność a sensowność
Ten kawaler ma za żonę bezdzietną matkę. Wyrażenie sensowne nie musi być zdaniem poprawnym: *Kali nie bać tygrys.
8
Opis (= model) języka naturalnego
Opis JN to — przy pewnych założeniach — jego gramatyka. Jest konwencjonalny i arbitralny. Model to idealizacja: wyostrzenie uogólnienie uproszczenie Istnieje nieograniczenie wiele poprawnych modeli (= opisów) danego JN.
9
Opisywany obiekt to czarna skrzynka.
Dane empiryczne Opisywany obiekt to czarna skrzynka. Językoznawca potrzebuje danych empirycznych. Dane: teksty rzeczywiste, teksty preparowane, sądy NS’a o nich. Zbiór tekstów – korpus.
10
Korpusy tekstów http://korpus.pwn.pl/ Jaki udział prasy w korpusie?
Co to jest Poliqarp? Rozwiąż skrót! PELCRA ??? LOB Corpus Co to? Gdzie? Kiedy? BNC (British National Corpus) .....
16
Tekst Tekst – wytwór NS’a: produkt kompetencji językowej.
Rozróżnienie langue – parole (F. de Saussure) mowa – mówienie system – tekst
17
System a tekst System: jeden jedyny abstrakcyjny zamknięty pozaczasowy
Tekst: jeden z bardzo wielu dostępny zmysłom będący elementem zbioru otwartego zlokalizowany w czasie i przestrzeni linearny
18
Teksty i ich typologia Teksty: mówione pisane (śpiewane) brajlowskie
owe sms-owe Reprezentują one odmiany diakrytyczne JN.
19
Dwu-(trój-)poziomowość znaku
Znak ma: kształt (formę) treść (funkcję) Składniki kształtu znaku – cegiełki asemantyczne: diakryty. Hierarchia składników tekstu: diakryty znaki proste znaki złożone
20
Jan pije od wczoraj.
21
Diakryty Diakryty języka naturalnego: głoski, allofony, fonemy
litery, grafemy „sześciopunkty” Ale także: elementy składowe „cegiełek”: piksele, krzywe, pociągnięcia pędzla,..., cechy artykulacyjne lub akustyczne,...
22
Zadanie empirysty: analiza tekstu
Cele: sporządzenie listy znaków prostych, rekonstrukcja sieci opozycji, [w tym: ograniczeń łączliwości]. Procedury analityczne: segmentacja, substytucja, hipotezy analogii.
23
Okaz i typ Jednostki tekstu (= obiekty konkretne) reprezentują jednostki systemu (= obiekty abstrakcyjne) JT – okaz (token), JS – typ (type). Jakie JS są reprezentowane przez następujące JT: mamami, MAMAMI, mamami kot, kota, kotu kupić, napisać, jeść Kto przyszedł?, Umrzesz ty., Wszyscy tu wczoraj rzygali.
24
Badania empiryczne Empirysta ogląda próbki (okazy) widzi typy
opisuje typy
25
Segmentacja Jaświdziałwczorajżukazczarnymiskrzydełkami wtedyśmystanęliwpoprzekjezdni żydkarabinnosi
26
Substytucja Równoważność dystrybucyjna (swobodna wymienność).
Polowanie na opozycję – szukanie par minimalnych.
27
Kłopoty z parami minimalnymi
Znaki zerowe Ale: żeby, *że- *wczoraj- Czytał--
28
Wariancja (= synomimia)
Kształt1 Kształt2, ale Znaczenie1 = Znaczenie2
29
(profesorz)y – (profesor)owie
taksiarz – złotówa – taryfiarz - taryfa Masz czas? – Czy masz czas? Wariancja – zabezpieczenie systemu. Problem: które różnice kształtu są funkcjonalnie istotne (= relewantne)?
30
=
31
3. Neutralizacja (= honomimia, wieloznaczność, polisemia)
Kształt1 = Kształt2, ale Znaczenie1 Znaczenie2
32
dziewczyny mam Strzeż kolegi ojca. Neutralizacja opozycji – defekt systemu. Wszystkie JN mają ten defekt!!!
33
Zepsuty semafor
34
Hipoteza analogii
35
Strukturyzacja
36
Problem składników elementarnych
Z czego jest zrobiony (lub: robi się) tekst: z liter, głosek lub sylab, DIAKRYTY z morfemów, ZNAKI ze słów, z fraz, ze zdań, z wypowiedzeń?
37
Nasi nowi fleciści, których wysłano na urlop, powiedzieli swemu dyrygentowi, że nie wrócą.
Ad a.: diakryty, czyli litery głoski sylaby
38
Opis diakrytów nie należy do gramatyki.
Tekstu nie robi się z diakrytów!!! Opis diakrytów nie należy do gramatyki.
39
Ad b.-f.: znaki Morfemy Słowa
40
Frazy a. nasi nowi fleciści, których wysłano na urlop, powiedzieli
swemu dyrygentowi , że nie wrócą b. nasi nowi fleciści , których wysłano na urlop
41
nasi nowi fleciści nowi fleciści których wysłano na urlop na urlop swemu dyrygentowi
42
Zdania nasi nowi fleciści, których wysłano na urlop, powiedzieli swemu dyrygentowi, że nie wrócą , których wysłano na urlop , że nie wrócą
43
Konstrukcje Znak złożony to konstrukcja.
Podstawowy problem: łączliwość. Dwa typy konstrukcji: - konstrukcje morfologiczne, - konstrukcje składniowe. Gramatyka JN „typu polszczyzny”: - morfologia, - składnia.
44
Konstrukcje morfologiczne
Tematy: SŁOWOTWÓRSTWO Formy wyrazowe: FLEKSJA
45
Konstrukcje składniowe
Frazy: SKŁADNIA Zdania: SKŁADNIA
46
Podsumowanie Językoznawca opisuje kompetencję językową NS’a, czyli buduje model JN. Opis JN to jego gramatyka. Dane empiryczne: korpus tekstów. Znaki mają trzy poziomy struktury: [diakryt –] znak prosty – znak złożony. Poziomy abstrakcji: okazy i typy. Rozbieżności między kształtem a znaczeniem: wariancja i neutralizacja. Dwa typy konstrukcji (czyli: znaków złożonych): konstrukcje morfologiczne i konstrukcje składniowe. Gramatyka języka polskiego obejmuje morfologię i składnię.
47
Polish and English Language Corpora for Research and Applications
POLyInterpretation Query And Retrieval Processor KWIC – KeyWord In Context
48
Homonimia w życiu Co z tą homonimią? 130. Wziętą metresę spod Serocka jedna księżniczka kapadocka, ledwie obrosła w piórka, wydała za pół-Turka, żeby wyciągnąć Serock z błocka.
49
Homonimia w życiu 130. Wziętą metresę spod Serocka jedna księżniczka kapadocka, ledwie obrosła w piórka, wydała za pół-Turka, żeby wyciągnąć Serock z błocka. 12 : 20
50
Homonimia w życiu 130. Wziętą metresę spod Serocka jedna księżniczka kapadocka, ledwie obrosła w piórka, wydała za pół-Turka, żeby wyciągnąć Serock z błocka. 14 : 20
51
Homonimia w życiu 268. Degenerat z osady Wysoka żonie swojej nie wybił dziś oka. Jednym bowiem z opuchniętą twarzą widać słabo. Jak więc uwarzą rosół z córki, gdy skrzepnie posoka?
52
Homonimia w życiu 268. Degenerat z osady Wysoka żonie swojej nie wybił dziś oka. Jednym bowiem z opuchniętą twarzą widać słabo. Jak więc uwarzą rosół z córki, gdy skrzepnie posoka? 17 : 26
53
Homonimia w życiu 408. Pewien łobuz z Tuluzy wkłada zwykle rajtuzy, śpiesząc do zamtuza, których jest Tuluza pełna – od tam po śluzy.
54
Homonimia w życiu 408. Pewien łobuz z Tuluzy wkłada zwykle rajtuzy, śpiesząc do zamtuza, których jest Tuluza pełna – od tam po śluzy. 11 : 18
Podobne prezentacje
© 2024 SlidePlayer.pl Inc.
All rights reserved.