6. Wprowadzenie do nauki o języku A1NJ

Slides:



Advertisements
Podobne prezentacje
Lingwistyka Matematyczna
Advertisements

Znaki informacyjne.
Wzór w notacji nawiasowej: a*(d*i*(k*o-l*n)-e*h*(k*o-l*n))+f*i*j*n
Wprowadzenie do informatyki Wykład 6
Obserwowalność System ciągły System dyskretny
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
WYKŁAD 6 ATOM WODORU W MECHANICE KWANTOWEJ (równanie Schrődingera dla atomu wodoru, separacja zmiennych, stan podstawowy 1s, stany wzbudzone 2s i 2p,
Liczby pierwsze.
Losy życiowe wychowanków Ośrodka Szkolno-Wychowawczego nr 3 w Warszawie Maria Jóźwicka-Sadownik.
1 mgr inż. Sylwester Laskowski Opiekun Naukowy: prof. dr hab. inż. Andrzej P. Wierzbicki.
PROGRAM OPERACYJNY KAPITAŁ LUDZKI Priorytet III, Działanie 3.2
PREZENTACJA ZASOBÓW INFORMACYJNYCH BAZY GŁÓWNEGO URZĘDU STATYSTYCZNEGO URZĄD STATYSTYCZNY W ŁODZI Łódź, 10 grudnia 2010 r.
1 Stan rozwoju Systemu Analiz Samorządowych czerwiec 2009 Dr Tomasz Potkański Z-ca Dyrektora Biura Związku Miast Polskich Warszawa,
KONKURS WIEDZY O SZTUCE
Systemy operacyjne Copyright, 2000 © Jerzy R. Nawrocki Wprowadzenie do informatyki.
Systemy operacyjne Copyright, 2000 © Jerzy R. Nawrocki Wprowadzenie do informatyki.
Podstawowe pojęcia akustyki
ENCYKLOPEDIE I SŁOWNIKI
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
JAK KORZYSTAĆ Z ENCYKLOPEDII I SŁOWNIKÓW?
2. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
UKŁADY SZEREGOWO-RÓWNOLEGŁE
1. Wprowadzenie do nauki o języku A1NJ
4. Wprowadzenie do nauki o języku A1NJ
E-learning czy kontakt bezpośredni w szkoleniu nowych użytkowników bibliotek uczelni niepaństwowych? EFEKTYWNOŚĆ OBU FORM SZKOLENIA BIBLIOTECZNEGO W ŚWIETLE.
Klasyfikacja systemów
Transformacja Z (13.6).
RODZAJE WYDAWNICTW INFORMACYJNYCH
Opracował: Zespół Humanistyczny. Klasa Średnia ww - wielokrotnego wyboru (na 20 p) Średnia KO - krótkie odpowiedzi (na 10 p) Średnia za zaproszenie (na.
SŁOWNIKI.
Wykonawcy:Magdalena Bęczkowska Łukasz Maliszewski Piotr Kwiatek Piotr Litwiniuk Paweł Głębocki.
Słowniki Autor prezentacji
Agnieszka Jankowicz-Szymańska1, Wiesław Wojtanowski1,2
SPOŁECZNA SŁUŻBA INSTRUKTORSKA RODZINNYCH OGRODÓW DZIAŁKOWYCH
Wyrażenia algebraiczne
„Rynek pracy w powiecie trzebnickim: struktura bezrobocia i miejsca pracy.”
ENCYKLOPEDIE I SŁOWNIKI
Anna Nowak Przedszkole publiczne im. Kubusia puchatka w zabełkowie
Słowniki i korpusy języka polskiego
Wanda Klenczon Biblioteka Narodowa
1 ANALIZA STANU BEZROBOCIA NA TERENIE MIASTA I GMINY GOŁAŃCZ ANALIZA STANU BEZROBOCIA NA TERENIE MIASTA I GMINY GOŁAŃCZ ZA ROK 2004 ORAZ PORÓWNANIE Z LATAMI.
1/34 HISTORIA BUDOWY /34 3/34 6 MAJA 2011.
KOLEKTOR ZASOBNIK 2 ZASOBNIK 1 POMPA P2 POMPA P1 30°C Zasada działanie instalacji solarnej.
Podstawy działania wybranych usług sieciowych
1.
11. Wiedza o języku Studia Podyplomowe „Polski Język Migowy” 2013/2014
ANALIZA EGZAMINU GIMNAZJALNEGO 2013 GIMNAZJUM IM
-17 Oczekiwania gospodarcze – Europa Wrzesień 2013 Wskaźnik > +20 Wskaźnik 0 a +20 Wskaźnik 0 a -20 Wskaźnik < -20 Unia Europejska ogółem: +6 Wskaźnik.
+21 Oczekiwania gospodarcze – Europa Grudzień 2013 Wskaźnik > +20 Wskaźnik 0 do +20 Wskaźnik 0 do -20 Wskaźnik < -20 Unia Europejska ogółem: +14 Wskaźnik.
EcoCondens Kompakt BBK 7-22 E.
Programowanie w języku C++
Encyklopedie i słowniki jako źródła informacji
W2 Modelowanie fenomenologiczne I
User experience studio Użyteczna biblioteka Teraźniejszość i przyszłość informacji naukowej.
Obliczalność czyli co da się policzyć i jak Model obliczeń sieci liczące dr Kamila Barylska.
Testogranie TESTOGRANIE Bogdana Berezy.
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
ZOSTAŃ SPORTOWYM KOKSEM SP 11 TYM KTÓRY OCZARUJE KOMISJĘ SĘDZIOWSKĄ.
ANALIZA EGZAMINU GIMNAZJALNEGO 2014 GIMNAZJUM IM. JANA PAWŁA II W BOGUSZYCACH.
Treści multimedialne - kodowanie, przetwarzanie, prezentacja Odtwarzanie treści multimedialnych Andrzej Majkowski informatyka +
Encyklopedie i słowniki jako podstawowe źródło informacji Oprac
Kalendarz 2020.
Elementy geometryczne i relacje
Strategia pomiaru.
Jaki jest statystyczny wrześnianin?
ZDYSCYPLINOWANY OPIS JĘZYKÓW NATURALNYCH Proseminarium doktoranckie 2014/2015, semestr letni Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego.
Spotkanie 5 Poliqarp.. Znakowanie – tagging Narzędzie do znakowania – tager Znakowanie: przypisywanie jednostkom tekstowym jakichś kodów (tagów): 1. lokalizacja.
10. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
9. Wiedza o języku Studia Podyplomowe „Polski Język Migowy” 2013/2014
Spotkanie 5 Poliqarp.. Znakowanie – tagging Narzędzie do znakowania – tager Znakowanie: przypisywanie jednostkom tekstowym jakichś kodów (tagów): 1. lokalizacja.
Zapis prezentacji:

6. Wprowadzenie do nauki o języku 3003-11A1NJ 6. Wprowadzenie do nauki o języku 3003-11A1NJ * 3003-K1A1NJ Studia stacjonarne 2011/2012 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego Instytut Języka Polskiego UW e-mail: m.r.swidzinski@uw.edu.pl Konsultacje: środa 14.00-15.00, pok. 1 Strona przedmiotu — szukaj pod: http://www.mswidz.republika.pl/

Kolokwium Termin: 21.11.2011, sala 4. Grupa 2 (6-10): 8.45: Cholewiak – Pyra 9.00: Romaniuk – Uziak 9:15: Walichnowska – Żurawska Grupa Cywilizacja 9.15 Grupa 1 (1-5): 9.45: Adamczyk – Fryc 10.00: Gabiniewicz – Kuts 10.15: Lasecka - Wojno 2 2

Kolokwium 3 3

Program wykładu Przedmiot językoznawstwa. Cechy definicyjne języka naturalnego.  Formalne rozumienie języka. Struktura języka I: morfologia. Struktura języka II: składnia.  Podstawy leksykologii. Leksykografia. Zróżnicowanie języków świata. Podstawy typologii.

Podstawy leksykologii. Leksykografia. Wykład 6 Podstawy leksykologii. Leksykografia.

Przypomnienie Kompetencja językowa: znajomość słownika i gramatyki. Słownik to zbiór pewnych jednostek (= haseł słownikowych); głównie – leksemów. Leksem – zbiór form wyrazowych mających to samo odniesienie do rzeczywistości (= znaczenie). Leksemy identyfikuje się i klasyfikuje na podstawie cech gramatycznych. Utrwalona fizycznie postać słownika: leksykon.

Jednostki słownika Użytkownik identyfikuje i pamięta JS: jako kształty jako pakiety cech semantycznych jako komplety cech gramatycznych JS to: leksemy pewne klasy wyrażeń

Leksykologia Leksykologia – dziedzina językoznawstwa zajmująca się opisem zasobu JS. Dla gramatyka: istotne własności gramatyczne (= morfologiczne i składniowe) JS. Dla leksykologa (i leksykografa): istotne własności semantyczne.

Typy JS Leksemy: KOT, CZEKAĆ, ON, WESOŁY, ALE, KRÓTKOWZROCZNOŚĆ, JAN, WCZORAJ, KTÓRY, PRZED, PIĘĆSET, OJEJ,... Wyrażenia: BAĆ SIĘ, PO OMACKU, KLUB PARLAMENTARNY, KOCIE ŁBY, ZOSTAĆ NA LODZIE, PIJANY JAK BELA, CIEMNO CHOĆ OKO WYKOL, BYLE JAK, CZARNA KAWA,...

Jednostki złożone Wyrażenia: leksemy „nieciągłe” (BAĆ SIĘ, PO OMACKU, BYLE JAK) idiomy (ZOSTAĆ NA LODZIE, PIJANY JAK BELA, CIEMNO CHOĆ OKO WYKOL) kolokacje (KLUB PARLAMENTARNY, CZARNA KAWA)

Klasyfikacje JS Porządkowanie zbioru JS według cech gramatycznych (klasy gramatyczne) według cech semantycznych (pola semantyczne, semantyka składnikowa; synonimia, hiponimia, antonimia, konwersja; wieloznaczność) według cech pozalingwistycznych (warianty stylistyczne, socjalne, terytorialne, chronologiczne, idiolektalne)

Znaczenie a oznaczanie Semantyka Znaczenie a oznaczanie [Znaczenie – prymarnie: to, co wynika z danego wyrażenia (to, co wyrażenie mówi bezpośrednio). Semantyka zdaniowa] JS ma pewną strukturę semantyczną. Jest to przedmiotem semantyki leksykalnej. Znaczenie JS – wtórne w stosunku do znaczenia wyrażeń: da się wywnioskować ze znaczenia wyrażenia. oznaczanie (denotacja) – relacja między wyrażeniem a klasą obiektów rzeczywistych referencja (odniesienie) – relacja między aktem mowy a konkretnym fragmentem rzeczywistości.

Semantyka leksykalna Semantyka leksykalna formułuje definicje JS – główny komponent słownika jako kompendium. PISAĆ «kreślić na papierze lub innym materiale znaki graficzne (litery, cyfry itp.) ręcznie lub odbijać je za pomocą maszyny dla wyrażenia czegoś słowami»] «tworzyć, układać co na piśmie, np. jakiś artykuł, jakieś dzieło literackie, naukowe; komponować» «formułować, ujmować swoje myśli na piśmie, utrwalać je za pomocą pisma» «donosić, komunikować coś na piśmie lub w druku» zwykle w imiesł. przymiotnikowym biernym, przestarz. «malować we wzory, zdobić rysunkami, deseniami itp.»

Semantyka leksykalna Różne szkoły semantyki leksykalnej Pola semantyczne: Jost Trier, Walter Porzig Semantyka składnikowa: Manfred Bierwisch Semantyka sensów elementarnych: Anna Wierzbicka, Andrzej Bogusławski, Igor Mielczuk Tezaurus: zbiór tematyczny JS

Semantyka leksykalna Relacje semantyczne w zbiorze JS Synominia mocna: równoznaczność JS1 i JS2 LINGWISTYKA – JĘZYKOZNAWSTWO UMRZEĆ – SKONAĆ DUŻY – WIELKI KARTOFLE – ZIEMNIAKI DOZORCA – CIEĆ .........

Semantyka leksykalna słaba: bliskoznaczność JS1 i JS2 ZESTAW – KOLEKCJA – ZBIÓR BAĆ SIĘ – TRZĄŚĆ PORTKAMI – OBAWIAĆ SIĘ MĄDRY – ROZUMNY – ROZSĄDNY ......... Niemożliwe do zdefiniowania...

Semantyka leksykalna Hiponimia (inkluzja) WRÓBEL – PTAK MATKA – KOBIETA – CZŁOWIEK POWIEDZIEĆ – ZAKOMUNIKOWAĆ OGROMNY – DUŻY ZIMA – PORA ROKU – OKRES ..................... Kohiponimia

Semantyka leksykalna Konwersja OJCIEC – SYN OŻENIĆ SIĘ (Z) – WYJŚĆ (ZA) WYŻSZY – NIŻSZY ....................

Semantyka leksykalna Antonimia PRAWDA – FAŁSZ KRÓTKI – DŁUGI TAKI SAM (JAK) – RÓŻNY (OD) OŻENIĆ SIĘ – ROZWIEŚĆ SIĘ WESOŁY – SMUTNY .....................

DOM: ‘budynek’, ‘mieszkanie’, ‘rodzina’, ‘gospodarstwo’, ‘ród’ Semantyka leksykalna Wieloznaczność DOM: ‘budynek’, ‘mieszkanie’, ‘rodzina’, ‘gospodarstwo’, ‘ród’ PISAĆ: ‘utrwalać znaki na papierze’, ‘tworzyć’, ‘komunikować na piśmie’, ‘malować (ikony)’ PŁYWAK: ..... O: ..... SZARY: .....

Semantyka leksykalna Relacje niesemantyczne stylistyczne: UMRZEĆ – ODEJŚĆ – ZEJŚĆ – WYKITOWAĆ – ZGASNĄĆ socjalne: WIĘZIENIE – PIERDEL – ZAKŁAD KARNY terytorialne: KARTOFLE – GRULE – PYRY chronologiczne: SAMOCHÓD – AUTOMOBIL idiolektalne: ...............

Leksykografia Leksykologia – podstawa leksykografii Leksykografia: (a) teoria słowników (= nauka), (b) inżynieria budowy słowników (= rzemiosło), (c) wydawanie słowników (= przemysł)

Leksykografia Literatura Grochowski M., Zarys leksykologii i leksykografii, Toruń 1982. Bańko M., Z pogranicza leksykografii i językoznawstwa, Warszawa 2001. Żmigrodzki P., Wprowadzenie do leksykografii polskiej, Katowice 2003.

Słownik Słownik: kolekcja artykułów hasłowych podana w jakimś porządku (niekoniecznie alfabetycznym). Słowniki różnią się: koncepcją artykułu hasłowego („Co jest hasłem?”) ogólną zawartością artykułu hasłowego („Co mówi artykuł hasłowy?”) liczbą i doborem artykułów hasłowych – siatką haseł („Ile i jakie?”) adresatem („Dla kogo?”) celem („Po co?”).

Słownik Nie są słownikami w sensie lingwistycznym spisy słów dla krzyżówkowiczów „słowniczki” do spell checkerów słowniki encyklopedyczne słowniki terminów zawodowych encyklopedie Słownik w sensie lingwistycznym: taki, że artykuł hasłowy odpowiada jakiejś jednostce języka.

Leksykografia jednojęzyczna i dwu-(wielo-)języczna Słownik Leksykografia jednojęzyczna i dwu-(wielo-)języczna (1L//2L-lexicography). Podstawa: wielki jednojęzyczny słownik ogólny. Słowniki pochodne: - średni//mały słownik ogólny - słowniki specjalne: ortoepiczny, wyrazów obcych, ortograficzny, frazeologiczny, synonimów, ................ - słowniki dwu- i wielojęzyczne

Parametry słownikowe hasło artykuł hasłowy nazwa hasła głowa hasła kwalifikator informacja fleksyjna informacja składniowa znaczenie // podznaczenie definicja ilustracja empiryczna idiomatyka

KSJP

KSJP Nazwa hasła Hasło: PŁYWAK

Głowa hasła KSJP

Informacja fleksyjna KSJP

KSJP Definicje Znaczenia Podznaczenia

KSJP Ilustracja empiryczna Kwalifikatory

Informacja składniowa ISJP

Idiomatyka SJP Dor.

CIDE CIDE (1995)

Warsztat współczesnego leksykografa korpus zrównoważony narzędzia przeszukiwania komercyjne oprogramowanie leksykograficzne (baza danych, narzędzie sporządzania konkordancji, edytor haseł) konwerter bazy danych na podstawę tekstową wydruku (SGML) oprogramowanie automatycznej korekty

Korpusy British National Corpus Collins COBUILD: Corpus Concordance Sampler Český Národní Korpus Korpus IPIPAN Korpus PWN Narzędzia wyszukiwania

COBUILD 1987

COBUILD

Korpus PWN Dostęp: http://korpus.pwn.pl/ (wersja demonstracyjna) Korpus Języka Polskiego PWN, płyta CD, Warszawa 2003 (7 mln: PWN + „Rzeczpospolita”) Pełny korpus sieciowy (oferta komercyjna)

Korpus PWN

Korpus PWN

Korpus PWN Konkordancja

Perspektywy leksykografii Leksykografia w Polsce UE – perspektywy obiecujące!!! Jest rynek pracy dla polonistów...

Podsumowanie Leksykologia: opis JS. JS: proste (leksemy) i złożone (leksemy „nieciągłe”, idiomy, kolokacje). Różne typologie JS. Semantyka leksykalna. Rózne szkoły. Relacje semantyczne: synonimia – bliskoznaczność – antonimia - konwersja. Leksykografia: nauka – rzemiosło – komercja. Tworzenie wielkiego słownika ogólnego: budowa korpusu – narzędzia przetwarzania korpusu – konwerter „baza danych => tekst”). Leksykografia – ważny rynek pracy dla humanistów, informatyków i wydawców.