Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego

Slides:



Advertisements
Podobne prezentacje
I część 1.
Advertisements

Lingwistyka Matematyczna
Nowa” Matura 2015 Języki obce
Wzór w notacji nawiasowej: a*(d*i*(k*o-l*n)-e*h*(k*o-l*n))+f*i*j*n
II Relacje i relacje równoważności
Wprowadzenie do informatyki Wykład 6
Gambit Centrum Oprogramowania i Szkoleń Sp. z o.o Kraków, al.Pokoju 29B/ Autoryzowany dystrybutor Thomson-Reuters.
PODSTAWY MARKETINGU Ćwiczenia nr 1.
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
WYKŁAD 6 ATOM WODORU W MECHANICE KWANTOWEJ (równanie Schrődingera dla atomu wodoru, separacja zmiennych, stan podstawowy 1s, stany wzbudzone 2s i 2p,
Liczby pierwsze.
PREZENTACJA ZASOBÓW INFORMACYJNYCH BAZY GŁÓWNEGO URZĘDU STATYSTYCZNEGO URZĄD STATYSTYCZNY W ŁODZI Łódź, 10 grudnia 2010 r.
1 Stan rozwoju Systemu Analiz Samorządowych czerwiec 2009 Dr Tomasz Potkański Z-ca Dyrektora Biura Związku Miast Polskich Warszawa,
KONKURS WIEDZY O SZTUCE
Systemy operacyjne Copyright, 2000 © Jerzy R. Nawrocki Wprowadzenie do informatyki.
Warsztat informacyjny biblioteki
Inteligentne Systemy Informacyjne
Podstawowe pojęcia akustyki
ENCYKLOPEDIE I SŁOWNIKI
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
JAK KORZYSTAĆ Z ENCYKLOPEDII I SŁOWNIKÓW?
1. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
UKŁADY SZEREGOWO-RÓWNOLEGŁE
Przykładowe zastosowania równania Bernoulliego i równania ciągłości przepływu 1. Pomiar ciśnienia Oznaczając S - punkt spiętrzenia (stagnacji) strugi v=0,
6. Wprowadzenie do nauki o języku A1NJ
1. Wprowadzenie do nauki o języku A1NJ
4. Wprowadzenie do nauki o języku A1NJ
Transformacja Z (13.6).
RODZAJE WYDAWNICTW INFORMACYJNYCH
WARSZTAT INFORMACYJNY BIBLIOTEKI
SŁOWNIKI.
Wykonawcy:Magdalena Bęczkowska Łukasz Maliszewski Piotr Kwiatek Piotr Litwiniuk Paweł Głębocki.
Słowniki Autor prezentacji
Projektowanie Stron WWW
Wyrażenia algebraiczne
„Rynek pracy w powiecie trzebnickim: struktura bezrobocia i miejsca pracy.”
ENCYKLOPEDIE I SŁOWNIKI
KALENDARZ 2011r. Autor: Alicja Chałupka klasa III a.
Poszukiwanie informacji w bibliotece oprac. Iwona Basak
1/34 HISTORIA BUDOWY /34 3/34 6 MAJA 2011.
Podstawy adresowania hostów w sieciach komputerowych
Podstawy działania wybranych usług sieciowych
Analiza wpływu regulatora na jakość regulacji (1)
Analiza wpływu regulatora na jakość regulacji
Wskazówki konkursowe.
Kalendarz 2011r. styczeń pn wt śr czw pt sb nd
1.
WordNet WordNet to duża leksykalna baza języka angielskiego. Grupuje ona rzeczowniki, czasowniki, przymiotniki i przysłówki w zestawy kognitywnych (poznawczych)
11. Wiedza o języku Studia Podyplomowe „Polski Język Migowy” 2013/2014
  Prof.. dr hab.. Janusz A. Dobrowolski Instytut Systemów Elektronicznych, Politechnika Warszawska.
-17 Oczekiwania gospodarcze – Europa Wrzesień 2013 Wskaźnik > +20 Wskaźnik 0 a +20 Wskaźnik 0 a -20 Wskaźnik < -20 Unia Europejska ogółem: +6 Wskaźnik.
+21 Oczekiwania gospodarcze – Europa Grudzień 2013 Wskaźnik > +20 Wskaźnik 0 do +20 Wskaźnik 0 do -20 Wskaźnik < -20 Unia Europejska ogółem: +14 Wskaźnik.
Encyklopedie i słowniki jako źródła informacji
W2 Modelowanie fenomenologiczne I
Interakcja człowiek – komputer Podstawy metod obiektowych mgr inż. Marek Malinowski Zakład Matematyki i Fizyki Wydz. BMiP PW Płock.
RODZAJE WYDAWNICTW INFORMACYJNYCH
Obliczalność czyli co da się policzyć i jak Model obliczeń sieci liczące dr Kamila Barylska.
ZOSTAŃ SPORTOWYM KOKSEM SP 11 TYM KTÓRY OCZARUJE KOMISJĘ SĘDZIOWSKĄ.
ANALIZA EGZAMINU GIMNAZJALNEGO 2014 GIMNAZJUM IM. JANA PAWŁA II W BOGUSZYCACH.
Treści multimedialne - kodowanie, przetwarzanie, prezentacja Odtwarzanie treści multimedialnych Andrzej Majkowski informatyka +
Encyklopedie i słowniki jako podstawowe źródło informacji Oprac
Kalendarz 2020.
Elementy geometryczne i relacje
ZDYSCYPLINOWANY OPIS JĘZYKÓW NATURALNYCH Proseminarium doktoranckie 2014/2015, semestr letni Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego.
Spotkanie 5 Poliqarp.. Znakowanie – tagging Narzędzie do znakowania – tager Znakowanie: przypisywanie jednostkom tekstowym jakichś kodów (tagów): 1. lokalizacja.
10. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
9. Wiedza o języku Studia Podyplomowe „Polski Język Migowy” 2013/2014
Spotkanie 5 Poliqarp.. Znakowanie – tagging Narzędzie do znakowania – tager Znakowanie: przypisywanie jednostkom tekstowym jakichś kodów (tagów): 1. lokalizacja.
Biblioteka Zespołu Szkół nr 2 w Mławie opracowała Renata Jurczyńska.
Kształtowanie kompetencji komunikacyjnych wiedza o języku w szkole podstawowej i gimnazjum.
Zapis prezentacji:

Wstęp do językoznawstwa synchronicznego 3003-11A1WS Filologia polska, I rok * 2014/2015 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego Instytut Języka Polskiego UW e-mail: m.r.swidzinski@uw.edu.pl Konsultacje w pok. 1: środa 14.00-15.00 Strona przedmiotu — szukaj pod: www.mswidz.republika.pl/

Program Przedmiot językoznawstwa. Cechy definicyjne języka naturalnego.  Struktura języka I: słownik i morfologia. Struktura języka II: składnia.  Komunikacja językowa. Podstawy leksykologii. Leksykografia. Formalne rozumienie języka. Lingwistyka formalna i informatyczna. Zróżnicowanie języków świata. Podstawy typologii. Typy badań lingwistycznych. Kolokwium.

Podstawy leksykologii. Leksykografia. Wykład 6 Podstawy leksykologii. Leksykografia.

Przypomnienie Kompetencja językowa: znajomość słownika i gramatyki. Słownik to zbiór pewnych jednostek (= haseł słownikowych); głównie – leksemów. Leksem – zbiór form wyrazowych mających to samo odniesienie do rzeczywistości (= znaczenie). Leksemy identyfikuje się i klasyfikuje na podstawie cech gramatycznych. Utrwalona fizycznie postać słownika: leksykon.

Użytkownik identyfikuje i pamięta JS: Jednostki słownika Użytkownik identyfikuje i pamięta JS: jako kształty jako pakiety cech semantycznych jako komplety cech gramatycznych JS to: leksemy pewne klasy wyrażeń

Leksykologia Leksykologia – dziedzina językoznawstwa zajmująca się opisem zasobu JS. Dla gramatyka: istotne własności gramatyczne (= morfologiczne i składniowe) JS. Dla leksykologa (i leksykografa): istotne własności semantyczne.

Porządkowanie zbioru JS Klasyfikacje JS Porządkowanie zbioru JS według cech gramatycznych (klasy gramatyczne) według cech semantycznych (pola semantyczne, semantyka składnikowa; synonimia, hiponimia, antonimia, konwersja; wieloznaczność) według cech pozalingwistycznych (warianty stylistyczne, socjalne, terytorialne, chronologiczne, idiolektalne)

Znaczenie a oznaczanie Semantyka Znaczenie a oznaczanie [Znaczenie – prymarnie: to, co wynika z danego wyrażenia (to, co wyrażenie mówi bezpośrednio). Semantyka zdaniowa] JS ma pewną strukturę semantyczną. Jest to przedmiotem semantyki leksykalnej. Znaczenie JS – wtórne w stosunku do znaczenia wyrażeń: da się wywnioskować ze znaczenia wyrażenia. oznaczanie (denotacja) – relacja między wyrażeniem a klasą obiektów rzeczywistych referencja (odniesienie) – relacja między aktem mowy a konkretnym fragmentem rzeczywistości.

Semantyka leksykalna Semantyka leksykalna formułuje definicje JS – główny komponent słownika jako kompendium. PISAĆ «kreślić na papierze lub innym materiale znaki graficzne (litery, cyfry itp.) ręcznie lub odbijać je za pomocą maszyny dla wyrażenia czegoś słowami»] «tworzyć, układać co na piśmie, np. jakiś artykuł, jakieś dzieło literackie, naukowe; komponować» «formułować, ujmować swoje myśli na piśmie, utrwalać je za pomocą pisma» «donosić, komunikować coś na piśmie lub w druku» zwykle w imiesł. przymiotnikowym biernym, przestarz. «malować we wzory, zdobić rysunkami, deseniami itp.»

Semantyka leksykalna Różne szkoły semantyki leksykalnej Pola semantyczne: Jost Trier, Walter Porzig Semantyka składnikowa: Manfred Bierwisch Semantyka sensów elementarnych: Anna Wierzbicka, Andrzej Bogusławski, Igor Mielczuk Tezaurus: zbiór tematyczny JS

Semantyka leksykalna Relacje semantyczne w zbiorze JS Synominia mocna: równoznaczność JS1 i JS2 LINGWISTYKA – JĘZYKOZNAWSTWO UMRZEĆ – SKONAĆ DUŻY – WIELKI KARTOFLE – ZIEMNIAKI DOZORCA – CIEĆ .........

Semantyka leksykalna słaba: bliskoznaczność JS1 i JS2 ZESTAW – KOLEKCJA – ZBIÓR BAĆ SIĘ – TRZĄŚĆ PORTKAMI – OBAWIAĆ SIĘ MĄDRY – ROZUMNY – ROZSĄDNY ......... Niemożliwe do zdefiniowania...

Semantyka leksykalna Hiponimia (inkluzja) WRÓBEL – PTAK MATKA – KOBIETA – CZŁOWIEK POWIEDZIEĆ – ZAKOMUNIKOWAĆ OGROMNY – DUŻY ZIMA – PORA ROKU – OKRES ..................... Kohiponimia

Semantyka leksykalna Konwersja OJCIEC – SYN OŻENIĆ SIĘ (Z) – WYJŚĆ (ZA) WYŻSZY – NIŻSZY ....................

Semantyka leksykalna Antonimia PRAWDA – FAŁSZ KRÓTKI – DŁUGI TAKI SAM (JAK) – RÓŻNY (OD) OŻENIĆ SIĘ – ROZWIEŚĆ SIĘ WESOŁY – SMUTNY .....................

DOM: ‘budynek’, ‘mieszkanie’, ‘rodzina’, ‘gospodarstwo’, ‘ród’ Semantyka leksykalna Wieloznaczność DOM: ‘budynek’, ‘mieszkanie’, ‘rodzina’, ‘gospodarstwo’, ‘ród’ PISAĆ: ‘utrwalać znaki na papierze’, ‘tworzyć’, ‘komunikować na piśmie’, ‘malować (ikony)’ PŁYWAK: ..... O: ..... SZARY: .....

Semantyka leksykalna Relacje niesemantyczne stylistyczne: UMRZEĆ – ODEJŚĆ – ZEJŚĆ – WYKITOWAĆ – ZGASNĄĆ socjalne: WIĘZIENIE – PIERDEL – ZAKŁAD KARNY terytorialne: KARTOFLE – GRULE – PYRY chronologiczne: SAMOCHÓD – AUTOMOBIL idiolektalne: ...............

Leksykografia Leksykologia – podstawa leksykografii Leksykografia: (a) teoria słowników (= nauka), (b) inżynieria budowy słowników (= rzemiosło), (c) wydawanie słowników (= przemysł)

Leksykografia Literatura Grochowski M., Zarys leksykologii i leksykografii, Toruń 1982. Bańko M., Z pogranicza leksykografii i językoznawstwa, Warszawa 2001. Żmigrodzki P., Wprowadzenie do leksykografii polskiej, Katowice 2003.

Słownik Słownik: kolekcja artykułów hasłowych podana w jakimś porządku (niekoniecznie alfabetycznym). Słowniki różnią się: koncepcją artykułu hasłowego („Co jest hasłem?”) ogólną zawartością artykułu hasłowego („Co mówi artykuł hasłowy?”) liczbą i doborem artykułów hasłowych – siatką haseł („Ile i jakie?”) adresatem („Dla kogo?”) celem („Po co?”).

Słownik Nie są słownikami w sensie lingwistycznym spisy słów dla krzyżówkowiczów „słowniczki” do spell checkerów słowniki encyklopedyczne słowniki terminów zawodowych encyklopedie Słownik w sensie lingwistycznym: taki, że artykuł hasłowy odpowiada jakiejś jednostce języka.

Leksykografia jednojęzyczna i dwu-(wielo-)języczna Słownik Leksykografia jednojęzyczna i dwu-(wielo-)języczna (1L//2L-lexicography). Podstawa: wielki jednojęzyczny słownik ogólny. Słowniki pochodne: - średni//mały słownik ogólny - słowniki specjalne: ortoepiczny, wyrazów obcych, ortograficzny, frazeologiczny, synonimów, ................ - słowniki dwu- i wielojęzyczne

Parametry słownikowe hasło artykuł hasłowy nazwa hasła głowa hasła kwalifikator informacja fleksyjna informacja składniowa znaczenie // podznaczenie definicja ilustracja empiryczna idiomatyka

KSJP

KSJP Nazwa hasła Hasło: PŁYWAK

Głowa hasła KSJP

Informacja fleksyjna KSJP

KSJP Definicje Znaczenia Podznaczenia

KSJP Ilustracja empiryczna Kwalifikatory

Informacja składniowa ISJP

Idiomatyka SJP Dor.

CIDE CIDE (1995)

Warsztat współczesnego leksykografa korpus zrównoważony narzędzia przeszukiwania komercyjne oprogramowanie leksykograficzne (baza danych, narzędzie sporządzania konkordancji, edytor haseł) konwerter bazy danych na podstawę tekstową wydruku (SGML) oprogramowanie automatycznej korekty

COBUILD 1987

COBUILD

Korpus PWN

Korpus PWN

Korpus PWN Konkordancja

Perspektywy leksykografii Leksykografia w Polsce UE – perspektywy obiecujące!!! Jest rynek pracy dla polonistów...

Podsumowanie Leksykologia: opis JS. JS: proste (leksemy) i złożone (leksemy „nieciągłe”, idiomy, kolokacje). Różne typologie JS. Semantyka leksykalna. Rózne szkoły. Relacje semantyczne: synonimia – bliskoznaczność – antonimia - konwersja. Leksykografia: nauka – rzemiosło – komercja. Tworzenie wielkiego słownika ogólnego: budowa korpusu – narzędzia przetwarzania korpusu – konwerter „baza danych => tekst”). Leksykografia – ważny rynek pracy dla humanistów, informatyków i wydawców.