Wstęp do językoznawstwa synchronicznego 3003-11A1WS Filologia polska, I rok * 2014/2015 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego.

Slides:



Advertisements
Podobne prezentacje
Znaki informacyjne.
Advertisements

Wprowadzenie do informatyki Wykład 6
POWIAT MYŚLENICKI Tytuł Projektu: Poprawa płynności ruchu w centrum Myślenic poprzez przebudowę skrzyżowań dróg powiatowych K 1935 i K 1967na rondo.
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
WYKŁAD 6 ATOM WODORU W MECHANICE KWANTOWEJ (równanie Schrődingera dla atomu wodoru, separacja zmiennych, stan podstawowy 1s, stany wzbudzone 2s i 2p,
Ludwik Antal - Numeryczna analiza pól elektromagnetycznych –W10
Liczby pierwsze.
Domy Na Wodzie - metoda na wlasne M
1 mgr inż. Sylwester Laskowski Opiekun Naukowy: prof. dr hab. inż. Andrzej P. Wierzbicki.
1 Stan rozwoju Systemu Analiz Samorządowych czerwiec 2009 Dr Tomasz Potkański Z-ca Dyrektora Biura Związku Miast Polskich Warszawa,
(na podstawie badań ankietowych)
Ksantypa2: Architektura
Systemy operacyjne Copyright, 2000 © Jerzy R. Nawrocki Wprowadzenie do informatyki.
PREPARATYWNA CHROMATOGRAFIA CIECZOWA.
Podstawowe pojęcia akustyki
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
1. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
2. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
UKŁADY SZEREGOWO-RÓWNOLEGŁE
1. Wprowadzenie do nauki o języku A1NJ
3. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
2. W PROWADZENIE DO NAUKI O JĘZYKU A1NJ * 3003-K1A1NJ S TUDIA STACJONARNE 2011/2012 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego.
E-learning czy kontakt bezpośredni w szkoleniu nowych użytkowników bibliotek uczelni niepaństwowych? EFEKTYWNOŚĆ OBU FORM SZKOLENIA BIBLIOTECZNEGO W ŚWIETLE.
Klasyfikacja systemów
Transformacja Z (13.6).
Opracował: Zespół Humanistyczny. Klasa Średnia ww - wielokrotnego wyboru (na 20 p) Średnia KO - krótkie odpowiedzi (na 10 p) Średnia za zaproszenie (na.
Pytania konkursowe.
Jak wypadliśmy na maturze z matematyki w 2010 roku?
Ogólnopolski Konkurs Wiedzy Biblijnej Analiza wyników IV i V edycji Michał M. Stępień
Agnieszka Jankowicz-Szymańska1, Wiesław Wojtanowski1,2
Wyrażenia algebraiczne
Raport z badań termowizyjnych – RECTICEL Rys. 1a. Rozdzielnia RS14 Temperatura maksymalna 35,27 o C Rys. 1b. Rozdzielnia RS14 (wizyjny) 3.
Podstawy automatyki 2012/2013Transmitancja widmowa i charakterystyki częstotliwościowe Mieczysław Brdyś, prof. dr hab. inż.; Kazimierz Duzinkiewicz, dr.
Wskazówki konkursowe.
Galeria zdjęć Projekt edukacyjny „Wiem, co jem” realizowany w ramach
1/34 HISTORIA BUDOWY /34 3/34 6 MAJA 2011.
KOLEKTOR ZASOBNIK 2 ZASOBNIK 1 POMPA P2 POMPA P1 30°C Zasada działanie instalacji solarnej.
Podstawy działania wybranych usług sieciowych
EGZAMIN GIMNAZJALNY W SUWAŁKACH 2009 Liczba uczniów przystępująca do egzaminu gimnazjalnego w 2009r. Lp.GimnazjumLiczba uczniów 1Gimnazjum Nr 1 w Zespole.
Analiza wpływu regulatora na jakość regulacji (1)
Wskazówki konkursowe.
w ramach projektu Szkoła z Klasą 2.0
1. Pomyśl sobie liczbę dwucyfrową (Na przykład: 62)
1.
Wolfek,Mario, Kamila,Natalia i Zibi in Zachód słońca na Malcie przed imprą
1. ŁATWOŚĆ ZADANIA (umiejętności) 2. ŁATWOŚĆ ZESTAWU ZADAŃ (ARKUSZA)
11. Wiedza o języku Studia Podyplomowe „Polski Język Migowy” 2013/2014
-17 Oczekiwania gospodarcze – Europa Wrzesień 2013 Wskaźnik > +20 Wskaźnik 0 a +20 Wskaźnik 0 a -20 Wskaźnik < -20 Unia Europejska ogółem: +6 Wskaźnik.
+21 Oczekiwania gospodarcze – Europa Grudzień 2013 Wskaźnik > +20 Wskaźnik 0 do +20 Wskaźnik 0 do -20 Wskaźnik < -20 Unia Europejska ogółem: +14 Wskaźnik.
EcoCondens Kompakt BBK 7-22 E.
EcoCondens BBS 2,9-28 E.
Programowanie w języku C++
W2 Modelowanie fenomenologiczne I
Projekt Badawczo- Rozwojowy realizowany na rzecz bezpieczeństwa i obronności Państwa współfinansowany ze środków Narodowego Centrum Badań i Rozwoju „MODEL.
User experience studio Użyteczna biblioteka Teraźniejszość i przyszłość informacji naukowej.
Testogranie TESTOGRANIE Bogdana Berezy.
Jak Jaś parował skarpetki Andrzej Majkowski 1 informatyka +
Dr hab. Renata Babińska- Górecka
Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego
Systemy dynamiczne 2014/2015Obserwowalno ść i odtwarzalno ść  Kazimierz Duzinkiewicz, dr hab. in ż. Katedra In ż ynierii Systemów Sterowania 1 Obserwowalność.
1 Używanie alkoholu i narkotyków przez młodzież szkolną w województwie opolskim w 2007 r. Na podstawie badań przeprowadzonych przez PBS DGA (w pełni porównywalnych.
Kalendarz 2020.
Współrzędnościowe maszyny pomiarowe
Elementy geometryczne i relacje
Strategia pomiaru.
Spotkanie 5 Poliqarp.. Znakowanie – tagging Narzędzie do znakowania – tager Znakowanie: przypisywanie jednostkom tekstowym jakichś kodów (tagów): 1. lokalizacja.
10. Wiedza o języku Studia Podyplomowe „Polski Język Migowy”
Spotkanie 5 Poliqarp.. Znakowanie – tagging Narzędzie do znakowania – tager Znakowanie: przypisywanie jednostkom tekstowym jakichś kodów (tagów): 1. lokalizacja.
Zapis prezentacji:

Wstęp do językoznawstwa synchronicznego A1WS Filologia polska, I rok * 2014/2015 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego Instytut Języka Polskiego UW Konsultacje w pok. 1: środa Strona przedmiotu — szukaj pod:

2 Program 1.Przedmiot językoznawstwa. 2.Cechy definicyjne języka naturalnego. 3.Struktura języka I: słownik i morfologia.. 4.Struktura języka II: składnia. 5.Formalne rozumienie języka. Lingwistyka formalna i informatyczna. 6.Komunikacja językowa. 7.Podstawy leksykologii. Leksykografia. 8.Słowniki – analiza zawartości, klasyfikacja. 9.Zróżnicowanie języków świata. Podstawy typologii. 10.Typy badań lingwistycznych. 11.Kolokwium.

3 Zadanka Trzy przykładowe opozycje w zbiorze znaków drogowych:

4 Zadanka (1)żółć(czteroliterowe) (2)……….(trzyliterowe)

5 Zadanka (1)żółć(czteroliterowe) (2)łóż(trzyliterowe) (3)łżę (4)łżą (5)żąć (6)żął (7)żęć

6 Temat 2 Cechy definicyjne języka naturalnego

7 Modelowanie Jak opisać JN — strukturalnie? Model — urządzenie funkcjonujące jak oryginał.  Co jest tym oryginałem (= obiektem opisu)? Umowa: JN  NS.  Co modelujemy? Kompetencję idealnego NS’a, czyli umiejętność: a.odróżniania wyrażeń poprawnych od niepoprawnych, b.interpretowania (  rozumienia) wyrażeń poprawnych, c.wytwarzania wyrażeń poprawnych.

8 Poprawność a sensowność Zdanie poprawne nie musi być sensowne: Wyrażenie sensowne nie musi być zdaniem poprawnym:

9 Poprawność a sensowność Ten kawaler ma za żonę bezdzietną matkę. Wyrażenie sensowne nie musi być zdaniem poprawnym:

10 Poprawność a sensowność Ten kawaler ma za żonę bezdzietną matkę. Wyrażenie sensowne nie musi być zdaniem poprawnym: *Kali nie bać tygrys.

11 Opis (= model) języka naturalnego Opis JN to — przy pewnych założeniach — jego gramatyka. Jest konwencjonalny i arbitralny. Model to idealizacja: wyostrzenie uogólnienie uproszczenie Istnieje nieograniczenie wiele poprawnych modeli (= opisów) danego JN.

12 Dane empiryczne Opisywany obiekt to czarna skrzynka. Językoznawca potrzebuje danych empirycznych. Dane:  teksty rzeczywiste,  teksty preparowane,  sądy NS’a o nich. Zbiór tekstów – korpus.

13 Korpusy tekstów Jaki udział prasy w korpusie? to jest Poliqarp? Rozwiąż skrót! PELCRA??? LOB CorpusCo to? Gdzie? Kiedy? BNC (British National Corpus).....

14 Polish and English Language Corpora for Research and Applications POLyInterpretation Query And Retrieval Processor KWIC – KeyWord In Context

15

16

17

18

19 Tekst Tekst – wytwór NS’a: produkt kompetencji językowej. Rozróżnienie langue – parole (F. de Saussure) mowa – mówienie system – tekst

20 System a tekst System:jeden jedyny abstrakcyjny zamknięty pozaczasowy Tekst: jeden z bardzo wielu dostępny zmysłom będący elementem zbioru otwartego zlokalizowany w czasie i przestrzeni linearny

21 Teksty i ich typologia Teksty:  mówione  pisane  (śpiewane)  brajlowskie  owe  sms-owe  Reprezentują one odmiany diakrytyczne JN.

22 Dwu-(trój-)poziomowość znaku Znak ma: kształt (formę) treść (funkcję) Składniki kształtu znaku – cegiełki asemantyczne: diakryty. Hierarchia składników tekstu: diakryty znaki proste znaki złożone

23 Jan szuka po omacku

24 Diakryty Diakryty języka naturalnego: głoski, allofony, fonemy litery, grafemy „sześciopunkty” Ale także: elementy składowe „cegiełek”: piksele, krzywe, pociągnięcia pędzla,..., cechy artykulacyjne lub akustyczne,...

25 Zadanie empirysty: analiza tekstu Cele:  sporządzenie listy znaków prostych,  rekonstrukcja sieci opozycji,  [w tym ograniczeń łączliwości – dystrybucja składników]. Procedury analityczne:  segmentacja,  substytucja,  hipotezy analogii.

26 Okaz i typ Jednostki tekstu (= obiekty konkretne) reprezentują jednostki systemu (= obiekty abstrakcyjne) JT – okaz (token), JS – typ (type). Jakie JS są reprezentowane przez następujące JT: –mamami, MAMAMI, mamami –kot, kota, kotu –kupić, napisać, jeść –Kto przyszedł?, Umrzesz ty., Wszyscy tu wczoraj rzygali.

27 Badania empiryczne Empirysta ogląda próbki (okazy) widzi typy opisuje typy

28 Segmentacja Jaświdziałwczorajżukazczarnymiskrzydełkami wtedyśmystanęliwpoprzekjezdni żydkarabinnosi

29 Segmentacja Jaś widział wczoraj żuka z czarnymi skrzydełkami wtedyśmy stanęli w poprzek jezdni żyd karabin nosi // żydka rabin nosi

30 Substytucja Równoważność dystrybucyjna = swobodna wymienność Polowanie na opozycję – szukanie par minimalnych.

31 Kłopoty z parami minimalnymi 1.Znaki zerowe Intuicja:  STOP za pomocą lizaka  opozycja :  Suwałki : Suwałk

32 Kłopoty z parami minimalnymi  Ale: Wiem, że wczoraj czytał książkę. Żeby dziś czytał książkę… Czyta po francusku.  żeby, *że-   *wczoraj- , *dziś- , *po-   Czytał-  - 

33 2.Wariancja (= synomimia) Kształt1  Kształt2, ale Znaczenie1 = Znaczenie2 Ogólniej: Kształt1  Kształt2, ale Funkcja1= Funkcja2

34 (profesorz)y – (profesor)owie taksiarz – złotówa – taryfiarz - taryfa Masz czas? – Czy masz czas? Wariancja – zabezpieczenie systemu. Problem: które różnice kształtu są funkcjonalnie istotne (= relewantne)?

35 =

36 3.Neutralizacja (= honomimia, wieloznaczność, polisemia) Kształt1 = Kształt2, ale Znaczenie1  Znaczenie2 Ogólniej: Kształt1 = Kształt2, ale Funkcja1  Funkcja2

37 dziewczyny mam Strzeż kolegi ojca. Neutralizacja opozycji – defekt systemu. Wszystkie JN mają ten defekt!!!

38 Zepsuty semafor

39

40

41 Hipoteza analogii Zadanie: wymyślić przykłady

42 Strukturyzacja Narysować drzewo zależności

43 Problem składników elementarnych Z czego jest zrobiony (lub: robi się) tekst: a.z liter, głosek lub sylab,DIAKRYTY b.z morfemów,ZNAKI c.ze słów, d.z fraz, e.ze zdań, f.z wypowiedzeń?

44 Nasi nowi fleciści, których wysłano na urlop, powiedzieli swemu dyrygentowi, że nie wrócą.

45 Ad a.: diakryty, czyli litery głoski sylaby

46 Tekstu nie robi się z diakrytów!!! Opis diakrytów nie należy do gramatyki.

47 Ad b.-f.: znaki Morfemy Słowa

48 Frazy a. onasi nowi fleciści, których wysłano na urlop, opowiedzieli oswemu dyrygentowi o, że nie wrócą b. onasi nowi fleciści o, których wysłano na urlop

49 onasi onowi fleciści onowi ofleciści októrych owysłano ona urlop ona ourlop oswemu odyrygentowi

50 Zdania  nasi nowi fleciści, których wysłano na urlop, powiedzieli swemu dyrygentowi, że nie wrócą , których wysłano na urlop , że nie wrócą

51 Konstrukcje Znak złożony to konstrukcja. Podstawowy problem: łączliwość, czyli dystrybucja. Dwa typy konstrukcji: -konstrukcje morfologiczne, -konstrukcje składniowe. Rekurencja. Gramatyka JN „typu polszczyzny”: - morfologia, - składnia.

52 Konstrukcje morfologiczne Tematy: SŁOWOTWÓRSTWO Formy wyrazowe: FLEKSJA

53 Konstrukcje składniowe Frazy: SKŁADNIA Zdania:SKŁADNIA

54 Podsumowanie 1.Językoznawca opisuje kompetencję językową NS’a, czyli buduje model JN. 2.Opis JN to jego gramatyka. 3.Dane empiryczne: korpus tekstów. 4.Znaki mają trzy poziomy struktury: [diakryt –] znak prosty – znak złożony. 5.Poziomy abstrakcji: okazy i typy. 6.Rozbieżności między kształtem a znaczeniem: wariancja i neutralizacja. 7.Dwa typy konstrukcji (czyli: znaków złożonych): konstrukcje morfologiczne i konstrukcje składniowe. 8.Gramatyka języka polskiego obejmuje morfologię i składnię.