Parsery języka naturalnego Jakub Mikulski

Slides:



Advertisements
Podobne prezentacje
The Present Continuous
Advertisements

Logiki (nie)klasyczne
OPERATORY WYSZUKIWAWCZE
Zastosowanie pamięci semantycznej we wspomaganiu decyzji medycznych
XML. Pierwszy dokument XML Witaj świecie! Elementy i atrybuty niezwykle oryginalny Witaj świecie! Druga możliwość: Witaj świecie!
LIWC2001 Linguistic Inquiry and Word Count () LIWC2001 Linguistic Inquiry and Word Count (James W. Pennebaker Martha E. Francis & Roger J Booth;
Google – sposoby wyszukiwania
GRAMATYKA Zastosowanie czasowników SHOULD i OUGHT TO.
ZASTOSOWANIE CZASU PAST SIMPLE:
Strategia skutecznego szukania informacji w Internecie
Autor:Ada Turek klasa 6a SP 6 w Sosnowcu
Język angielski czasy PRESENT Continuous NACIŚNIJ SPACJĘ
Present Simple vs. Present Continuous
Język angielski czasy PRESENT SIMPLE NACIŚNIJ SPACJĘ Zdiełał piotrp 
Język angielski czasy PAST SIMPLE NACIŚNIJ SPACJĘ Zdiełał piotrp 
Egzamin maturalny ustny z języka obcego obowiązujący od roku szkolnego 2011/2012 Prezentacja przygotowana na podstawie informacji zawartych w informatorze.
Szyk wyrazów w zdaniu angielskim
Present simple vs Present continuous
Wskazówki dotyczące pisania tekstów
Present perfect, past continous, past simple i future simple.
Języki i automaty część 3.
XML – eXtensible Markup Language
Present continuous tense
Music: Nightengale Serenade
WordNet WordNet to duża leksykalna baza języka angielskiego. Grupuje ona rzeczowniki, czasowniki, przymiotniki i przysłówki w zestawy kognitywnych (poznawczych)
SZKOŁA Z KLASĄ 2.0 English SOS.
CZAS PAST SIMPLE.
CZAS PRESENT SIMPLE.
I am sorry, but I can’t go out with you
Gramatyka - przydatna terminologia
CZAS PRZESZŁY DOKONANY
Zasady pisania listu nieformalnego
Podstawy programowania
Katarzyna Zielińska Kinga Bujak Kl. IV TI. Nazywam się Katarzyna a to jest moja koleżanka Kinga. Uczęszczamy razem do Zespołu Szkół Elektoniczno-Telekomunikacyjnych.
Hallo again! Your task is to translate the following sentences paying close attention to : Verb + ing To + infinitive Infinitive.
Zmiany w ustnym egzaminie maturalnym z języków obcych od 2012 roku
Present simple Czas teraźniejszy.
Okres warunkowy typu 0,I,2 Okresy warunkowe występują w takich zdaniach, które mówią, co by się stało, gdyby, jeżeli. Np. Gdybym był bogaty, to bym kupił.
CROSSWORD: SLANG. Konkurs polega na rozwiązaniu krzyżówki. CROSSWORD: SLANG Wypełnione karty odpowiedzi prosimy składać w bibliotece CJK, lub przesyłać.
A, an, the, - Kochamy przedimiki.
A, an, the, - .
Zwrot going to – określa nasze plany na przyszłość lub przewidywania:
Past Simple – czas przeszły
Les meilleures photos de L'année 2005 D'après NBC A life for two, full of tenderness, obtains happiness as they get closer to heaven. Życie we dwoje,
You are about to see a few sentences in Polish. Try to translate them into English, but keep in mind they are: The First Conditonal The Second Conditional.
Hallo again! Your task is to translate the following sentences paying close attention to : Verb + ing To + infinitive Infinitive.
ENGLISH CORNER Kącik języka angielskiego. PRESENT SIMPLE Czas Present Simple stosujemy gdy: 1) opisywana czynność odbywa się regularnie. John often plays.
Przetłumacz podane w nawiasach fragmenty zdań na j. angielski.
My Family Writing. Napisz list do przyjaciela z Anglii, w którym przedstawisz swoją rodzinę. Napisz jak się nazywają i czym się zajmują. Napisz jak wyglądają.
Części mowy Edyta Sawicka.
Zdania okolicznikowe przyczyny clauses of reason.
LET’S EAT! Przygotowała: Aleksandra Hoffmann i Marysia Grzeszyk.
Zdania okolicznikowe przyzwolenia (adverbal clause of concession) wyrażają kontrast, ponieważ mówią o tym, pomimo czego jakaś czynność może lub nie może.
Struktura egzaminu ustnego z języków obcych (bez określania poziomu) ZadanieCzasPunktacja Rozmowa wstępnaok. 2 minut Zadanie.
Www,mojesilnedrzewo.pl. W dniach 15 marca – 30 kwietnia 2010.r.wytwórnia wody mineralnej Żywiec Zdrój SA wspólnie z Fundacją Nasza Ziemia i Regionalną.
13. FAMILY LIFE Życie rodzinne. Family members Członkowie rodziny This is me My father George My mother Jane My grandmother HelenMy grandfather John My.
Co to jest funkcja? Opracowała: Monika Grudzińska - Czerniecka.
Egzamin gimnazjalny z języka angielskiego - poziom podstawowy.
Music: Nightengale Serenade
Music: Nightengale Serenade
CZAS PRESENT CONTINUOUS
11. Work Praca.
13. Family life Życie rodzinne.
Tworzenie zdań i zastosowanie
MOWA ZALEŻNA Mowę zależną stosujemy, kiedy przekazujemy czyjąś wypowiedź pośrednio, nie cytując jej wprost.
Najciekawsze hasła zachęcające do nauki języków obcych
Tworzenie zdań i zastosowanie
Tworzenie zdań i zastosowanie
Czasy: Past continuous
Egzamin ósmoklasisty z języka angielskiego
Zapis prezentacji:

Parsery języka naturalnego Jakub Mikulski

O co chodzi? Odyseja Kosmiczna 2001: „I’m sorry Dave, I’m afraid I can’t do that” Przetwarzanie języka naturalnego (Natural Language Processing, NLP) - cel: umożliwić komputerom korzystanie z języka ludzkiego jako wejścia i wyjścia

Dlaczego rozumienie języka ludzkiego przedstawia problem? Hasło reklamowe McDonnell-Douglas z roku 1985: At last, a computer that understands you like your mother. Komputer rozumie mnie tak dobrze jak moja matka? Komputer rozumie mnie tak dobrze jak moją matkę? Komputer rozumie, że lubię moją matkę? mother 1. A female parent; 2. A cask or vat used in vinegar-making. [Oxford English Dictionary]

Przykładowa komenda systemu obsługi szpitala: Copy the local patient files to disk. Lokalny jest pacjent czy pliki? A może pliki są cierpliwe? ;)

Rozumienie tekstu opiera się na posiadanej przez nas wiedzy o świecie, którego ten tekst dotyczy; dzięki tej wiedzy instynktownie odrzucamy zdania semantycznie niepoprawne bądź mało prawdopodobne, wybierając te, które autor miał na myśli.

Początki NLP Lata 40. i 50. XX wieku - podejście empiryczno-statystyczne, analiza tekstu na podstawie wiedzy zgromadzonej w czasie poprzednich analiz „You shall know a word by the company it keeps”, J.R. Firth r statystycy Mosteller i Williams podejmują próbę ustalenia autorstwa anonimowego zbioru esejów The Federalist Papers na podstawie wzorców słownych występujących w tekście r Warren Weaver proponuje potraktowanie problemu translacji języków jako zastosowania kryptografii - jeden język stanowi zaszyfrowaną formę drugiego

W roku 1957 lingwista Noam Chomsky zauważył, że ani zdanie „Colorless green ideas sleep furiously”, ani też jego odwrotność („Furiously sleep ideas green colorless”) prawdopodobnie w żadnym z angielskich tekstów nie występują. Empiryczno-statystyczne podejście do NLP skazane jest na zatem na klęskę (sparse data problem). W zamian Chomsky zaproponował skoncentrowanie się na zasadach rządzących gramatykami języków naturalnych (knowledge-based approach).

Nawrót do metod empiryczno-statystycznych nastąpił w latach 80. za sprawą sukcesów odnoszonych przez grupę rozpoznawania mowy w IBM. Obecnie oba podejścia są stosowane w szerokim zakresie.

Link Grammar - założenia planarność - linie (łącza) narysowane nad powiązanymi ze sobą słowami nie krzyżują się spójność - łącza wiążą ze sobą wszystkie występujące w zdaniu słowa poprawność - łącza spełniają odpowiednie warunki dla każdego słowa w zdaniu

Przykładowy słownik Dla każdego słowa musi zostać spełnione dokładnie jedno łącze z każdej kropki.

Notacja łączy a the: D+ snake cat: D- & (O- or S+) Mary: O- or S+ ran: S- chased: S- & O+ ‘+’ oznacza łącze prawostronne, ‘-’ lewostronne ‘&’ oznacza koniunkcję warunków - oba muszą zostać spełnione ‘or’ oznacza alternatywę wykluczającą

Link Parser wejście: the quick brown fox jumped over the lazy dog wyjście: Ds Js | A | Ds----+ | | +---A--+---Ss--+--MVp-+ | +--A--+ | | | | | | | | | the quick.a brown.a fox.n jumped.v over the lazy.a dog.n

kategorie łącz: podkategorie - oznaczane są małymi literami dodawanymi do nazw kategorii (duże litery) ‘Ss+’ może połączyć się z ‘S-’ lub ‘Ss-’, ale nie z ‘Sp-’ ‘Spa+’ może połączyć się z ‘S-’, ‘Sp-’ lub ‘Spa-’, ale nie z ‘Ss-’, ‘Ssa-’ ani ‘Spb-’ asterisk ‘*’ zastępuje jeden znak podkategorii: ‘S*a+’ łączy się z ‘S-’, ‘Ss-’, ‘Sp-’ lub ‘Ssa-’, ale nie z ‘Ssb-’

Przykłady Zdania zaznaczone gwiazdką są przez parser odrzucane. Zdania nieoznaczone są akceptowane. The fact/*event that she smiled at me gives me hope. I still remember the day/*room I kissed her. But my efforts/*presents to win her heart have failed. Failure/*Absence to comply may result in dismissal. Last week/*dog I saw a great movie. The party that night/*house was a great success.

She is the kind/*character of person who would do that. John, who is an expert on dogs, helped me choose one. John, an expert on dogs, helped me choose one. *John who is an expert on dogs helped me choose one. The dog that we eventually bought was very expensive. *The dog, that we eventually bought, was very expensive. *The dog, we eventually bought, was very expensive. Have you ever seen the/*a Pacific? The boys’/*boys’s bedrooms will be enlarged. My uncle’s mother’s cousin is visiting us. *John’s my cousin is visiting us.

Memory-Based Shallow Parser składa się z 4 modułów parsery płytkie kładą nacisk na semantykę; dzielą zdanie na zasadzie „KTO CO zrobił Z KIM, KIEDY, JAK etc.”

tokenizer - oddziela znaki przestankowe od słów tagger - przydziela każdemu słowu oznaczenie części mowy chunker - dzieli zdanie na sekwencje blisko powiązanych ze sobą wyrazów subject/object detector - określa, która sekwencja rzeczownikowa stoi w jakiej relacji do danej sekwencji czasownikowej

wejście: the quick brown fox jumped over the lazy dog tagger: the/DT quick/JJ brown/JJ fox/NN jumped/VBD over/IN the/DT lazy/JJ dog/NN DT - determiner JJ - adjective NN - noun (liczba pojedyncza lub rzeczownik niepoliczalny) VBD - verb (czas przeszły) IN - preposition / subordinating conjunction

chunker: [NP the/DT quick/JJ brown/JJ fox/NN NP] [VP jumped/VBD VP] {PNP [Prep over/IN Prep] [NP the/DT lazy/JJ dog/NN NP] PNP} NP - sekwencja rzeczownikowa (noun chunk), od początku frazy rzeczownikowej do rzeczownika głównego VP - sekwencja czasownikowa (verbal chunk); składa się z czasownika głównego, wszystkich jego czasowników modalnych i pomocniczych oraz związanych przysłówków PNP - sekwencja przyimkowa, przyimek wraz z przynajmniej jedną sekwencją rzeczownikową Prep - przyimek (preposition)

subject/object detector: [NP 1 Subject the/DT quick/JJ brown/JJ fox/NN NP 1 Subject ] [VP 1 jumped/VBD VP 1 ] {PNP [P over/IN P] [NP the/DT lazy/JJ dog/NN NP] PNP} sekwencje rzeczownikowe wiązane są z odpowiadającymi im sekwencjami czasownikowymi NP oznaczane są numerem wspólnym z właściwym VP, wraz ze sprecyzowaniem, czy NP stanowi podmiot (subject) czy też dopełnienie (object)

Ciekawe linki Link Grammarhttp:// Memory-Based Shallow Parserhttp://ilk.kub.nl/cgi-bin/tstchunk/demo.pl Eugene Charniak’s Home Pagehttp:// Automatic Statistical SEmantic Role Taggerhttp://oak.colorado.edu/assert/ odnośniki do stron o tematyce NLPhttp://