Sztuczna Inteligencja Analiza języka naturalnego Tłumaczenie maszynowe

Slides:



Advertisements
Podobne prezentacje
Lingwistyka Matematyczna
Advertisements

Lingwistyka Matematyczna
Włodzisław Duch Katedra Informatyki Stosowanej,
Sztuczna Inteligencja Analiza języka naturalnego Tłumaczenie maszynowe
Sztuczna Inteligencja Reprezentacja wiedzy I Logika przybliżona
Wprowadzenie do C++ Zajęcia 2.
Jak język angielski wpływa na współczesną polszczyznę ?
Inteligencja Obliczeniowa Perceptrony o dużym marginesie błędu
Inteligencja Obliczeniowa Perceptrony
Czy sztuczna inteligencja jest naturalna? Prentice Hall13.2 O czym będzie? Myślenie o myślących maszynach Komunikacja w języku naturalnym Bazy.
Sztuczna Inteligencja Reprezentacja wiedzy I Logika przybliżona
Sztuczna Inteligencja Reprezentacja wiedzy II
Sztuczna Inteligencja Analiza języka naturalnego Tłumaczenie maszynowe
Platforma .Net i Vs.Net.
Jak promować projekty współfinansowane z Europejskiego Funduszu Społecznego w ramach Sektorowego Programu Operacyjnego Rozwój Zasobów Ludzkich.
Informatyka jako dziedzina wiedzy Copyright, 2000 © Jerzy R. Nawrocki Wprowadzenie.
Czyli moje wrażenia z wykładami związane
Sztuczna Inteligencja Reprezentacja wiedzy I Wstęp. Włodzisław Duch Katedra Informatyki Stosowanej UMK Google: W. Duch.
1 1 / 11 Techniki lokalizacji oprogramowania – wykład 8 Wykład 8: Technologia tłumaczenia maszynowego dr inż. Agenor Hofmann-Delbor.
Wykład 2: Systemy klasy C.A.T. (Computer-Aided Translation)
Kompilacja przechodnia
Systemy zarządzania treścią CMS
PHP wprowadzenie.
Bezpieczeństwo danych
Technologia informacyjna
Janusz Wrobel – Neurosoft Sp. z o.o.
czyli jak poradzić sobie bez listonosza.
Zakładanie konta pocztowego Wysyłanie i odbieranie wiadomości
Witold Bołt. Agenda W czym tkwi problem..? Po co jest oprogramowanie? Kim jest użytkownik? Zbieranie danych Co to jest design Współpraca programista-projektant.
XML – eXtensible Markup Language
Informatyka jako dziedzina wiedzy
Podstawowe informacje o maturze dla gimnazjalistów.
PROJEKT MIGRANTS+ realizowany w ramach Programu UE: Uczenie się przez całe życie, przy wsparciu Komisji Europejskiej.
SPECJALNOŚĆ: Oprogramowanie Systemowe
1. Współczesne generacje technologii
JAK KORZYSTAĆ Z WSiPnet.pl
C++.
Treści multimedialne - kodowanie, przetwarzanie, prezentacja Odtwarzanie treści multimedialnych Andrzej Majkowski 1 informatyka +
Treści multimedialne - kodowanie, przetwarzanie, prezentacja Odtwarzanie treści multimedialnych Andrzej Majkowski 1 informatyka +
Wyniki próbnego egzaminu gimnazjalnego z języków obcych 2008.
HTML (ang. HyperText Markup Language ) – język do tworzenia stron internetowych opierający się na znacznikach, czy inaczej je nazywając – tagach. Język.
Andrzej Majkowski 1 informatyka +. 2 Telefon komórkowy „uczy się”. Metoda słownikowa T9 Paweł Perekietka.
Treści multimedialne - kodowanie, przetwarzanie, prezentacjaOdtwarzanie treści multimedialnych Andrzej Majkowski informatyka +
System operacyjny Windows
Tworzenie prawa w warunkach wielojęzyczności
Voice Portals – Portale Głosowe Krótkie wprowadzenie i omówienie.
Adaptacyjne Systemy Inteligentne Maciej Bielski, s4049.
Czy katalogowanie ma przyszłość? Dwugłos względnie uporządkowany Jadwiga Woźniak-Kasperek Małgorzata Kisilowska Instytut Informacji Naukowej i Studiów.
Platforma .Net.
Podstawy programowania
Warstwowe sieci jednokierunkowe – perceptrony wielowarstwowe
Metody komunikacji.
SZTUCZNA INTELIGENCJA
Dokumentacja programu komputerowego i etapy tworzenia programów.
Wstęp do programowania Wykład 1
K.Marasek Multimedia Department Automatyczne tłumaczenie z mowy na mowę Krzysztof Marasek PJWSTK.
Biuro Tłumaczeń Jovita.  Tłumaczenia przysięgłe  Tłumaczenia tekstów prywatnych  Tłumaczenia wykonywane są w językach : angielski, niemiecki, czeski.
PRZEKŁADOZNAWSTWO 1) Początki okresu językoznawczego
1 Międzywydziałowe Centrum Języków Obcych. 2 Zajęcia językowe odbywają się w grupach o różnych poziomach, zależnie od stopnia opanowania języka obcego.
Wykorzystanie algorytmu Text Mining do analizy przyjmowanych przez rodziców celów wychowawczych Agnieszka Szymańska.
Zmiany w programie kierunku Kognitywistyka
Patenty azjatyckie SLAJD 1 -dlaczego nie ???.
Hipertekst HTML WWW.
Efektywność algorytmów
Włodzisław Duch Katedra Informatyki Stosowanej,
Perceptrony o dużym marginesie błędu
Sztuczna Inteligencja Gry i programy oparte na szukaniu
Przycisk uruchamiający napisany przez nas program
Sztuczna Inteligencja Reprezentacja wiedzy I Logika przybliżona
Zapis prezentacji:

Sztuczna Inteligencja Analiza języka naturalnego Tłumaczenie maszynowe Włodzisław Duch Katedra Informatyki Stosowanej UMK Google: W. Duch

Tłumaczenie maszynowe Pismo MT, Machine Translation, istnieje od 1954 roku 1957, Noam Chomsky, książka Syntactic Structures, spowodowała szybki rozwój lingwistyki matematycznej. Języki sztuczne mają dobrze rozwiniętą teorię, ale naturalne znacznie gorzej. Tłumaczenie tekstów technicznych odbywa się rutynowo. Wystarczy wygładzanie przez ekspertów. Podstawowe idee: 1. Okno kontekstowe: słowo + jego otoczenie. 2. Techniki deszyfracji: traktuj tekst jako szyfr. 3. Język pośredni – machinese; reprezentacja sensu. 4. Nie przekładaj z każdego języka na każdy inny, np. w UE jest 27 języków. 5. Jeśli masz do dyspozycji wiele dobrze przetłumaczonych tekstów (korpusy) stosuj statystyczne techniki uczenia maszynowego by tłumaczyć całe frazy. Google translate, 57 języków, ale polski słabo – za mało tekstów. http://translate.google.com/about/intl/en_ALL/

MT - przykłady Tłumaczenie tekstów: 28 systemów dla 38 języków (2011); http://www.foreignword.com/Tools/transnow.htm

MT- przykłady cd. Próby Microsoft wykorzystania technologii NLP do szukania pomocy w pakiecie MS Office. Alta Vista Babel Fish, tłumaczy „w locie” ang => niem =>ang. http://world.altavista.com/tr Phonetics: deals with the physical building blocks of a language sound system. Phonology: organisation of speech sounds within a language. Phonetics: Abkommen mit den körperlichen Bausteinen einer Sprache klingen System. Phonology: Organisation der Redetöne innerhalb einer Sprache. Phonetics: Agreements with the physical building blocks of a language sound to system. Phonology: Organization of the speech tones within a language. EN => JP => EN Phonetics: Transaction with the physical block of language sound system. Phonology: Constitution of speech sound inside language

MT- przykłady cd. Lernaut & Hauspie (zbankrutowali!): to samo zdanie. Phonetics: deals with the physical building blocks of a language sound system. Phonology: organisation of speech sounds within a language. Phonetik: Deals mit den physischen Bausteinen einer Sprache gesundes System. Phonologie: organisation von Rede-Klängen innerhalb einer Sprache. Phonetics: Deals with the physical components of a language healthy system. Phonology: organization of speech-sounds within a language. Inne systemy tłumaczące: http://duch-links.wikispaces.com/AI+in+IR+%26+NLP#MTran

MT- przykłady PL. InterTran, www.tranexp.com The spirit is willing but the flesh is weak. Ten duch jest chętny oprócz ten ciało jest słaby. Out of sight out of mind. Niewidoczny z umysł. The NeuroTran translation engine is grammar aware for a selected number of languages. Translation engine means the part of the software which does the translation. Ten [NeuroTran] tłumaczenie silnik jest gramatyka świadomy pod kątem pewien wybrany liczba od języki. Tłumaczenie silnik oznacza ten obowiązek od ten oprogramowanie który nie wymaga ten tłumaczenie. Google Translate 2017 – znacznie lepiej: Narzędzie translacji języka NeuroTran jest obsługiwane przez gramatykę wybranej liczby języków. Silnik tłumaczenia oznacza część oprogramowania, które wykonuje tłumaczenie.

Google Translate 2017 Phonetics: deals with the physical building blocks of a language sound system. Phonology: organisation of speech sounds within a language. Fonetyka: dotyczy fizycznych elementów składowych systemu dźwięku języka. Fonologia: organizacja dźwięków mowy w języku. Teksty specjalistyczne: … in particular, concerned with programming computers to fruitfully process large natural language corpora. … a w szczególności dotyczy komputerów programistycznych, aby wydajnie przetwarzać duże korpusy języka naturalnego. Recently, the effect on the vagal afferent pathway to the frontal cortical areas has been proposed. Ostatnio zaproponowano wpływ na szlak towarzyszący pochwy do przednich obszarów korowych. Głębokie uczenie znacznie poprawiło metody statystyczne, ale do ideału daleko.

Więcej przykładów. Poprawne tłumaczenie prostego tekstu. Drobne trudności z listem. Problemy z historyjką. Tłumaczenie strony WWW z angielskiego na nasze. Tłumaczenie strony japońskiej na angielski. Moja strona po japońsku i chińsku. Chinglish.com, strona do korespondencji anglo-chińskiej.

Podejście statystyczne Zamiast reguł i gramatyki trzeba mieć bardzo dużo przykładów i szukać podobnych konstrukcji. Statystyczne podejście do języka opiera się głównie na ko-okurencji słów: jak często dane słowo S jest w pobliżu innych słów W? Słowo => unormowany wektor częstości V(W|S). Angielski-Francuski 2.5 mld par zdań. Google Translate: początkowo tłumaczenia na polski były słabe, widać było duże braki gramatyczne, bo mamy język fleksyjny, i mało tekstów w obu językach. Tłumaczenia chińsko-angielskie są zrozumiałe. Od końca 2016 roku sytuacja się znacznie poprawiła dzięki zastosowaniu neuronowych algorytmów głębokiego uczenia. Liczba błędów spadła o 60-90%. Art. w Science o Google Translate. 10 years of Google Translate.

W służbie oszustów … Twój adres e-mail zostala wybrana w trybie online w tym tygodniu PRZYZNANIA Promo losowych online, e-glosowanie wybór, Twoja remis ma calkowita wartosc 500,000.00 PLN i konta e-mail wygral ten promocyjny i maja kontakt ze szczególami ponizej pana Charles Adams Kontakt E-mail:(powerball.charles@yahoo.co.uk) Wymagania obejmuja: 1.Full nazwisko: 2.Home Adres: 3.Age: 4.Occupation: 5.Country: 6.phone: Znowu gratulacje . We konto poczty dziekuje za szybkie zajecie sie ta matter.Please zrozumiec, ze jest to srodek bezpieczenstwa przeznaczonych do ochrony uzytkowników i konta poczty internetowej.

Więcej informacji Historia tłumaczenia maszynowego. http://www.mtranslator.pl/ http://www.foreignword.com/ Moje linki „Machine translation” http://www.is.umk.pl/~duch/IR.html EuroMatrix – wszystkie języki Europy, hybrydowe systemy statystyczno-regułowe.