Sztuczna Inteligencja Analiza języka naturalnego Tłumaczenie maszynowe

Slides:



Advertisements
Podobne prezentacje
Platformy e-learningowe Krzysztof Andrelczyk IS, WIMiIP, III rok
Advertisements

Lingwistyka Matematyczna
Włodzisław Duch Katedra Informatyki Stosowanej,
Sztuczna Inteligencja Reprezentacja wiedzy I Logika przybliżona
Wprowadzenie do C++ Zajęcia 2.
Katedra Informatyki Stosowanej UMK
Internet Czyli wirtualny świat.
Support.ebsco.com Przewodnik Czytanie artykułu EBSCOhost.
Czy sztuczna inteligencja jest naturalna? Prentice Hall13.2 O czym będzie? Myślenie o myślących maszynach Komunikacja w języku naturalnym Bazy.
Dwujęzyczne, dwukulturowe, dwumodalne:
Sztuczna Inteligencja Reprezentacja wiedzy II
Sztuczna Inteligencja Reprezentacja wiedzy II Ramy i inne Włodzisław Duch Katedra Informatyki Stosowanej UMK Google: Duch.
Sztuczna Inteligencja Analiza języka naturalnego Tłumaczenie maszynowe
Języki obce online - oczami studentów WSG.
WEBQUEST COMENIUS Eco & Art POZNAJ INNYCH UCZESTNIKÓW PROGRAMU.
WITAM NA SZKOLENIU Porady na dziś i jutro.
Promotor: prof. dr hab. Włodzisław Duch
Sztuczna Inteligencja Reprezentacja wiedzy I Wstęp. Włodzisław Duch Katedra Informatyki Stosowanej UMK Google: W. Duch.
1 1 / 11 Techniki lokalizacji oprogramowania – wykład 8 Wykład 8: Technologia tłumaczenia maszynowego dr inż. Agenor Hofmann-Delbor.
Wykład 2: Systemy klasy C.A.T. (Computer-Aided Translation)
Kompilacja przechodnia
Project made by Bartosz Rumiński Kl. III i rok 2007/2008.
Systemy zarządzania treścią CMS
Sponsorzy konferencji: Organizator: Tłumaczenie nietłumaczalnego Prowadzący: Agenor Hofmann-Delbor LSP Software
Rynek tłumaczeń i lokalizacji w Polsce, Wrocław, marca, 2009 Najbliższa przyszłość branży tłumaczeniowej - wprowadzenie do dyskusji Magda Dziadosz,
Bezpieczeństwo danych
SZKOŁA PODSTAWOWA IM. MARII ZIENTARY- MALEWSKIEJ W BARCIKOWIE PROJEKT SZKOLNY – COMENIUS 1 PROJEKT SZKOLNY – COMENIUS 1 SCHOOL PARTNERSHIP EUROPEAN PROJECTS.
Białe plamy w nauczaniu języka polskiego jako obcego
Search Engine Optimization
KINECT – czyli z czym to się je?
Janusz Wrobel – Neurosoft Sp. z o.o.
MAZURY CUD NATURY! Jak głosować?.
czyli jak poradzić sobie bez listonosza.
Dr inż. Dariusz Piwczyński, Katedra Genetyki i Podstaw Hodowli Zwierząt Zastosowanie arkuszy kalkulacyjnych w pracy naukowej – przygotowanie bazy danych.
Systemy operacyjne.
XML – eXtensible Markup Language
Wprowadzenie do HTML Informatyka Cele lekcji: Wiadomości:
Nieograniczone źródło informacji
CO TO JEST DZIEŃ JĘZYKÓW OBCYCH ? Począwszy od roku 2001, 26 września obchodzony jest Europejski Dzień Języków, dzień mający przypominać o korzyściach.
Treści multimedialne - kodowanie, przetwarzanie, prezentacja Odtwarzanie treści multimedialnych Andrzej Majkowski 1 informatyka +
Wyniki próbnego egzaminu gimnazjalnego z języków obcych 2008.
Policealne Studium Informacji Naukowej Adres: Zespół Szkół Nr Hrubieszów Ul. Żeromskiego 11 Tel
HTML (ang. HyperText Markup Language ) – język do tworzenia stron internetowych opierający się na znacznikach, czy inaczej je nazywając – tagach. Język.
SPRAWDZIAN Z JĘZYKA ANGIELSKIEGO W KLASIE SZÓSTEJ Czy powinien wzbudzać nasze obawy?
Treści multimedialne - kodowanie, przetwarzanie, prezentacjaOdtwarzanie treści multimedialnych Andrzej Majkowski informatyka +
System operacyjny Windows
Podstawy języka skryptów
Wszystko o zagrożeniach i ochronie komputera przed nimi.
Tworzenie prawa w warunkach wielojęzyczności
Adaptacyjne Systemy Inteligentne Maciej Bielski, s4049.
Czy katalogowanie ma przyszłość? Dwugłos względnie uporządkowany Jadwiga Woźniak-Kasperek Małgorzata Kisilowska Instytut Informacji Naukowej i Studiów.
Platforma .Net.
Podstawy programowania
Wyszukiwanie informacji w Internecie Marcin Wojnowski.
Dokumentacja programu komputerowego i etapy tworzenia programów.
K.Marasek Multimedia Department Automatyczne tłumaczenie z mowy na mowę Krzysztof Marasek PJWSTK.
Źródła informacji. Społeczeństwo informacyjne społeczeństwo charakteryzujące się przygotowaniem i zdolnością do użytkowania systemów informatycznych,
PRZEKŁADOZNAWSTWO 1) Początki okresu językoznawczego
”FALSE FRIENDS” (Źródła ilustracji:
Inteligencja Obliczeniowa Perceptrony o dużym marginesie błędu
ANALIZA WYNIKÓW DIAGNOZY WSTĘPNEJ
Zmiany w programie kierunku Kognitywistyka
Patenty azjatyckie SLAJD 1 -dlaczego nie ???.
Hipertekst HTML WWW.
Perceptrony o dużym marginesie błędu
Sztuczna Inteligencja Analiza języka naturalnego Tłumaczenie maszynowe
Włodzisław Duch Katedra Informatyki Stosowanej,
Perceptrony o dużym marginesie błędu
Sztuczna Inteligencja Gry i programy oparte na szukaniu
Sztuczna Inteligencja Reprezentacja wiedzy I Logika przybliżona
Zapis prezentacji:

Sztuczna Inteligencja Analiza języka naturalnego Tłumaczenie maszynowe Włodzisław Duch Katedra Informatyki Stosowanej UMK Google: W. Duch

Tłumaczenie maszynowe Pismo MT, Machine Translation, istnieje od 1954 roku 1957, Noam Chomsky, książka Syntactic Structures, spowodowała szybki rozwój lingwistyki matematycznej. Języki sztuczne mają dobrze rozwiniętą teorię, ale naturalne znacznie gorzej. Tłumaczenie tekstów technicznych odbywa się rutynowo. Wystarczy wygładzanie przez ekspertów. Podstawowe idee: 1. Okno kontekstowe: słowo + jego otoczenie. 2. Techniki deszyfracji: traktuj tekst jako szyfr. 3. Język pośredni – machinese; reprezentacja sensu. 4. Nie przekładaj z każdego języka na każdy inny, np. w UE jest 27 języków. 5. Jeśli masz do dyspozycji wiele dobrze przetłumaczonych tekstów (korpusy) stosuj statystyczne techniki uczenia maszynowego by tłumaczyć całe frazy. Google translate, 57 języków, ale polski słabo – za mało tekstów. http://translate.google.com/about/intl/en_ALL/

MT - przykłady Tłumaczenie tekstów: 28 systemów dla 38 języków (2011); http://www.foreignword.com/Tools/transnow.htm

MT- przykłady cd. Próby Microsoft wykorzystania technologii NLP do szukania pomocy w pakiecie MS Office. Alta Vista Babel Fish, tłumaczy „w locie” ang => niem =>ang. http://world.altavista.com/tr Phonetics: deals with the physical building blocks of a language sound system. Phonology: organisation of speech sounds within a language. Phonetics: Abkommen mit den körperlichen Bausteinen einer Sprache klingen System. Phonology: Organisation der Redetöne innerhalb einer Sprache. Phonetics: Agreements with the physical building blocks of a language sound to system. Phonology: Organization of the speech tones within a language. EN => JP => EN Phonetics: Transaction with the physical block of language sound system. Phonology: Constitution of speech sound inside language

MT- przykłady cd. Lernaut & Hauspie (zbankrutowali!): to samo zdanie. Phonetics: deals with the physical building blocks of a language sound system. Phonology: organisation of speech sounds within a language. Phonetik: Deals mit den physischen Bausteinen einer Sprache gesundes System. Phonologie: organisation von Rede-Klängen innerhalb einer Sprache. Phonetics: Deals with the physical components of a language healthy system. Phonology: organization of speech-sounds within a language. Inne systemy tłumaczące: http://duch-links.wikispaces.com/AI+in+IR+%26+NLP#MTran

MT- przykłady PL. InterTran, www.tranexp.com The spirit is willing but the flesh is weak. Ten duch jest chętny oprócz ten ciało jest słaby. Out of sight out of mind. Niewidoczny z umysł. The NeuroTran translation engine is grammar aware for a selected number of languages. Translation engine means the part of the software which does the translation. Ten [NeuroTran] tłumaczenie silnik jest gramatyka świadomy pod kątem pewien wybrany liczba od języki. Tłumaczenie silnik oznacza ten obowiązek od ten oprogramowanie który nie wymaga ten tłumaczenie.

Więcej przykładów. Poprawne tłumaczenie prostego tekstu. Drobne trudności z listem. Problemy z historyjką. Tłumaczenie strony WWW z angielskiego na nasze. Tłumaczenie strony japońskiej na angielski. Moja strona po japońsku i chińsku. Chinglish.com, strona do korepondendji anglo-chinskiej.

Podejście statystyczne Zamiast reguł i gramatyki trzeba mieć bardzo dużo przykładów i szukać podobnych konstrukcji. Statystyczne podejście do języka opiera się głównie na ko-okurencji słów: jak często dane słowo S jest w pobliżu innych słów W? Słowo => unormowany wektor częstości V(W|S) Google Translate: tłumaczenia na polski są słabe, widać duże braki gramatyczne, bo mamy język fleksyjny, i mało tekstów w obu językach, ale tłumaczenia chińsko-angielskie są zrozumiałe.

W służbie oszustów … Twój adres e-mail zostala wybrana w trybie online w tym tygodniu PRZYZNANIA Promo losowych online, e-glosowanie wybór, Twoja remis ma calkowita wartosc 500,000.00 PLN i konta e-mail wygral ten promocyjny i maja kontakt ze szczególami ponizej pana Charles Adams Kontakt E-mail:(powerball.charles@yahoo.co.uk) Wymagania obejmuja: 1.Full nazwisko: 2.Home Adres: 3.Age: 4.Occupation: 5.Country: 6.phone: Znowu gratulacje . We konto poczty dziekuje za szybkie zajecie sie ta matter.Please zrozumiec, ze jest to srodek bezpieczenstwa przeznaczonych do ochrony uzytkowników i konta poczty internetowej.

Więcej informacji Historia tłumaczenia maszynowego. http://www.mtranslator.pl/ http://www.foreignword.com/ Moje linki „Machine translation” http://www.is.umk.pl/~duch/IR.html EuroMatrix – wszystkie języki Europy, hybrydowe systemy statystyczno-regułowe.