Wykład 2: Systemy klasy C.A.T. (Computer-Aided Translation)

Slides:



Advertisements
Podobne prezentacje
Co to jest Pulpit eTwinning?
Advertisements

Wprowadzenie do narzędzi CAT
Sieci komputerowe.
Support.ebsco.com Przewodnik Czytanie artykułu EBSCOhost.
Nowa Jakość kontroli w biznesie Projekt: Stworzenie e- usługi w postaci systemu księgowo-kadrowego on-line przez MGA Sp. z o.o. w Toruniu jest współfinansowany.
©Ian Sommerville 2000 Software Engineering, 6th edition. Chapter 28Slide 1 Restrukturyzacja oprogramowania l Reorganizowanie i modyfikowanie istniejącego.
Zaawansowana składnia XML XML Schema
-Microsoft PowerPoint -Microsoft Word -Microsoft Excel
Dokumentowanie wymagań w języku XML
1 1 / 11 Techniki lokalizacji oprogramowania – wykład 8 Wykład 8: Technologia tłumaczenia maszynowego dr inż. Agenor Hofmann-Delbor.
Serwerowe systemy pamięci tłumaczeń dr inż. Agenor Hofmann-Delbor
Tworzenie stron w języku WML jest zbliżone do tworzenia stron w HTML. W obydwu przypadkach używa się do tego celu znaczników (tagów). Zadaniem znaczników.
PRACA DYPLOMOWA INŻYNIERSKA
Systemy zarządzania treścią CMS
„Xbench — narzędzie do wszystkiego”
„Serwery SDL Trados” Prowadzący: Agenor Hofmann-Delbor LSP Software
Rynek tłumaczeń i lokalizacji w Polsce, Wrocław marca 2009r. Prezentacja wersji beta pakietu SDL TRADOS 2009 Studio Agenor Hofmann-Delbor LSP Software.
Rynek tłumaczeń i lokalizacji w Polsce, Wrocław, marca, 2009 Najbliższa przyszłość branży tłumaczeniowej - wprowadzenie do dyskusji Magda Dziadosz,
Rynek tłumaczeń i lokalizacji w Polsce, Wrocław marca 2009r. Lokalizacja plików interfejsu użytkownika Autor: Marcin Stankiewicz.
Rynek tłumaczeń i lokalizacji w Polsce, Wrocław marca 2009r. Przegląd najnowszych technologii różnych producentów Autor: Wojciech Froelich Argos.
Rynek tłumaczeń i lokalizacji w Polsce, Wrocław marca 2009r. Środowisko pracy zdalnej tłumacza Autor: Wojciech Olejniczak Moravia IT
Rynek tłumaczeń i lokalizacji w Polsce, Wrocław marca 2009r. Zarządzanie serwerem SDL Trados Server Autor: Wojciech Olejniczak LSP Software
Evident – Środki Trwałe
Bibliotekarz – odkrywca. Agenda Proces tworzenia informacji Indeksy wyszukiwawcze Budowa rekordu w Promaxie Zapytania.
Łukasz Sobczak. 1)Co to jest Office 2010 Web Apps 2)SharePoint 2010 a narzędzia pakietu office 3)Integracja Office Web Apps z SharePoint )Problemy.
Sponsorzy konferencji: Patronat konferencji: : Organizator: : Partnerzy konferencji: Przegląd najnowszych trendów i omówienie bieżącej sytuacji na rynku.
System ułatwiający zarządzanie Jednostką
Instytut Tele- i Radiotechniczny WARSZAWA
Generatory dokumentacji kodu źródłowego
Grupa specjalistów w zakresie lokalizacji z doświadczeniem w wielu dziedzinach. Blisko 20-letnie doświadczenie w lokalizacji oprogramowania Zespół intensywnie.
Wanda Klenczon Biblioteka Narodowa
Jak to działa? aplikacje desktopowe usługi online urządzenia
PRAWO AUTORSKIE w polsce
XML – eXtensible Markup Language
Korespondencja seryjna
Maszyna wirtualna ang. virtual machine, VM.
Na pasku komunikatów kliknij przycisk Włącz edytowanie,
Michał Gmerek, Krzysztof Słodowicz
Wzorce slajdów programu microsoft powerpoint
IBUK Libra WIRTUALNA CZYTELNIA
Podstawy programowania
W W W Łukasz Stochniał.
C++.
XML Publisher Przedmiot i zakres szkolenia Przedmiot i zakres szkolenia Przeznaczenie XML Publisher Przeznaczenie XML Publisher Definiowanie Definiowanie.
Treści multimedialne - kodowanie, przetwarzanie, prezentacja Odtwarzanie treści multimedialnych Andrzej Majkowski 1 informatyka +
Wykorzystanie programów typu CAT i innych programów procesie tłumaczenia Tomasz Borkowski
Projektowanie Aplikacji Internetowych Artur Niewiarowski Wydział Fizyki, Matematyki i Informatyki Politechnika Krakowska.
Treści multimedialne - kodowanie, przetwarzanie, prezentacjaOdtwarzanie treści multimedialnych Andrzej Majkowski informatyka +
Beata Sanakiewicz. Spis treści  Łączenie dokumentów Łączenie dokumentów  Mechanizm OLE Mechanizm OLE  Obiekt osadzony Obiekt osadzony  Obiekt połączony.
Podstawy języka skryptów
Podstawy programowania
Informatyka – szkoła gimnazjalna – Scholaris - © DC Edukacja Tworzenie stron WWW w programie Microsoft FrontPage Informatyka.
Dokumentacja programu komputerowego i etapy tworzenia programów.
Przewodnik Wprowadzenie do
Microsoft® Office Word
1 Mapan i Mapnik. Czyli kilka słów o przeglądarkach leśnej mapy numerycznej. Zespół Zadaniowy ds. Leśnej Mapy Numerycznej. Margonin r.
Przewodnik
Język html Julia Cudak. Wykorzystanie Język html wykorzystuje się obecnie do tworzenia stron internetowych. Pozwala on opisać strukturę informacji zawartych.
Music Online: Classical Scores Library
Wady i zalety pracy w chmurze
Patenty azjatyckie SLAJD 1 -dlaczego nie ???.
Hipertekst HTML WWW.
Statystyki serwera www Serwer proxy Cash .....
Wstęp do Informatyki - Wykład 14
Tworzenie stron WWW w programie Microsoft FrontPage
IBUK Libra WIRTUALNA CZYTELNIA
Ovid LinkSolver.
Najważniejsze informacje dotyczące programu Sway.
Platforma LearningApps
Zapis prezentacji:

Wykład 2: Systemy klasy C.A.T. (Computer-Aided Translation) dr inż. Agenor Hofmann-Delbor

Plan wykładu Omówienie technologii pamięci tłumaczeń Czym jest technika wyszukiwania rozmytego Jak działają algorytmy wyszukiwania rozmytego Czym są pliki bilingwalne Najistotniejsze komercyjne i darmowe narzędzia CAT

Tłumaczenie maszynowe MT a pamięć tłumaczeń Oryginalny tekst angielski ze strony dużej korporacji: „Read the official press release“ Tłumaczenie przy użyciu programu tłumaczącego: „Przeczytany osoba urzędowa (oficjalny) ścisk (prasa) zwolnienie“

Pamięć tłumaczeń Baza danych przechowująca tzw. segmenty, czyli fragmenty tekstu w języku źródłowym powiązane z odpowiadającym im fragmentom w języku docelowym Mają z reguły ściśle określony „kierunek” językowy, wyszukiwanie odbywa się zwykle w języku źródłowym Pełna automatyzacja procesu aktualizacji w trakcie pracy Jak każda baza wymaga operacji administracyjnych, reorganizacji itp.. Pamięć tłumaczeń to kapitał firm i organizacji Korzystanie z pamięci tłumaczeń umożliwia wycenę projektu i ocenę jego czasochłonności przed jego rozpoczęciem

Pamięć tłumaczeń – c.d.

Czas tłumaczenia a wielkość pamięci tłumaczeń Dokument Tłumaczenie Publikacja 1 rok Dokument Tłumaczenie Publikacja 2 rok Dokument Tłumaczenie Publikacja 3 rok

Typowy model pracy z pamięciami tłumaczeń Pamięć tłumaczeń Baza terminologii Każdy tłumacz dostaje podpowiedzi z całej bazy (tłumaczenia swoje i innych tłumaczy)

Przeszukiwanie pamięci tłumaczeń

Podpowiedzi terminologii z bazy terminologii (słownika) Tłumaczenie z użyciem pamięci tłumaczeń Podpowiedzi terminologii z bazy terminologii (słownika) Zdanie oryginalne wraz z tłumaczeniem zostaje wstawione do pamięci jako segment

Wyszukiwanie rozmyte Segmenty w obrębie pamięci tłumaczeń są indeksowane, co umożliwia ich szybkie wyszukiwanie Idea pamięci tłumaczeń (TM – Translation Memory) zakłada zwracanie wyników także o częściowej zgodności Zgodnie z zasadami logiki rozmytej dane są przyporządkowywane do odpowiedniej klasy, tutaj zwane klasami podobieństwa. Oznaczają one procentową zgodność tekstu w dokumencie z najbardziej podobnym tekstem znalezionym w pamięci tłumaczeń. Najbardziej pożądany przypadek to tzw. 100% match – pełna zgodność Na podstawie liczby słów w danej klasie podobieństwa budowana jest ważona liczba słów i przygotowywana wycena

Analiza dokumentów Przedstawia faktyczną liczbę słów do przetłumaczenia i korekty w dokumencie lub jego zaktualizowanej wersji

Tworzenie modelu rozliczeń

Wyszukiwanie w praktyce 93% podobieństwa: „częściowa zgodność”

Konkordancja – wyszukiwanie kontekstowe

Pliki bilingwalne Pliki bilingwalne powstają w sytuacji, gdy edytujemy dokumenty za pomocą narzędzi CAT. Większość aplikacji tego typu zapisuje dokument w swoim formacie lub modyfikuje obecny format poprzez dodanie odpowiednich znaczników (tagów), dzięki którym możliwe jest bezpieczne powiązanie, ale i rozgraniczenie tekstu źródłowego i wynikowego Obecnie większość plików bilingwalnych jest oparta na XML, standardem staje się powoli format XLIFF Pliki bilingwalne można w łatwy sposób zapisywać w docelowym formacie, można także wprowadzać automatycznie ich zawartość do pamięci tłumaczeń. Pliki bilingwalne pozwalają zidentyfikować format źródłowy oraz języki dokumentu.

Przykład pliku bilingwalnego

Najważniejsze i najpopularniejsze narzędzia CAT SDL Trados WordFast IBM Translation Manager OmegaT STAR Transit LogoPort MemoQ Idiom

Przydatne linki http://pl.wikipedia.org/wiki/T%C5%82umaczenie_przy_u%C5%BCyciu_komputera http://en.wikipedia.org/wiki/Computer-assisted_translation http://en.wikipedia.org/wiki/Translation_memory http://www.issco.unige.ch/ewg95/node149.html

Pytania, kontakt agenorh@zpsb.szczecin.pl