Wykorzystanie programów typu CAT i innych programów procesie tłumaczenia Tomasz Borkowski

Slides:



Advertisements
Podobne prezentacje
Wprowadzenie do narzędzi CAT
Advertisements

Programy do przetwarzania dźwięku
Filmy poklatkowe wykonane za pomocą programu SALSAJ
Podstawowe wiadomości
Wykonawca główny: Włoska Agencja Narodowa Wykonawcy współuczestniczący: Austriacka Agencja Narodowa Grecka Agencja Narodowa Polska Agencja Narodowa Idea.
Support.ebsco.com Przewodnik Mój folder EBSCOhost (My EBSCOhost) Przewodnik.
Stanisław Waberski, CKU Siedlce Kowno, 30 Marca 2011
Wspólne skoroszytów Wspólne użytkowanie skoroszytów Arkusze i skoroszyty Tworzenie nowego skoroszytu Obliczenia w skoroszytach Przeglądanie wzorów w skoroszytach.
Wykład 2: Systemy klasy C.A.T. (Computer-Aided Translation)
Systemy operacyjne Bibliografia:
Tworzenie stron w języku WML jest zbliżone do tworzenia stron w HTML. W obydwu przypadkach używa się do tego celu znaczników (tagów). Zadaniem znaczników.
Współczesne systemy informacyjne
Systemy zarządzania treścią CMS
„Xbench — narzędzie do wszystkiego”
Rynek tłumaczeń i lokalizacji w Polsce, Wrocław marca 2009r. Prezentacja wersji beta pakietu SDL TRADOS 2009 Studio Agenor Hofmann-Delbor LSP Software.
Rynek tłumaczeń i lokalizacji w Polsce, Wrocław marca 2009r. Lokalizacja plików interfejsu użytkownika Autor: Marcin Stankiewicz.
Rynek tłumaczeń i lokalizacji w Polsce, Wrocław marca 2009r. Przegląd najnowszych technologii różnych producentów Autor: Wojciech Froelich Argos.
Rynek tłumaczeń i lokalizacji w Polsce, Wrocław marca 2009r. Środowisko pracy zdalnej tłumacza Autor: Wojciech Olejniczak Moravia IT
KOMPRESJA DANYCH DAWID FREJ. Kompresja danych Kompresja danych - polega na zmianie sposobu zapisu informacji w taki sposób, aby zmniejszyć redundancję
ZASOBY KOMPUTERA I PRACA W SYSTEMIE OPERACYJNYM WINDOWS XP
Sponsorzy konferencji: Patronat konferencji: : Organizator: : Partnerzy konferencji: Przegląd najnowszych trendów i omówienie bieżącej sytuacji na rynku.
FHU AKTYW – TŁUMACZENIA TECHNICZNE Z JĘZYKA FRANCUSKIEGO
Odczytywanie haseł Użytkowników w Windows
Prezentacja funkcjonalności dziennika e-klasa
Instytut Tele- i Radiotechniczny WARSZAWA
Opracowanie Anna Madeksza nauczyciel bibliotekarz
Wprowadzenie do edytorów tekstu.
Aplikacje OCR dla Biznesu i do domu
Przegląd prac prowadzonych nad elektroniczną postacią aktów prawnych Jarosław Deminet Projekt jest współfinansowany ze środków Unii Europejskiej w ramach.
Grupa specjalistów w zakresie lokalizacji z doświadczeniem w wielu dziedzinach. Blisko 20-letnie doświadczenie w lokalizacji oprogramowania Zespół intensywnie.
CDN OPT!MA integracja z Systemem Microsoft Office 2003.
Prezentacja funkcjonalności dziennika e-klasa
Microsoft PowerPoint Wprowadzenie.
1 PREZENTACJA FUNKCJONALNOŚCI DZIENNIKA UCZNIA Moduł Dyrektora ZAPRASZAMY ZAPRASZAMY O&S Computer-Soft ul. Żwirki i Wigury 8-12, Wałbrzych, woj.
Autor: Justyna Radomska
TECHNOLOGIE INFORMATYCZNE Tydzień 6
Maszyna wirtualna ang. virtual machine, VM.
Nośniki informacji i akcesoria komputerowe
Temat 2: Edytory HTML.
Współpraca z innymi aplikacjami. Organizacja informacji 10 XII 2013.
Ujarzmić Worda Agnieszka Terebus.
Podstawy programowania
Elementy multimedialne na stronie
XML Publisher Przedmiot i zakres szkolenia Przedmiot i zakres szkolenia Przeznaczenie XML Publisher Przeznaczenie XML Publisher Definiowanie Definiowanie.
Przewodnik Przewodnik Mój folder EBSCOhost (My EBSCOhost)
Temat 2: Instalacja Apache, PHP i bazy danych MySQL.
Treści multimedialne - kodowanie, przetwarzanie, prezentacjaOdtwarzanie treści multimedialnych Andrzej Majkowski informatyka +
Kolumny, tabulatory, tabele, sortowanie
Systemy kontroli wersji
Beata Sanakiewicz. Spis treści  Łączenie dokumentów Łączenie dokumentów  Mechanizm OLE Mechanizm OLE  Obiekt osadzony Obiekt osadzony  Obiekt połączony.
Podstawy języka skryptów
Edytory tekstowe stron WWW
Operacje na plikach i folderach
Projektowanie postaci formularza:
Moduł e-Kontroli Grzegorz Dziurla.
Multimedia w HTML5 Statyczne witryny internetowe 2TIa Marek Kwiatkowski.
Przewodnik Wprowadzenie do
Microsoft® Office Word
Przewodnik Użycie funkcji historii wyszukiwania w interfejsach EBSCO
Przeglądarka Cyfrowego Archiwum EBSCOhost Przewodnik
1 Co nowego w i-cut Suite i-cut Layout 14.0.
Szablony w programie microsoft word 2010
Bazy CINAHL Wyszukiwanie zaawansowane Przewodnik
Sporządzenie plików drukowych oraz naświetlanie prac.
Przewodnik
ACCESS - FORMULARZE TEMAT:. Tworzenie formularza Formularz tworzony jest w celu łatwiejszego przeglądania i edytowania danych zawartych w bazie. Tworzymy.
Hipertekst HTML WWW.
Wstęp do Informatyki - Wykład 14
Platforma LearningApps
Zapis prezentacji:

Wykorzystanie programów typu CAT i innych programów procesie tłumaczenia Tomasz Borkowski

Istota narzędzi CAT Podstawowy element każdego narzędzia CAT: TM (translation memory; pamięć tłumaczeniowa), czyli korpus segmentów tekstu w języku źródłowym połączony z tłumaczeniami tych segmentów w języku docelowym: TU – translation units), która zazwyczaj ma interfejs z bazą terminologiczną. Podstawowy element każdego narzędzia CAT: TM (translation memory; pamięć tłumaczeniowa), czyli korpus segmentów tekstu w języku źródłowym połączony z tłumaczeniami tych segmentów w języku docelowym: TU – translation units), która zazwyczaj ma interfejs z bazą terminologiczną. Programy CAT zawierają jedynie szablony obu modułów, które należy samemu wypełnić treścią Programy CAT zawierają jedynie szablony obu modułów, które należy samemu wypełnić treścią Przydatność tych narzędzi polega na możliwości odzyskiwania danych: zarówno pojedynczych terminów, jak i całych segmentów tekstu, co jest pożądane ze względu na liczne korzyści takiego „recyklingu” Przydatność tych narzędzi polega na możliwości odzyskiwania danych: zarówno pojedynczych terminów, jak i całych segmentów tekstu, co jest pożądane ze względu na liczne korzyści takiego „recyklingu” Programy wspomagające tłumaczenie są szczególnie przydatne w pracy z tekstami homogenicznymi, np. prawnymi i technicznymi, gdzie występuje częste powtarzanie tych samych lub bardzo podobnych elementów tekstowych Programy wspomagające tłumaczenie są szczególnie przydatne w pracy z tekstami homogenicznymi, np. prawnymi i technicznymi, gdzie występuje częste powtarzanie tych samych lub bardzo podobnych elementów tekstowych

Istota współpracy modułów na przykładzie algorytmu pracy w ramach programów wspomagających tłumaczenie („CAT” tools: computer-aided translation) Moduły to dwie bazy – pamięć tłumaczeniowa (TM), w której zapisane są cyklicznie aktualizowane dwujęzyczne segmenty tłumaczeniowe (tzw. TU-s), oraz baza terminologiczna zawierająca hasła terminologiczne z polskimi terminami i ich ekwiwalentami używanymi w tekstach Moduły to dwie bazy – pamięć tłumaczeniowa (TM), w której zapisane są cyklicznie aktualizowane dwujęzyczne segmenty tłumaczeniowe (tzw. TU-s), oraz baza terminologiczna zawierająca hasła terminologiczne z polskimi terminami i ich ekwiwalentami używanymi w tekstach Obie bazy automatycznie współdziałają ze sobą w procesie pre- edytowania tłumaczeń po wydaniu programowi odpowiednich poleceń Obie bazy automatycznie współdziałają ze sobą w procesie pre- edytowania tłumaczeń po wydaniu programowi odpowiednich poleceń Celem takiego modelu pracy jest zazwyczaj kontrola i utrzymanie jednolitości terminologicznej w tłumaczonych tekstach specjalistycznych Celem takiego modelu pracy jest zazwyczaj kontrola i utrzymanie jednolitości terminologicznej w tłumaczonych tekstach specjalistycznych

Najbardziej popularne CAT-sy: a) Wordfast Classic: [

b) SDL Trados Studio 2011:

c) Wordfast Pro: [

Wygląd modułu TM w ww. programach: a) Wordfast Classic:

b) SDL Trados Studio 2011

Perspektywa translacyjna: pasek narzędzi Wordfast Classic: tworzenie nowej pamięci TM

Istota dobrego przetworzenia danych: prawidłowa segmentacja oparta na znacznikach paragrafu (znaku „enter” na końcu paragrafu: naturalna segmentacja tekstu):

Pasek narzędzi Wordfast: start sesji translacyjnej

Persp. transl. – tworzenie TM na bieżąco – sesja translacyjna

Zakończenie lub przerwanie sesji (powrót do poprzedniego stanu)

Koniec sesji – wygląd sformatowanych segmentów

Okienko edycji – TM wypełniona podczas sesji transl.

Edycja segmentów w okienku edycji WF

Polecenie: oczyszczenie pliku sesji i opcjonalnie wypełnienie TM

Polecenie: aktualizuj TM podczas oczyszczenia pliku sesji

Perspektywa projektu tłum.: bazowanie na zasobach TM i terminologii: Praca nad projektem w SDL Trados Studio 2011: a) identyfikacja segmentu

Zalety autoidentyfikacji podobieństw segmentów Program jest w stanie ”odzyskać” już istniejący w bazie TM segment angielskojęzyczny odpowiadający poprzedniej wersji przepisu polskiego, o ile ustawiliśmy próg podobieństwa segmentów wyszukiwanych na co najmniej 50% To gwarantuje, że program wyszuka wszystkie segmenty w TM, które choć w części pokrywają się z treścią segmentów wyjściowych do przetłumaczenia; Stąd wynika ułatwienie pracy tłumaczowi

ZALETY: cd.: Automatyczne wskazanie różnic pomiędzy nowym i starym segmentem PL: [stąd: ułatwienie dla tłumacza – wiadomo co trzeba zmienić w segmencie docel. podanym z TM]

Automatyczne podawanie terminologii poprzez interfejs okna tekstowego projektu z bazą terminologii:

Automatycznie podane terminy tutaj to: tax authority – organ podatkowy; elektroniczna skrzynka podawcza systemu teleinformatycznego administracji podatkowej – electronic data submission box in IT data transmission system of tax administration

Wordfast Pro 3.3: [okienko TM, w tym: autoidentyfikacja terminologii]

Praca nad projektem w T.S – inne funkcje: (funkcja auto-suggest: automatyczne uzupełnianie podczas pisania tłumaczenia))

Baza terminologii – gwarancja spójności terminologicznej Dzięki wykorzystaniu i ciągłemu uaktualnianiu oraz uzupełnianiu baz terminologii w programach CAT możemy zagwarantować: 1) spójność terminologiczną; 2) odzyskiwanie terminologii docelowej

Wygląd modułu: baza terminologii; a) SDL MultiTerm – z terminem podanym wcześniej automatycznie w projekcie:

SDL MultiTerm: hasło z oryginalną definicją wspólnotową

Wygląd modułu: baza terminologii; b) Wordfast Classic: prosty glosariusz [txt], który można uzupełnić o cenne informacje (dopisanie pól)

Wygląd modułu: baza terminologii; c) Wordfast Pro: prosty glosariusz [txt], którego nie bardzo da się rozwinąć:

Progr. CAT: Funkcja „alignment” Oprócz pracy w tzw. project, czy, w przypadku Wordfast Classic, po prostu w sesji translacyjnej w procesie tłumaczenia, czy przygotowywania tłumaczenia dla podwykonawcy, wszystkie trzy programy umożliwiają wprowadzenie do TM gotowych dwujęzycznych segmentów stworzonych na podstawie już istniejących tłumaczeń Służy do tego funkcja alignment, która pozwala „zestawiać” ze sobą dwa pliki – oryginału i tłumaczenia – w specjalnych modułach programów, oraz właśnie „uzgadniać” ich treść, tj. „align”

Obraz pracy w module „Alignment” – TRADOS:

Obraz pracy w module „Alignment” – Wordfast Pro:

Obraz pracy w module „Alignment” – Wordfast Classic: zwykła tabela w okienku Worda, którą tworzy PlusTools

Pomoce „szkoleniowe” w pracy z CAT-sami: a)wszelkiego rodzaju firmowe „manuals” (pliki tekstowe) na stronach firmowych oprogramowania; b)filmy instruktażowe („demos”): np.: ranslating.html [„Translating a document”]. ranslating.html

ZAPROSZENIE NA KURS – OBSŁUGA PROGR. WORDFAST

LEPSZA STRONA WIEDZY WORDFAST – KURS PODSTAWOWY – WSZYSTKIE JĘZYKI – 12 GODZ [dwudniowy – sobota-niedziela] WORDFAST – KURS ZAAWANSOWANY – JĘZ. ANGIELSKI – 24 GODZ.

PRZEGLĄD „CAT”-ÓW - /

Inne rodzaje oprogramowania pomocne w tłumaczeniu: -Emulatory głosu: czytanie tekstu przez komputer – bardzo efektywne w fazie sprawdzania poprawności i kompletności tłumaczenia (komputer czyta tekst oryginalny, a my sprawdzamy tłumaczenie w tym samym czasie) -Przykład: program Expressivo; można pobrać trial na 30 dni.

2. Programy typu OCR: przetwarzanie dokumentów z formatu pdf do.doc – bardzo przydatne jeśli dokument ma dużą objętość: ABBY FINE READER (można pobrać trial na 30 dni: ok. 600 Mb) 3. Bazy wiedzy: np. bazy aktów prawnych [Lex itp.] 4. Słowniki na dvd/pendrivach

„Concordancery” tj. programy, w których można na przykładzie dowolnej liczby tekstów wyświetlić wszystkie występujące w nich konteksty danego wyrazu/terminu, np. AntConc – freeware – przetwarza teksty tylko w formacie txt, ale jest bardzo dobry [opisany w Translation Journal]