Wykorzystanie programów typu CAT w procesie tłumaczenia

Narzędzia CAT (computer-assisted translation tools; computer-aided translation tools) to programy wspomagające tłumaczenie, przy użyciu których tłumacz pisemny może wykonywać swoją pracę szybciej i lepiej.

Wynika to z faktu, że wykorzystując CATy, tłumacze mogą tworzyć własne zasoby tzw. pamięci tłumaczeniowej oraz bazy terminologii na podstawie wykonywanych przez siebie tłumaczeń. Narzędzia tego typu mogą być wykorzystywane zarówno przez indywidualne osoby, jak i przez np. agencje tłumaczeń lub wydawnictwa branżowe.

Ich przydatność jest największa w zakresie tłumaczeń specjalistycznych, ponieważ języki te cechuje homogeniczność (powtarzalność terminologii, a czasami również całych fragmentów tekstu – np. w językach prawnym i prawniczym), dzięki której terminy oraz tzw. segmenty „zapamiętane” przez oprogramowanie CAT, można „odzyskać” w kolejnych tłumaczeniach z tej samej dziedziny.

Poniżej przedstawiam charakterystykę programów CAT, ich przykłady, oraz podstawowe funkcje, które można wykorzystywać w procesie przygotowywania i wykonywania tłumaczeń w ramach tych programów.

Istota narzędzi CAT

Podstawowy element każdego narzędzia CAT: TM (translation memory; pamięć tłumaczeniowa), czyli korpus segmentów tekstu w języku źródłowym połączony z tłumaczeniami tych segmentów w języku docelowym: TU – translation units), która zazwyczaj ma interfejs z bazą terminologiczną – Programy CAT zawierają jedynie szablony obu modułów, które należy samemu wypełnić treścią – Przydatność tych narzędzi polega na możliwości odzyskiwania danych: zarówno pojedynczych terminów, jak i całych segmentów tekstu, co jest pożądane ze względu na liczne korzyści takiego „recyklingu”. – Programy wspomagające tłumaczenie są szczególnie przydatne w pracy z tekstami homogenicznymi, np. prawnymi i technicznymi, gdzie występuje częste powtarzanie tych samych lub bardzo podobnych elementów tekstowych – przykład “odzysku” zarówno terminologii, jak i całego segmentu, będzie pokazany później.

Poniżej przedstawiam trzy moim zdaniem najbardziej funkcjonalne programy, do których ograniczy się ten przegląd:

RYS. 1

RYS. 2

RYS. 3


Wordfast Classic

Porównując ww. programy w kontekście przydatności dla tłumaczy specjalistycznych, można określić Wordfast Classic jako oprogramowanie najbardziej podstawowe, aczkolwiek posiadające bardzo wiele najważniejszych funkcji w kontekście wykonywania tłumaczeń tekstów (pokażę te funkcje poniżej, także na przykładzie tłumaczenia w pozostałych programach). Program jest szablonem nakładanym na MS Word, stąd jego spora wada – konieczność dostępu do komputera z pakietem MS Office; nie da się go zainstalować i podłączyć pod żaden edytor tekstu typu opensource, np. OpenOffice. Szablon wordfast jest bardzo mały (4,40 mega), a jednocześnie program ma naprawdę wiele możliwości. Poniżej pokazuję wykorzystanie najważniejszej funkcji – przeprowadzenie sesji translacyjnej za pomocą tego programu z jednoczesnym wypełnieniem modułu TM oraz późniejszym oczyszczeniem dokumentu sesji:

RYS. 4

RYS. 6

RYS. 7

RYS. 8

RYS. 9

Przed przystąpieniem do sesji, zresztą w każdym z programów, bardzo istotne jest ustawienie segmentacji, czyli, mówiąc prościej: nakazanie programowi odpowiedniego sposobu dzielenia tekstu. Najbardziej bezpieczne jest ustawienie segmentacji na podstawie znaczników akapitu, czyli symbolu znaku enter, który, przynajmniej w naturalnym podziale tekstu, kończy akapit. Ustawienie segmentacji na kropkę, czy dwukropek spowoduje taki właśnie podział tekstu, czyli po każdym ww. znaku program będzie zamykał jeden segment i otwierał kolejny. Nie jest to wygodne w przypadku tekstów prawnych, w których to znacznik akapitu wyznacza naturalny koniec danej części tekstu. Wracając do możliwości WF Classic trzeba powiedzieć, że niestety jego niewielka objętość także przekłada się na brak możliwości obsługiwania innych formatów niż pliki tekstowe typu doc, txt, czy rtf. Można co prawda przetworzyć przez Classica np. pdf, ale to wymaga uprzedniego “przywrócenia” podziału tekstu po przekopiowaniu pdf do doc. Wynika to stąd, że w pdf po przeniesieniu do doc. (chyba że mamy jakiś OCR, np. Abby Fine Reader) każda linijka zakończona będzie znacznikiem akapitu, co całkowicie zrujnuje sesję translacyjną. Jeśli chodzi natomiast o samą sesję, to, jak widać, po ustawieniu segmentacji na podstawie znaczników akapitu po początkowym stworzeniu pustej TM i otwarciu sesji, każdy zamknięty segment kolejno dodaje się do jej treści, tworząc ostatecznie krótki dwujęzyczny minikorpus. Rysunki pokazują podstawowe ikonki kilku funkcji i ich rolę w procesie tworzenia takiej przykładowej sesji (tu – fragment dyrektywy 1999/93/WE w sprawie wspólnotowych ram w zakresie podpisów elektronicznych). Jest to symulacja procesu tłumaczenia, ponieważ oczywiście ww. akt prawny ma swoje oficjalne tłumaczenie na stronie europa.eu, w ramach zasobów eur-lex. A tak wygląda okienko edycji TM stworzonej na podstawie powyższej sesji:

RYS. 10

W okienku za pomocą odpowiednich narzędzi można edytować TM, wprowadzając do niej np. poprawki już po przeprowadzeniu sesji (czasami występuje taka konieczność, ponieważ WF Classic ma “złośliwy” zwyczaj oddzielania np. numerów kolejnych ustępów danego artykułu po kropce, mimo uprzedniego prawidłowego ustawienia segmentacji, jw.).

RYS. 11
Na poniższych zrzutach możemy zobaczyć, jak poradzić sobie z zupełnie niestrawnym formatem pliku sesji, aby pozbawić go wszelkich formatowań nadanych przez program (fioletowe elementy) i pozostawić czyste tłumaczenie, co my, jako tłumacze, zazwyczaj powinniśmy dostarczyć zleceniodawcy:

RYS. 12

RYS. 13

Jednocześnie przedstawiam poniżej wygląd okienka TM w pozostałych programach:

RYS. 14

RYS. 15


Wordfast Pro

Jeśli chodzi o ostatni zrzut, jest to jednocześnie zapowiedź kolejnego wątku, tj. projektów tłumaczeniowych w oparciu o już istniejące zasoby TM i terminologii. Tu widać, jak program Wordfast Pro automatycznie zaznacza wpisane do glosariusza terminy polskie, które można następnie automatycznie wrzucić w okienko tłumaczenia. Ogólnie rzecz biorąc, WF Pro ma sporo zalet, ponieważ: a) jest programem stand-alone, podobnie jak Trados – i stąd nie wymaga absolutnie Worda i może być instalowany na platformach takich jak Linux i Mac; b) przetwarza wszelkie formaty (ppt, xls, pdf itd.) i “wytwarza” tłumaczenia w tych samych formatach; c) jest dość prosty w obsłudze, choć dużo bardziej skomplikowany niż WF Classic. Jego sporą wadą jest niemożliwy do rozbudowania moduł terminologii, który z kolei w WF Classic można rozbudować z powodzeniem. Oba wspierają format txt, zarówno jeśli chodzi o TM, jak i o moduł terminologii. Skupię się na tym module nieco później. Teraz przedstawię właśnie zapowiadany już wątek, tj. skondensowaną metodologię pracy w projekcie tłumaczeniowym już w oparciu o istniejące zasoby.

TRADOS

W Wydawnictwie Translegis od ok. 12 lat używany jest program TRADOS w kolejnych jego wersjach (obecnie TRADOS STUDIO 2011). Dzięki temu oprogramowaniu udało się stworzyć i wciąż aktualizować pamięć tłumaczeniową (TM), w której zapisane są cyklicznie aktualizowane dwujęzyczne segmenty tłumaczeniowe oparte na zbiorze PLC (tzw. TU-s; w tej chwili baza obejmuje ponad 40 000 takich segmentów), oraz bazę terminologiczną budowaną w module Multiterm i zawierającą hasła terminologiczne z polskimi terminami i ich ekwiwalentami używanymi w tekstach PLC (ok. 13500 haseł). TRADOS umożliwia uaktywnienie wszystkich stworzonych w nim zasobów w procesie przygotowywania segmentu polskiego do tłumaczenia na angielski, tj. pamięci tłumaczeniowej, modułu terminologii oraz tzw. autosuggest dictionary. Trados bardzo dobrze radzi sobie ze wszystkimi formatami „wrzucanego” tekstu do tłumaczenia, jak i z segmentacją według naszego życzenia. Współpracuje, tak jak obie wersje Wordfasta, z bazą terminologii w sposób dość precyzyjny i pozwala na sprawdzanie obu baz (TM w poszukiwaniu ekwiwalentów segmentów, czy pojedynczych terminów w ramach segmentów, jak i terminologii Polterm) bezpośrednio z okienka edytora tłumaczenia. Jego upgrady nie są zbyt drogie i łatwo się ich dokonuje (zaznaczam, że nie jestem przedstawicielem handlowym TRADOS. TRADOS pozwala, na podstawie treści TM, utworzyć słownik autosuggest dictionary automatycznie, a zawiera on typowe sformułowania i elementy tekstowe używane najczęściej w tekstach tłumaczeń w języku angielskim. Dzięki temu tłumacząc dany element już po wpisaniu pierwszych liter potencjalnego ekwiwalentu angielskiego funkcja autosuggest podaje nam natychmiast kilka gotowych rozwiązań, które możemy wybrać i zatwierdzić właściwe naciskając enter. Wtedy wyrażenie „wskakuje” w okienku tłumaczenia i znacznie skraca to czas pracy. Oczywiście im większa jest TM, tym lepszy jest autosuggest dictionary. Ta sama funkcja, choć nie zawsze prawidłowo działająca, jest dostępna w Wordfast Classic; w Wordfast Pro jej nie ma. Przykład opracowania segmentu w TRADOSIE STUDIO 2011:

RYS. 16

Na powyższym zrzucie widoczny jest przepis z ostatniej zmiany do Ordynacji podatkowej (poz. 183, Dziennik Ustaw z br.), który otrzymuje nowe brzmienie. Okazuje się, że program jest w stanie ”odzyskać” już istniejący w bazie TM segment angielskojęzyczny odpowiadający poprzedniej wersji przepisu polskiego, o ile ustawiliśmy próg podobieństwa segmentów wyszukiwanych na co najmniej 50% (to gwarantuje, że program wyszuka wszystkie segmenty w TM, które choć w części pokrywają się z treścią segmentów wyjściowych do przetłumaczenia; zresztą rzadko zdarzają się po raz kolejny segmenty identyczne jak w bazie, czyli tzw. ”100% match”, choć tak bywa oczywiście). Jednocześnie TRADOS pokazuje stopień podobieństwa (tu: 88 %). Jesteśmy więc nieco do przodu z czasem chcąc coś takiego przetłumaczyć dzięki temu. Ale to nie wszystko – pozostaje nam stwierdzić, co dokładnie trzeba zrobić, żeby dostosować treść segmentu angielskiego do nowej przecież wersji polskiej przepisu. O ile tu łatwo to niby zrobić z racji niewielkiej długości przepisu, to w przypadku przepisów wielolinijkowych nie jest to absolutnie proste – należałoby bardzo dokładnie wczytać się w cały segment polski i porównywać go, linijka po linijce, z segmentem angielskim. Jednak programy CAT zazwyczaj na szczęście mają na to radę – zarówno TRADOS, jak i Wordfast Classic oraz Wordfast Prosame wskazują te różnice:

RYS. 17

Po ich identyfikacji wystarczy dopisek „or the tax portal” w odpowiednim miejscu i tłumaczenie mamy gotowe. Co więcej, nawet w przypadku braku podobnego segmentu w bazie, poprzez interfejs z bazą terminologii Polterm (nazwa własna – jak już pisałem, to moduł Multiterm), program podaje terminologię, którą wykrył w segmencie polskim (podkreślone na czerwono elementy w tekście polskiego przepisu), jak poniżej:

RYS. 18
Terminy podane tutaj to: tax authority – organ podatkowy; elektroniczna skrzynka podawcza systemu teleinformatycznego administracji podatkowej – electronic data submission box in IT data transmission system of tax administration. Czasami też podawana terminologia jest niedokładna, np. tu – potwierdzić umowę – to confirm contract. Wynika to z faktu, że zarówno w przypadku potencjalnego odzysku terminologii powinno się ustawiać próg podobieństwa od 50 % w górę – wtedy program na pewno nie pominie żadnych podobieństw. W ten sposób uzyskujemy tłumaczenie zgodne z: a) stylistyką i treścią bazy TM; b) terminologią wpisaną do Multiterm. W związku z Multiterm właśnie, przejrzyjmy wygląd modułu terminologii w ww. programach:

RYS. 16

RYS. 19

RYS. 20

 

RYS. 21
Baza w Multiterm obsługuje format xml i może być bardzo rozbudowana, jeśli chodzi o strukturę hasła. Pokazany przykład terminu zawartego także w opisywanym segmencie obejmuje zarówno definicję polską, jej źródło i przykładowy kontekst terminu w tekście prawnym (tu: z Ordynacji podatkowej), jak i tłumaczenie tej definicji i kontekstu na j. angielski w drugiej części hasła, pod ekwiwalentem. Funkcja przeszukiwania bazy jest także bardzo precyzyjna. WF Classic z jednej strony ma prostą strukturę hasła (raptem 5 pól), ale z drugiej strony: możemy w te pola wpisać wszystkie istotne informacje nt. pojęcia, tak jak widać na przykładzie, i w związku z tym również przeszukiwać glosariusz na podstawie wszystkich tych dopisanych samodzielnie pól w celu znalezienia pożądanego terminu. Jak już zauważyłem wcześniej, WF Pro nie może się poszczycić modułem terminologii – jest on zdecydowanie najgorszy i pozwala właściwie głównie na wpis terminu i ekwiwalentu (z kolei format obsługiwany w glosariuszu i w bazie TM WF Pro to również txt, tak jak w WF Classic), ponieważ można go przeszukiwać właśnie tylko na podstawie tych dwóch elementów. Na ostatnim już zrzucie pokazuję ostatnią funkcję bardzo cenną w procesie tłumaczenia – tzw. autosuggest, o której już pisałem:

RYS. 22
Zaczynając tłumaczyć element „zgodnie z przepisami ustawy”, wystarczy że wpiszemy potencjalny ekwiwalentny element „pur”, a funkcja autosuggest podaje „pursuant to the provisions of the Act” jako jeden z możliwych ekwiwalentów. Naciśnięcie „enter” umożliwia automatyczne wstawienie tego elementu w tłumaczeniu. Oprócz pracy w tzw. project, czy, w przypadku Wordfast Classic, po prostu w sesji translacyjnej w procesie tłumaczenia, czy przygotowywania tłumaczenia dla podwykonawcy, wszystkie trzy programy umożliwiają wprowadzenie do TM gotowych dwujęzycznych segmentów stworzonych na podstawie już istniejących tłumaczeń. Służy do tego funkcja alignment, która pozwala „zestawiać” ze sobą dwa pliki – oryginału i tłumaczenia – w specjalnych modułach programów, oraz właśnie „uzgadniać” ich treść, tj. „align”. Polega to na sprawdzeniu, czy w zestawionych plikach (w formie tabeli z dwiema kolumnami, gdzie po lewej stronie mamy treść kolejnych segmentów oryginału, a po prawej – segmenty tłumaczenia) lewostronne segmenty zgadzają się strukturalnie z prawostronnymi. Jest to bardzo istotne, ponieważ na podstawie ostatecznego zatwierdzenia połączenia tak stworzonych dwujęzycznych komórek, uzyskamy dwujęzyczne segmenty w bazie TM. W ramach pracy z funkcją alignment, możemy również sprawdzić zgodność np. liczebników w obu komórkach. W programie TRADOS w głównym okienku jest osobne polecenie „ALIGNMENT”, które otwiera okienko modułu, natomiast w obu wersjach Wordfasta są to osobne aplikacje: PlusTools w wersji Classic oraz Wordfast Aligner w wersji Pro. Po odpowiednim zestawieniu treści obu plików uzyskujemy dwujęzyczne pliki txt w TRADOSIE. W Wordfast Classic aplikacja PlusTools, po naszym sprawdzeniu zgodności treści i struktury komórek lewo- i prawostronnych, sama przetwarza plik na format TM (txt), po daniu jej takiego polecenia. W wersji Pro wymagane jest stworzenie osobnego projektu w ramach WF Aligner w formacie .glp, na podstawie którego można wyeksportować dwujęzyczne pliki i stworzyć z nich TM opartą na txt. Zresztą w TRADOSIE także należy najpierw wyeksportować plik utworzony w module Alignment i jego treść zaimportować do TM. Poniżej przedstawiam obraz pracy w pliku Alignment kolejno w TRADOSIE, Wordfast Pro, oraz Wordfast Classic (właściwie w tym programie jest to zwykła tabela w okienku Worda, którą tworzy PlusTools):

RYS. 23
RYS. 24
RYS. 25


Podsumowując, opisałem najważniejsze możliwości trzech programów w procesie pre-edycji, tj. przygotowania tekstu do tłumaczenia i samego tłumaczenia, wraz z przykładami. Pozostałe możliwości wszystkich programów CAT obejmują np. wymienialność zasobów pomiędzy programami (TM i glosariuszy) i możliwość tworzenia TM z gotowych tekstów tłumaczenia po odpowiednim złączeniu ich z tekstami oryginałów, a także dość prostą aktualizację zasobów po wykonanym już projekcie tłumaczeniowym. Można pogłębiać tę wiedzę za pomocą wszelkich firmowych instruktaży wideo (np. 
”Translating a document”), a także kanałów indywidualnych użytkowników, jak i firm, na youtube, prezentujących możliwość wykorzystania większości funkcji programów, choć też nie wszystkich. Najbardziej archaicznym programem z powyższych jest oczywiście WF Classic, ponieważ jako „ostatni na placu boju” wymaga bazowego MS Word, żeby móc wykonać sesję translacyjną. Programy typu stand-alone z zasady są bardziej rozpowszechnione ponieważ tłumaczeń i innych czynności wykonuje się w ramach okienek programów, a nie na zewnątrz. Oczywiście też są odpowiednio droższe. Każdemu odpowiada co innego, więc nie jestem w stanie czegokolwiek radzić, jeśli chodzi o zakup tego czy innego programu. Może pomoże Wam mój skondensowany przegląd, jeśli w ogóle zastanawiacie się nad tym, a może po prostu przejrzycie sobie go dla poszerzenia horyzontów. Wszystkim, którzy przeczytali do końca, serdecznie dziękuję.

            

Autor(ka) Wszystkie posty

dr Tomasz Borkowski

dr Tomasz Borkowski

Tłumacz języka angielskiego, doktor nauk humanistycznych w zakresie językoznawstwa (specjalizacja: leksykografia terminologiczna). Główny terminolog w wydawnictwie Translegis, gdzie kieruje projektami tłumaczeniowymi, tłumaczeniem i rozwijaniem oraz zarządzaniem bazami w programie TRADOS: pamięci tłumaczeniowej (40 000 segmentów dwujęzycznych) oraz Polterm (13 500 haseł, w tym 1000 definicji i kontekstów). Współwydawca stale aktualizowanego zbioru polskiego prawa tłumaczonego na angielski "Polish Law Collection". Wykładowca Uniwersytetu Warszawskiego, Lingwistycznej Szkoły Wyższej w Warszawie, Wyższej Szkoły Lingwistycznej w Częstochowie; prowadzi zajęcia z tłumaczenia specjalistycznego (prawo, ekonomia) oraz z obsługi programów wspomagających tłumaczenie pisemne. W latach 2005-2006 koordynował prace w ramach projektu europejskiego EuroTermBank, przygotowującego polskie zasoby terminologiczne do integracji z innymi zasobami w ramach wolnodostępnej bazy EuroTermBank. Autor ok. 20 publikacji naukowych w czasopismach i seriach naukowych oraz Polsko-angielskiego słownika terminów prawnych POLTERM z definicjami. Członek Polskiego Towarzystwa Tłumaczy Przysięgłych i Specjalistycznych “TEPIS” oraz Komitetu Technicznego 256 ds. Terminologii, Innych Zasobów Językowych i Zarządzania Treścią w Polskim Komitecie Normalizacji.

1 komentarzSkomentuj

Skomentuj

Twój adres email nie zostanie opublikowany.