Czy w 2015 roku można żyć bez kota?

Oczywiście, że tak. Można przecież mieć psa. Gdyby rzecz dotyczyła miaucząco-szczekających zwierząt futerkowych, pewnie w tym miejscu mógłbym postawić kropkę i odjechać w kierunku zachodzącego słońca, ale tym razem mowa o gatunku Felis catus cyberneticus lub — w wersji ponurej wspomagających pracę tłumacza tzw. narzędziach CAT (ang. Computer-Assisted Translation). Najpopularniejszym zwierzęciu branżowym.

Na tym jednak warto zakończyć mitologię tych aplikacji, bowiem wszędzie tam, gdzie pojawia się technologia, świat tłumaczeń bardzo lubi nadinterpretować i wieszczyć zamach na etos zawodu. Utnijmy więc spekulacje i bez uprzedzeń (ale i nadmiernego entuzjazmu!) zerknijmy na narzędzia CAT w szerszym kontekście.

Zacznijmy od tego, że nie ma niczego mistycznego w tej rodzinie aplikacji. Powstały jako narzędzia, które miały realizować konkretne zadanie i skutecznie realizują je już od 30 lat. Zakres tego zadania jest obecnie znacznie szerszy niż kiedyś planowano, ale podstawą istnienia narzędzia CAT jest podobieństwo dokumentów. To, że jest ono powszechne, jest oczywiste dla wszystkich tłumaczy — nawet tych, którzy z omawianych tu programów nie korzystają. Tworzymy tysiące dokumentów, często wzorując się na już istniejących, a w każdej dziedzinie funkcjonuje wiele podobnych zwrotów orbitujących wokół skończonego zbioru terminów. Skoro tak, to powtarzanie się fragmentów tekstów jest zjawiskiem naturalnym. Nie sposób oszacować go całościowo, bo przecież łatwo znaleźć dwa dokumenty, które w ogóle nie mają ze sobą nic wspólnego, ale łatwo znaleźć również dwa niemal identyczne. Prawda pewnie leży gdzieś pośrodku. Warto jednak zauważyć, że to właśnie podobieństwo dokumentów spowodowało, że przytłoczone tysiącami dokumentów korporacje zaczęły myśleć o rozwoju technologii wspomagania tłumaczeń. Tak, CAT-y powstały dlatego, że ogromne organizacje nie były w stanie poradzić sobie z wielojęzyczną treścią i zapanować nad jej spójnością. No i oczywiście dlatego, że niespecjalnie chciały dwukrotnie tłumaczyć te same teksty, nie wiedząc, że czy? już zostały wcześniej przetłumaczone.

Jak sprawdzić podobieństwo dokumentów, jeśli tłumaczymy je w odstępie roku, dwóch? O ile nie jest się słoniem, szansa na zapamiętanie tylu tekstów jest niewielka. A i słoń zapewne znajdzie wiele ciekawych spraw do zapamiętania. Ludzie i słonie do zapamiętywania dużej porcji informacji przez dłuższy czas powinni po prostu skorzystać z baz danych, czyli po prostu specjalnej szuflady na cyfrowe informacje. Sposobów jej organizacji są obecnie dziesiątki, więc najprościej wyobrazić ją sobie jako magazyniera, który przyjmuje i wydaje paczki. Jak dokładnie to robi, czy po drodze robi np. backflip wózkiem widłowym, nikt nie musi wiedzieć. Jeśli coś znajdzie – dostaniemy to. Jeśli nie – trudno, nie mamy Pańskiego płaszcza i co Pan nam zrobi?

keyboard_klawiatura_Eric Norris_Flickr_cropped

Od tej pory sprawa była już prosta. Najważniejsza była majestatycznie i (koniecznie!) nietechnicznie brzmiąca nazwa. Reminiscencja przekładu nie przeszła, zatem została po prostu pamięć tłumaczeń. Skoro nasza baza danych miała już ładną nazwę, pozostało tylko ją odpowiednio zorganizować. W narzędziach CAT najważniejsze jest takie przechowywanie informacji, aby dało się odnaleźć możliwie najwięcej podobnych fragmentów i aby możliwe było zidentyfikowanie kontekstu. Choć możliwe są różne przypadki, tekst najczęściej dzielony jest na zdania.Do naszej bazy danych trafia zatem całe zdanie z podpiętym do niego przetłumaczonym zdaniem w innym języku. Wyszukiwanie polega więc na porównaniu zdania z dokumentu ze zdaniem przechowywanym w pamięci tłumaczeń. Nie ma znaczenia, czy przechowujemy je tam od dwóch sekund czy od dwóch lat. Otrzymamy odpowiedź w postaci podobnego lub identycznego segmentu. Zobaczymy też kto i kiedy je utworzył. W zależności od konfiguracji można będzie również zobaczyć dodatkowe informacje, np. nazwę pliku lub projektu, z którego pochodzi.Podpowiedź możemy całkowicie zignorować. Możemy też zaproponowany tekst wykorzystać do zbudowania odpowiedniego tłumaczenia aktualnego fragmentu tekstu. Identyczny fragment, jeśli pasuje w danym miejscu, możemy po prostu zaakceptować. Takie operacje trwają znacznie krócej niż wymyślenie tłumaczenia całkowicie od zera. Dodatkową korzyścią jest zachowanie spójności z wcześniej przetłumaczonymi tekstami. Podobieństwo jest zawsze mierzone w procesie analizowania dokumentów. Program porównuje w tle wszystkie segmenty po kolei z zawartością pamięci tłumaczeń i odnotowuje wyniki. Wyniki te są najczęściej przedstawiane w postaci tabeli z informacją o liczbie segmentów, które cechuje dany próg podobieństwa.Na przykład segmenty różniące się od zapamiętanych w pamięci tłumaczeń jedynie kropką będą oceniane jako zgodne w 95-99%. Programy zmierzą także liczbę powtórzeń, a czasem również sprawdzą czy w dokumencie nie występuje tzw. wewnętrzne podobieństwo, czyli czy poszczególne fragmenty dokumentu nie są do siebie wzajemnie podobne. Wynik analizy umożliwia rzetelne rozliczenie projektu i oszacowanie nakładu pracy niezbędnego do ukończenia tłumaczenia. Kwestia modelu rozliczeniowego i stawek to odrębny temat – narzędzia CAT nie mają z nim wiele wspólnego.

Takie podejście będzie się sprawdzać wszędzie tam, gdzie może wystąpić podobieństwo na poziomie całego zdania. Jeśli powtarzają się tylko pojedyncze słowa, też oczywiście mamy do dyspozycji szereg narzędzi, które mogą nam pomóc i przyspieszyć proces edycji. Jeśli jednak trafiamy na tekst całkowicie różny od wszystkich dotychczasowych, tekst, w którym nie można skorzystać z funkcji związanych z liczbami, datami, terminologią itd., to CAT mimo to pozostaje przezroczysty w tym rozumieniu, że nie wydłuża pracy tłumacza, a przy okazji zapamiętuje na przyszłość wszystkie przetłumaczone teksty. Statystyczny tłumacz rocznie tłumaczy około 500 tysięcy słów, więc budowanie swojego kapitału w postaci pamięci tłumaczeń prędzej czy później się opłaci. Narzędzia CAT w obecnej generacji to prawdziwe promy kosmiczne, które oprócz podstawowej funkcji mają w zanadrzu wszelkie możliwe funkcje poboczne, które mogą się przydać tłumaczowi. No, prawie wszystkie. Parzenia kawy jeszcze w CAT-ach nie widziałem. Gdy kilkanaście lat temu zaczynałem swoją przygodę z tymi programami, wierzyłem głęboko, że niemal wszystkim tłumaczom są one niezbędne. Dziś pytanie „czy używać CAT-ów” stało się już nieco niepoważne, bo używa ich większość tłumaczy pisemnych na świecie, ale nieco inaczej patrzę na kwestię tego, kto powinien ich używać. Jest nadal ogromna rzesza tłumaczy, którzy nie rozumieją idei tych narzędzi, traktuje je jako zamach na ich kunszt pracy. Spora grupa tłumaczy nadal ma niestety problemy z obsługą komputera. To widać na szkoleniach. O dziwo, również u części młodszych adeptów tego zawodu. CAT-y nie są może specjalnie skomplikowanym oprogramowaniem, ale wymagają poznania podstaw informatyki, odróżniania folderu od pliku, umiejętności zarządzania plikami na dysku, wyszukiwania informacji, rozumienia, czym jest archiwum zip itd. Nie odpowiem dziś więc, że narzędzia wspomagania tłumaczeń są dla wszystkich. Z całą pewnością jednak nie należy się obawiać wyprawy w świat kotów. Taka wyprawa to raptem parę godzin eksperymentów na darmowej wersji tego czy innego narzędzia. Warto naostrzyć maczetę i ruszyć na wyprawę przez dżunglę. Gwarantuję, że jadowitych pająków nie będzie.

jungle_dżungla_Kai Lehmann_Flickr

 

Posłuchaj także wywiadu z Agenorem w radiu TOK FM.

Fot. A.Davey / Flickr; Eric Norris / Flickr (wykadrowana); Kai Lehmann / Flickr

Autor(ka) Wszystkie posty

dr inż. Agenor Hofmann-Delbor

dr inż. Agenor Hofmann-Delbor

Absolwent informatyki na Politechnice Szczecińskiej, gdzie w 2008 obronił rozprawę doktorską z zakresu algorytmów mrowiskowych i teorii zbiorów przybliżonych. Od kilkunastu lat aktywny uczestnik branży tłumaczeniowej w Polsce, autor licznych kursów edukacyjnych, przewodników i artykułów z zakresu narzędzi CAT i lokalizacji oprogramowania. Od 2006 roku certyfikowany trener SDL Trados z akredytacją producenta do wdrażania zaawansowanych rozwiązań serwerowych. W branży podejmował się różnych ról: tłumacza, trenera, koordynatora działu informatycznego, kierownika projektów, dyrektora ds. rozwoju, dyrektora sprzedaży, testera lokalizacji oprogramowania i wiele, wiele innych. Założyciel firmy Localize.pl. Pomysłodawca i organizator jednej z największych cyklicznych europejskich konferencji branżowych „The Translation and Localization Conference” oraz „Konferencji tłumaczy”. Autor kursów lokalizacji oprogramowania realizowanych na wielu uczelniach w kraju. Założyciel i moderator grupy „TŁUMACZENIA” na Facebooku. Prywatnie pasjonat demosceny, motoryzacji, wokalista i gitarzysta.

komentarze 3Skomentuj

  • Miałem krótkie szkolenie z CATów na studiach i zgadzam się, że są bardzo pomocne. Im więcej doświadczenia = pamięci, tym łatwiej, więc zainwestować pewnie warto.

  • Fajny artykuł lecz zupełnie pomija Pan w nim istnienie tłumaczy przysięgłych, do których należę również ja. Używam komputera w swojej pracy od zawsze – wiem co to plik, folder, rozszerzenie i nawet potrafię postawić sobie na dysku Ubuntu obok Windowsa 🙂 Jednak nie zdecydowałem się nigdy na zakup Tradosa za dwa tysiące PLN, gdyż sądzę, że w moim przypadku jedynie zbierałby kurz. Kotki nie są jeszcze na tyle sprytne, żeby na skanie oddzielić okrągłą pieczęć od tekstu , który ona zakrywa i podzielić tekst zawarty w słabej jakości obrazie na sensowne segmenty (oczywiście dopiero po wcześniejszym potraktowaniu tego obrazu OCR -em). Powtarzalne w jakimś tam zakresie teksty do tłumaczenia niepoświadczonego trafiają mi się raz na rok – zatem darmowa wersja Wordfasta w zupełności mi wystarcza.

Skomentuj

Twój adres email nie zostanie opublikowany.