Tłumaczenie maszynowe – wady i zalety

tłumaczenie maszynowe, tłumaczenia maszynowego, systemy tłumaczenia bezpośredniego, tłumaczenie wspomagane

Artykuły 3 grudnia 2019

Tłumaczenie maszynowe (w skrócie MT) swoje pierwsze kroki stawiało w latach 50. XX wieku. Na początku były to tłumaczenia oparte na regułach (ang. rule-based machine translation – RBMT). Dziś są to znacznie bardziej zaawansowane narzędzia, które działają na bazie sieci neuronowych i baz danych składających się z miliardów słów i zwrotów. Czy to koniec zawodu tłumacza?

Podobno pierwsze pomysły związane z tłumaczeniem maszynowym (w skrócie MT – od angielskiego określenia machine translation) sięgają jeszcze XVII wieku. Oczywiście wtedy, z przyczyn technologicznych, pozostawało to w sferze marzeń. Jednak wraz z rozwojem komputerów, Internetu i sztucznej inteligencji, stało się to możliwe.

Tłumaczenie maszynowe dzisiaj

Dziś systemy tłumaczenia maszynowego to złożone aplikacje, oparte o technologię ML (machine learning), które samodzielnie tłumaczą teksty z języka wyjściowego na docelowy. Wykorzystują do tego celu ogromne bazy danych, zawierające setki milionów słów i zwrotów. Na tej podstawie system podejmuje decyzję, jaki sposób tłumaczenia będzie najwłaściwszy.

Aplikacje MT wykorzystują takie nowoczesne technologie jak deep learning, big data czy cloud computing.

W efekcie z roku na rok stają się coraz skuteczniejsze, a praca przez nie wykonywana – coraz dokładniejsza.

Microsoft Translator

Jako przykład do dalszych rozważań posłuży nam Microsoft Translator*. Jest to jeden z najbardziej zaawansowanych systemów tłumaczenia maszynowego na świecie. Początkowo opierał się on wyłącznie na statystycznym tłumaczeniu maszynowym (SMT), co oznacza, że dla danego zdania poszukiwane było jego najbardziej prawdopodobne tłumaczenie – statystycznie najczęściej występujące w bazie danych translatora.

Co znajduje się w takiej bazie? Najprostszy przykład z brzegu – cała baza wpisów Wikipedii**. Aby pokazać skalę, wystarczy wspomnieć, że sama anglojęzyczna Wikipedia zawiera około 3,5 miliarda słów***.

Obecnie jednak Microsoft koncentruje się na technologii zwanej neural machine translation (NMT). Nie oznacza to, że tłumaczenie statystyczne SMT zostało zarzucone. Nowa technologia ma za zadanie je uzupełniać i przez to znacznie zwiększyć dokładność tłumaczenia. NMT jest rozwijana od 2016 roku.

Nadal do działania wymagana jest ogromna baza danych, ale nowy system pozwala tłumaczyć nie tylko na podstawie częstotliwości występowania danego tłumaczenia, ale też kontekstu, w jakim się ono pojawia w tekście. Działa to podobnie jak kamień z Rosetty. Nie chodzi o (nomen omen) mechaniczne tłumaczenie słowo w słowo, ale o przekład całych fragmentów tekstu (także idiomów) w wielu parach językowych.

System Microsoft Translator najpierw „odczytuje” tekst źródłowy, a następnie go dekoduje, aby powstało jak najlepsze tłumaczenie. Nie przekłada słów, tylko całe frazy i zwroty, z uwzględnieniem kontekstu, w którym one występują. Celem jest sprawienie, aby tłumaczenie wyglądało na wykonane przez człowieka. Dlatego podczas prac nad tym systemem programiści „uczą” translatora, aby rozpoznawał i brał pod uwagę takie kwestie jak: rodzaj rzeczowników, poziom formalności wypowiedzi (od slangu po styl formalny), czy rodzaj słowa (rzeczownik, czasownik itp.).

tłumaczenie maszynowe, tłumaczenia maszynowego, tłumaczenia maszynowe, tłumaczenie instrukcji obsługi

tłumaczenie maszynowe, tłumaczenia maszynowe, tłumaczenie oparte, tłumaczenie automatyczne

tłumaczenie maszynowe, tłumaczenia maszynowe, tłumaczenie wspomagane maszynowo

Zalety tłumaczeń maszynowych

Główną zaletą oferowaną przez tłumaczenie maszynowe jest odciążenie tłumacza ze żmudnej pracy polegającej na tłumaczeniu setek albo tysięcy podobnych do siebie treści. Najlepszy przykład to różnego rodzaju bazy danych. Często zawierają one tysiące zbliżonych do siebie wpisów. Obecnie już nie ma potrzeby, żeby człowiek przepisywał je ręcznie, rekord po rekordzie. Znacznie szybciej, i wielu wypadkach równie dobrze, wykona to system tłumaczenia maszynowego.

Inny przykład, gdzie systemy MT doskonale spełnią swoją rolę, to teksty typowo techniczne lub prawnicze. Słowa pojawiające się w takich materiałach mają bardzo jednoznaczny sposób przełożenia na język docelowy, a pole do „inwencji twórczej” ze strony tłumacza jest niewielkie.

Druga zaleta to przyspieszenie prac translatorskich. Są fragmenty i teksty, które nie wymagają doświadczonego oka tłumacza, aby zostały prawidłowo przetłumaczone. Szczególnie gdy pracujemy na językach popularnych i przez to posiadających duże bazy danych (np. para językowa polski-angielski). W takim wypadku rola biura tłumaczeń obejmuje weryfikację pracy wykonanej przez maszynę, poprawienie ewentualnych błędów i opracowanie całości w sposób uzgodniony z klientem.

Wady tłumaczeń maszynowych

W tym miejscu jednak nie można zapomnieć o wadach. Zagadnienie to wyjaśnia Agata Nowak z biura tłumaczeń Skrivanek: „są teksty, z którymi systemy tłumaczenia maszynowego prawdopodobnie nigdy sobie nie poradzą, a na pewno nie stanie się to w bliskiej przyszłości. Są to wszelkiego rodzaju treści, które niosą ze sobą przekaz emocjonalny. Nieprędko maszyna będzie umiała prawidłowo oddać uczucia i emocje człowieka. A zatem póki co systemy MT nie radzą sobie na przykład z tłumaczeniem tekstów literackich: wierszy, bajek czy pieśni. Nadal potrzebny jest tu doświadczony umysł żywego tłumacza”.

Druga sprawa to fakt, że tłumaczenie maszynowe nadal wymaga sprawdzenia przez człowieka. Nie można po prostu wrzucić tekstu do systemu i oddać klientowi bez weryfikacji, ponieważ to przepis na katastrofę.

Dlatego najlepsze rozwiązanie to takie, w którym człowiek współpracuje z maszyną. Rola człowieka w tłumaczeniach maszynowych różni się w zależności od rodzaju dokumentu. Czasem jest to przygotowanie tekstu dla maszyny (np. rozbicie zbyt złożonych zdań na kilka krótszych), a czasem sprawdzenie tłumaczenia po maszynie (tzw. postedycja). I to jest przepis na dobrze przetłumaczony tekst. Niezależnie od tego, czy mówimy o instrukcji obsługi maszyny drukarskiej, ulotce leku na ból głowy czy o umowie handlowej.

* https://www.microsoft.com/en-us/translator/business/machine-translation/

** https://gadzetomania.pl/4498,dokladne-tlumaczenia-maszynowe-staja-sie-rzeczywistoscia-dzieki-microsoftowi

*** https://en.wikipedia.org/wiki/Special:Statistics

Obrazy znajdujące się w tekście zostały wygenerowane przy pomocy AI.