biuro tłumaczeń skrivanek

Tłumaczenia maszynowe AI bez korekty to przepis na katastrofę – szybko nie znaczy bezpiecznie

Tłumaczenia maszynowe AI bez korekty

Tłumaczenia maszynowe, czyli tłumaczenia wykonywane przez AI, szturmem wkroczyły na rynek ze względu na szybkość i niski koszt. W profesjonalnych procesach lokalizacyjnych stały się wręcz normą.

Nowoczesne silniki tłumaczeniowe w kilka sekund tłumaczą tekst, na który człowiek potrzebowałby 5 albo i więcej godzin. Jest jednak pewien problem. Za tanie i błyskawiczne tłumaczenie płacimy spadkiem jakości, bo automatyczne przekłady zawierają trudne do wychwycenia błędy merytoryczne i językowe. Zbyt ufne poleganie na surowym tłumaczeniu maszynowym (bez fachowej korekty) niesie poważne ryzyko wpadki wizerunkowej oraz kłopotów prawnych.

Tłumaczenia maszynowe AI bez korekty

Dlaczego tłumaczenia maszynowe nie wystarczają?

Nie da się zignorować faktu, że wraz z rozwojem sieci neuronowych surowe tłumaczenia maszynowe są coraz lepsze. Jednak wciąż nie gwarantują jakości wymaganej w publikacjach. Ten temat jest szeroko omawiany w literaturze branżowej. Jako przykład przywołajmy eksperyment Pavlíkovej (2022), w którym analiza czterech tekstów wykazała, że surowe tłumaczenie maszynowe zawierało średnio 10,5% błędów (m.in. błędne tłumaczenie wieloznacznych słów). Dopiero pełna postedycja (ludzka redakcja tekstu wygenerowanego przez AI) pozwoliła osiągnąć jakość porównywalną z tłumaczeniem wykonanym od podstaw przez człowieka.

Tłumaczenia maszynowe zawierają trudne do wychwycenia błędy

Nowoczesne systemy tłumaczeniowe oparte na sieciach neuronowych zrobiły ogromny postęp, ale wciąż nie rozumieją tekstu tak jak człowiek (i najprawdopodobniej nigdy nie będą go tak rozumieć). Ponieważ działają na zasadzie statystycznych wzorców, często popełniają błędy znaczeniowe i językowe.

Wśród najczęstszych słabości tłumaczy opartych na AI wymienia się przede wszystkim:

  • pozorne wrażenie poprawności,
  • błędną interpretację kontekstu,
  • dosłowne tłumaczenie,
  • niespójną terminologię,
  • błędy składniowe i literówki,
  • błędy semantyczne i logiczne,
  • zmiany w treści tekstu (zwłaszcza w nazwach własnych).

Pozorne wrażenie poprawności

Tłumaczenie brzmi gramatycznie i płynnie, ale nie oddaje sensu oryginału. Zdania wyglądają wiarygodnie, a mimo to rozmijają się z intencją tekstu źródłowego. Niekiedy błędy pojawiają się nawet w ważnych faktach: liczbach albo datach, zupełnie zmieniając znaczenie treści.

Błędna interpretacja kontekstu

AI często tłumaczy słowa poza kontekstem, wskutek czego powstają zdania bez sensu lub mylące. Przykładowo słowo o wielu znaczeniach może zostać dobrane nieodpowiednio.

Dosłowne tłumaczenie

Brak wyczucia idiomów i metafor skutkuje użyciem błędnych zwrotów. AI tłumaczy słowo w słowo tam, gdzie potrzebna jest parafraza, albo wymyśla nieistniejące związki wyrazowe, jak np. pełnić rolę (zamiast odgrywać rolę).

Niespójna terminologia

„Białkowy” tłumacz podczas pracy nad dłuższym tekstem tworzy własny glosariusz, który umożliwia konsekwentne używanie fachowych terminów. Powszechnie dostępne translatory AI oparte na sieciach neuronowych tego nie robią, dlatego w jednym, nawet krótkim tekście, obok siebie często pojawia się zróżnicowane słownictwo.

Błędy składniowe i literówki

Wraz z rozwojem technologii narzędziom AI coraz rzadziej zdarzają się potknięcia językowe, ale wciąż w długim tekście natkniemy się na co najmniej kilka błędów w odmianie końcówek lub przypadków użycia niepoprawnego szyku. Zdarza się również, że w tłumaczeniu pojawiają się litery alfabetu greckiego albo cyrylicy.

Błędy semantyczne i logiczne

Najnowocześniejsze modele są skuteczniejsze niż ich poprzednicy, ale nie są całkiem wolne od błędów semantycznych i logicznych. Często zdarzają się kalki językowe (przede wszystkim anglicyzmy), które będą kłuły w oczy użytkowników innego języka.

Zmiany w treści tekstu

Może się zdarzyć, że podczas tłumaczenia maszynowego dojdzie do nieznacznej zmiany nazwy instytucji, pojęcia, tytułu lub cytatu, co prowadzi do dezinformacji i utraty wiarygodności, jeśli nie zostanie wyłapane w odpowiednim momencie.

Brak korekty tłumaczenia maszynowego jest niebezpieczny

Poleganie wyłącznie na tłumaczeniach maszynowych, bez zaangażowania profesjonalnego tłumacza i korektora, jest obarczone dużym ryzykiem. O ile w błahych sytuacjach skutki mogą być tylko wstydliwe czy zabawne (np. menu w restauracji z kuriozalnym daniem typu „smażona przyjaźń” zamiast „smażony ryż”), o tyle w poważnych zastosowaniach trudno mówić o jakiejkolwiek wesołości…

Brak korekty tłumaczenia maszynowego grozi przede wszystkim:

  • spadkiem jakości treści,
  • stratami wizerunkowymi,
  • stratami finansowymi,
  • ryzykiem prawnym,
  • brakiem zgodności z przepisami,
  • zagrożeniem dla bezpieczeństwa i zdrowia,
  • utratą kontroli nad danymi.

Spadek jakości treści

Tłumaczenie maszynowe od samego początku było odpowiedzią na problem skali, a nie jakości. Jego rozwój napędzała eksplozja treści cyfrowych oraz presja, żeby informacje krążyły szybciej i taniej. W tym modelu gorsza jakość jest akceptowalna tak długo, jak celem treści jest ogólne zrozumienie sensu, a nie publikacja treści o wysokiej wadze. Problem zaczyna się wtedy, gdy tłumaczenia AI zaczynają być traktowane jak gotowiec.

Straty wizerunkowe

Od błędów w tłumaczeniach jest prosta droga do poważnych kłopotów: prawnych, finansowych, reputacyjnych, a nawet zdrowotnych, jeśli tłumaczenie było związane z branżą medyczną. Boleśnie przekonał się o tym bank HSBC, gdy jego slogan Assume Nothing błędnie przetłumaczono jako Do Nothing („nie rób nic”), zmieniając wydźwięk. Bank musiał ratować sytuację kosztownym rebrandingiem, a i tak wizerunkowe szkody były niemałe.

Brak zgodności z przepisami

Badanie Google Translate Errors in Legal Texts: Machine Translation Quality Assessment (Alkatheery, 2023) sprawdziło jakość tłumaczeń maszynowych tekstów prawnych z arabskiego na angielski na przykładzie pięciu aktów prawnych (łącznie 10 389 słów). Autorka przeprowadziła ręczną analizę błędów i porównywała wynik tłumaczenia maszynowego z istniejącym tłumaczeniem ludzkim jako tłumaczeniem referencyjnym.

W danych wykryto łącznie 512 błędów, co autorka interpretuje jako ok. 5% materiału. Najwięcej stanowiły błędy leksykalne (43,4%), potem błędy związane z rejestrem prawnym (30,2%) i błędy składniowe (24,8%).

Nie możemy zapominać o tym, że translatory AI nie mogą podpisać oświadczenia o dokładności tłumaczenia ani posiadać legalnej mocy tłumacza przysięgłego. Dlatego urzędowe organy i sądy odrzucają takie tłumaczenia jako niedopuszczalne, jeśli wymagane jest tłumaczenie certyfikowane.

Konsekwencje utraty kontroli nad danymi

Brawura w korzystaniu z AI mści się wyjątkowo mocno tam, gdzie pojawiają się dane poufne. Głośny przypadek norweskiej firmy Statoil (obecnie Equinor) pokazał, czym grozi wrzucanie poufnych treści do darmowych translatorów online (i chatbotów typu ChatGPT). Pracownicy tej spółki używali publicznego narzędzia do tłumaczenia planów zwolnień, haseł oraz projektów umów. Wszystkie te dokumenty wyciekły do Internetu, a dane wklejane do takiego translatora stały się możliwe do wyszukania online. Skończyło się to gigantyczną wpadką wizerunkową oraz potencjalnymi pozwami za naruszenie prywatności.

Poważne konsekwencje medyczne

Branżą równie wrażliwą na błędy w tłumaczeniu, jak prawo i finanse, jest medycyna, gdzie pozornie niewielkie pomyłki zagrażają bezpośrednio życiu i zdrowiu pacjentów. W Niemczech miała miejsce tragiczna seria powikłań po operacjach kolan. U 47 pacjentów źle wszczepiono endoprotezy, bo na zewnętrznym opakowaniu implantu angielskie oznaczenie non‐modular cemented zostało błędnie przełożone na „bez cementu”. Personel zrozumiał, że implant ma być zakładany bez cementowania, podczas gdy producent zalecał przeciwnie: cementowanie komponentu. W efekcie dziesiątki osób musiały przejść ponowne operacje naprawcze, a producent stanął przed roszczeniami odszkodowawczymi.

AI radzi sobie słabo z niszowymi językami

Modele AI są najmocniejsze w językach, w których miały najwięcej danych do nauki, czyli przede wszystkim angielskim, a także hiszpańskim, francuskim i niemieckim. Sprawa komplikuje się, gdy wchodzimy w mniej popularne języki, czyli np. język polski. W takich przypadkach jakość tłumaczenia maszynowego gwałtownie spada. Rośnie liczba przekłamań sensu, dziwnych kalek językowych i nienaturalnych konstrukcji trudnych do wychwycenia dla niewprawnego oka.

Inne podejście: AI tłumaczy, człowiek poprawia

Skoro wiemy już, że tłumaczenia maszynowe są obarczone błędami, trzeba poszukać odpowiedzi na pytanie: czy można połączyć zalety AI z niezawodnością ludzkiego tłumaczenia?

Postedycja tłumaczenia maszynowego

Najlepszym rozwiązaniem w tej sytuacji jest postedycja tłumaczenia maszynowego, czyli proces, w którym wykwalifikowany tłumacz lub redaktor poprawia i udoskonala tekst wygenerowany przez AI. Dobrze przeprowadzona postedycja podnosi jakość tłumaczenia do tego stopnia, że staje się ono praktycznie nieodróżnialne od tłumaczenia wykonanego przez człowieka.

W literaturze porównawczej (np. badanie Pavlíkovej 2022) wykazano, że tłumaczenia po postedycji osiągają jakość zbliżoną do tłumaczeń wykonywanych całkowicie przez człowieka, a surowe tłumaczenia maszynowe są zauważalnie gorsze pod względem poprawności i naturalności językowej.

AI + postedycja – niemal 100% poprawność

Badania nad jakością tłumaczeń maszynowych wykorzystują różne wskaźniki (m.in. BLEU, METEOR i TER), które mierzą zgodność tłumaczenia maszynowego z tekstem źródłowym. Te metryki pokazują, że nowoczesne silniki tłumaczenia maszynowego osiągają już bardzo wysoką bazową dokładność, szczególnie dla języków z dużą ilością danych treningowych (przede wszystkim angielskiego). Oznacza to, że znacząca część zdań jest przetłumaczona przyzwoicie, a zadaniem człowieka jest wychwycenie pozostałych i nadanie całości naturalnego brzmienia.

Postedycja tłumaczenia maszynowego – jakość i standardy

W zastosowaniach krytycznych jedynym bezpiecznym podejściem jest postedycja 100% treści przez profesjonalistów. Próby polegania na wyrywkowej kontroli lub automatycznej ocenie jakości niestety zawodzą. Nawet zdania wyglądające na dobre mogą skrywać poważne błędy, których algorytm oceny nie wychwyci. Szacuje się, że bez pełnej postedycji do odbiorcy może trafić co najmniej 5% zdań z błędami krytycznymi. W dziedzinach takich jak prawo, medycyna czy finanse jest to absolutnie nieakceptowalne ryzyko.

Norma ISO 18587 – standard jakości dla postedycji tłumaczenia maszynowego

Branża wypracowała już standardy jakości dla procesu postedycji tłumaczenia maszynowego. Norma ISO 18587 określa wymagania dla pełnej postedycji tłumaczeń maszynowych. Zakłada ona, że tłumacz wykonujący postedycję musi zweryfikować 100% tekstu i zapewnić jakość zgodną z profesjonalnymi standardami. Oznacza to, że profesjonalna postedycja spełnia te same kryteria co klasyczna korekta tłumaczenia:

  • eliminuje błędy,
  • zapewnia spójność terminologii,
  • dostosowuje styl
  • i gwarantuje, że tekst jest w pełni zrozumiały i poprawny pod każdym względem.

Takie podejście stosuje już większość profesjonalnych dostawców usług tłumaczeniowych. Wg danych zebranych przez Nimdzi od 2022 do 2024 odsetek projektów tłumaczeniowych zawierających tłumaczenie maszynowe + postedycję wzrósł globalnie z 26% do prawie 46% (w zaledwie 2 lata!). Możemy więc założyć, że nadeszła prawdziwa rewolucja na rynku, a odsetek firm korzystających z tego rozwiązania będzie stale rósł.

Tłumaczenie maszynowe pod lupą

Branża Konsekwencje braku korekty Korzyści z postedycji
Tłumaczenia marketingowe Zniekształcone slogany; nieodpowiedni ton lub faux pas kulturowe szkodzące wizerunkowi marki; niezrozumiały przekaz marketingowy. Zachowanie intencji i tonu komunikacji; lokalne dostosowanie kulturowe treści; spójny, atrakcyjny przekaz marketingowy.
Tłumaczenia e-commerce Błędne opisy produktów wprowadzające klienta w błąd; zwroty i reklamacje; niespójna terminologia na stronie; spadek zaufania do sklepu. Poprawne informacje o produkcie; ujednolicona terminologia; mniejsza liczba zwrotów i pytań od klientów; profesjonalny wizerunek sklepu.
Tłumaczenia techniczne Niejasna lub błędna dokumentacja użytkownika; pomyłki terminologiczne skutkujące błędami w obsłudze urządzeń lub oprogramowania; niespójność między interfejsem a instrukcją. Techniczna poprawność przekładu; instrukcja zrozumiała dla czytelnika; spójność tłumaczeń w całym ekosystemie.
Tłumaczenia prawne i finansowe Niejednoznaczność lub sprzeczność w klauzulach umowy; ryzyko sporów sądowych lub nieważności dokumentu; naruszenie poufności. Terminologiczna i prawna poprawność tłumaczenia; jednoznaczność i zgodność z intencją oryginału; poufność danych.
Tłumaczenia medyczne Błędy w dawkowaniu lub przeciwwskazaniach zagrażające zdrowiu pacjenta; niespełnienie wymogów regulacyjnych; niezrozumiały język dla personelu lub pacjenta. Kliniczna dokładność i bezpieczeństwo; pełna zgodność z wymogami urzędowymi; zrozumiały przekaz dla lekarzy i pacjentów; wrażliwe dane medyczne pod kontrolą.

Rola człowieka w tłumaczeniach maszynowych

Czynnik ludzki pozostaje decydujący w zapewnianiu jakości tłumaczeń, ponieważ tylko człowiek naprawdę rozumie kontekst komunikacji i cel przekazu. Tłumacz-profesjonalista podczas pracy zadaje sobie pytanie: „Co autor miał na myśli i jak najlepiej oddać to w języku docelowym?”. Maszyna, nawet oparta na skomplikowanych sieciach neuronowych, nie jest w stanie tego zrobić.

Tylko człowiek rozumie 100% intencji tekstu

AI nie pojmie intencji, ponieważ polega na statystyce, a nie semantyce. Ponadto człowiek bierze pod uwagę uwarunkowania kulturowe i subtelności języka. Wie, jakie sformułowanie zabrzmi naturalnie dla odbiorcy z danej kultury, a czego lepiej unikać. Ma też świadomość, jakie są konsekwencje prawne i wizerunkowe słowa pisanego, i dzięki temu zachowuje należytą ostrożność tam, gdzie trzeba (np. w doborze wyrażeń grzecznościowych).

Tylko „białkowy” tłumacz jest w stanie wziąć na siebie odpowiedzialność za przetłumaczone teksty. Profesjonalista zawsze zachowuje zdrowy sceptycyzm: nawet jeśli korzysta z podpowiedzi AI, weryfikuje je, sprawdza fakty, liczby, nazwiska, terminy. Jak ujęto trafnie w jednym z artykułów, nasza wewnętrzna intuicja i umiejętność analizy tekstu to coś, czego AI nie uda się nigdy osiągnąć na eksperckim poziomie.

Pierwszy krok: tłumaczenie maszynowe, drugi krok: postedycja wykonana przez człowieka

Nie należy demonizować AI ani tłumaczeń maszynowych, ponieważ ich szybkość, wydajność i stale rosnąca dokładność to atuty, z których warto korzystać. Jednak nie można na nich bezkrytycznie polegać. Brak ludzkiej korekty szybko się mści, a niepoprawione błędy w przekładzie ciągną za sobą poważne skutki.

Rozsądne jest korzystanie z AI i wprowadzenie ludzkiej korekty. Niech maszyna wykonuje pracę wstępną, a człowiek będzie odpowiedzialny za ostateczną jakość. Postedycja tłumaczeń maszynowych czyni przekład pełnowartościowym (i w 100% jakościowym).

Źródła

  • https://pure.rug.nl/ws/portalfiles/portal/1400658553/Perspectives_on_Machine_Translation_Post-Editing_and_Automation_Library.pdf
  • https://www.jwp.pl/tlumaczenia-maszynowe-korzysc-czy-zagrozenie/
  • https://l10njournal.net/index.php/home/article/view/7
  • https://www.nimdzi.com/the-mtpe-efficiency-gap
  • https://www.across.net/en/knowledge/blog/translation-errors-and-their-consequences/
  • https://skrivanek.pl/en/translation-mistakes-in-international-marketing-campaigns/
  • https://ec.europa.eu/assets/eac/languages/policy/strategic-framework/documents/elan_en.pdf
  • https://english.hani.co.kr/arti/english_edition/e_business/471473.html
  • https://slator.com/translate-com-exposes-highly-sensitive-information-massive-privacy-breach/
  • https://www.biomapas.com/regulatory-documents-translation-process-how-to-ensure-consistency-and-correctness/
  • https://awej-tls.org/wp-content/uploads/2023/02/16.pdf
  • https://multilingual.com/articles/medical-translation-basics/
Privacy Preferences
When you visit our website, it may store information through your browser from specific services, usually in form of cookies. Here you can change your privacy preferences. Please note that blocking some types of cookies may impact your experience on our website and the services we offer.