Strojový preklad je dnes taký kvalitný, že v mnohých prípadoch ho už nie je možné odlíšiť od ľudského prekladu. Prekladateľské služby pracujú plynulo, idiomaticky a s citom pre štýl. Potom však preložíte dátový záznam DPP - a zrazu sa z „rear lock fiber closure“ stane „uzáver vlákna na zadnom zámku“.
Problémom je odborná terminológia. Tu vysvetľujeme, prečo sa s údajmi o produktoch nesmie zaobchádzať ako s románmi a aké nástroje poskytuje Transpareo, aby vašich 39 jazykových verzií zostalo zrozumiteľných.
Základný problém: jedno slovo, viacero významov
„Seal“ v DPP outdoorovej bundy: tesnenie. „Seal“ v laboratóriu: tuleň alebo tesnenie, podľa kontextu. „Seal“ v protokole údržby: za určitých okolností pečať.
Všeobecný prekladový model vyberá na základe štatistického kontextu. Pri plynulom texte to funguje - román poskytuje dostatok kontextu. Pri dátovom poli primary_closure: seal je kontext takmer nulový. Model len hádá.
Dôsledkom sú nenápadné chyby. Nie sú síce tak dramatické ako „Hinterschloss-Faserverschluss“, ale majú závažné následky: komponent, ktorý sa v nemčine nazýva „Dichtung“, sa v talianskom DPP zrazu volá „sigillo“ namiesto „guarnizione“. Nákupca už túto náhradnú súčiastku nedokáže nájsť.
Čo dnes Transpareo ponúka
Náš prekladový systém automaticky prenáša každý nový obsah do všetkých aktívnych jazykov. Vyznačuje sa štyrmi vlastnosťami:
-
Zachovanie formátovania Markdown a premenných: Pred prekladom sa extrahujú zástupné symboly, ako napríklad
<a href="/sk/zaregistrovať sa">Pro-členstvo</a>, a štruktúry Markdown; prekladá sa samotný text a následne sa štruktúry opäť vložia bez zmien. Vďaka tomu zostávajú odkazy, formuláre a rozloženie konzistentné vo všetkých jazykoch. - Centrálne prekladové záznamy: Preklady sa neukladajú priamo v samotnom dátovom zázname, ale v zdieľanej vrstve. Viacero dátových záznamov s rovnakým pôvodným textom zdieľa jeden preklad. To šetrí náklady na preklad a automaticky zjednocuje pojmy v rámci celého dátového modelu.
- Automatický nový preklad pri zmene: Ak sa zmení pôvodný text, preklady vo všetkých jazykoch sa vygenerujú nanovo. Oprava v nemčine - 38 ďalších jazykových verzií sa aktualizuje automaticky.
- Označenia pre každý záznam: Obsah je možné vylúčiť z automatického prekladu alebo existujúce preklady zafixovať - napríklad v prípade medzinárodných názvov produktov alebo ručných opráv.
Kde zákazník dopĺňa spracovanie
Automatický preklad poskytuje z väčšej časti správne výsledky pre popisné texty, marketingové texty a návody na údržbu. V prípade kritickej odbornej terminológie - napríklad „seal“/„guarnizione“ - zostáva určitý počet chýb, ktoré musí opraviť správca na strane zákazníka.
Správca má v tomto prípade k dispozícii tri možnosti:
- Ručné prepísanie pre každý jazyk a kľúč: Každý prekladový záznam je možné otvoriť v Správcovi aplikácií a prispôsobiť pre každý jazyk. Označením „Zafixovať“ sa tento ručný preklad zachová aj pri nasledujúcom automatickom prebehu.
- Import glosára: Existujúcu terminológiu z prekladateľských nástrojov alebo PDF glosárov je možné načítať vo formáte CSV a vytvoriť tak priamo napísané prekladové záznamy.
- Opravy pre jednotlivé jazyky počas prevádzky: Talianske obchodné oddelenie zistí chybu, opraví ju v Správcovi aplikácií - oprava nadobudne platnosť okamžite, ostatné preklady zostanú nedotknuté.
Realita jazykov EÚ
24 úradných jazykov EÚ znie ako veľa. V praxi sa delia do troch skupín:
- Kľúčové trhy: DE, EN, FR, IT, ES, NL - tu každý spotrebiteľ očakáva dokonalosť
- Významné trhy: PT, PL, SV, DA, FI - dobrá úroveň, občas je vidieť, že ide o strojový preklad
- Menej bežné jazyky: MT, GA, ET, LV, LT - niekedy sa vyskytne DPP v maltčine, hoci žiadny konečný spotrebiteľ na Malte tento text nikdy neprečíta. Napriek tomu je to povinnosť.
Táto povinnosť nie je voliteľná. Nariadenie ESPR vyžaduje obsah DPP v jazyku členského štátu, v ktorom sa produkt predáva. Kto obsluhuje 27 štátov, má teda v hre 24 jazykov (niektoré štáty zdieľajú jazyky).
Prečo centralizovaná lokalizačná vrstva
Väčšina platforiem ukladá preklady ako dodatočné polia v dátovom zázname: description_de, description_en, … 39 polí na každý prekladateľný atribút. Znie to jednoducho, má to však tri nevýhody:
- Dvojité uchovávanie textu. Dva produkty s rovnakým popisom materiálu generujú 39 + 39 prekladov namiesto jedného súboru 39 prekladov
- Ťažko škálovateľné. Pridanie 40. jazyka znamená: migráciu schémy vo všetkých prekladateľných modeloch
- Opravy sa ťažko aplikujú globálne. Ak sa slovo „guarnizione“ opraví všade, museli by sa všetky záznamy upravovať jednotlivo
Rozdelená prekladová vrstva tento problém rieši: jeden záznam, veľa odkazov. Jedna oprava, z ktorej majú prospech všetky záznamy.
Čo ešte nemáme
Databáza terminológie špecifická pre zákazníka s automatickým rozpoznávaním návrhov je v pláne vývoja, v súčasnosti však nie je k dispozícii. Kto začne dnes, s existujúcimi nástrojmi sa dostane ďaleko: ručné prepísanie, import glosárov a označenie „zachovať“ pokrývajú najčastejšie prípady použitia.
Veríme, že stroje by mali vykonávať väčšinu práce a ľudia by mali zasahovať len tam, kde je to skutočne potrebné. Kým nebude k dispozícii automatické rozpoznávanie terminológie, ručné nastavenie je transparentné - a to je úprimnejšie ako sľub, ktorý sa nesplní.
