Mašinsko prevođenje je sada toliko dobro da se u mnogim slučajevima ne može razlikovati od ljudskog prevođenja. Prevodilačke službe proizvode tečne, idiomatske prijevode sa osjećajem za stil. Onda prevedete skup podataka DPP-a - i odjednom ‘rear lock fibre closure’ postaje ‘Hinterschloss-Faserverschluss’.
Problem je tehnička terminologija. Ovdje objašnjavamo zašto se podacima o proizvodima ne bi trebalo pristupati kao da su romani i koje alate Transpareo pruža kako bi se osiguralo da vaše 39 jezičkih verzija ostanu razumljive.
Osnovni problem: jedna riječ, više značenja
‘Zaptivač’ u DPP-u za vanjsku jaknu: vodootpornost. ‘Zaptivač’ u laboratoriju: zaptivač (životinja) ili brtva, u zavisnosti od konteksta. ‘Zaptivač’ u dnevniku održavanja: moguće pečat (kao štamparski pečat).
Opći model prevođenja donosi odluku na osnovu statističkog konteksta. To funkcioniše za kontinuirani tekst - roman pruža mnogo konteksta. Ali za polje s podacima kao što je primary_closure: seal, gotovo da nema konteksta. Model donosi informisanu pretpostavku.
Rezultat su suptilne greške. Ne tako dramatične kao ‘Hinterschloss-Faserverschluss’, ali značajne: komponenta koja se na njemačkom naziva ‘Dichtung’ iznenada se naziva ‘sigillo’ umjesto ‘guarnizione’ u italijanskom DPP-u. Kupac više ne može pronaći rezervni dio.
Šta Transpareo danas postiže
Naš sistem za prevođenje automatski prevodi svaki novi sadržaj na sve aktivne jezike. Karakterišu ga četiri ključne karakteristike:
-
Očuvanje Markdowna i varijabli: Mjesta držača kao što su
<a href="/bs/Registruj se">Pro-Membership</a>i Markdown strukture se izdvajaju prije prevođenja; obični tekst se prevodi, a strukture se zatim vraćaju nepromijenjene. Ovo osigurava da linkovi, obrasci i izgled ostanu dosljedni na svim jezicima. - Centralizirani prijevodi: Prijevodi se ne pohranjuju unutar samog zapisa podataka, već u zajedničkom sloju. Više zapisa podataka sa istim izvorom teksta dijeli jedan prijevod. To štedi na troškovima prevođenja i automatski standardizira terminologiju u cijelom modelu podataka.
- Automatsko ponovno prevođenje prilikom izmjena: Ako se izvorni tekst promijeni, prijevodi u svim jezicima se ponovo generišu. Ispravka na njemačkom jeziku automatski ažurira 38 ostalih jezičkih verzija.
- Označavanje po zapisu podataka: Sadržaj se može isključiti iz automatskog procesa ili se postojeći prijevodi mogu zaključati - na primjer, za međunarodne nazive proizvoda ili ručne korekcije.
Gdje kupac dopunjuje obradu
Automatski prijevod uglavnom daje tačne rezultate za opisne tekstove, marketinške sadržaje i upute za njegu. Međutim, kod ključne tehničke terminologije - kao što je ‘brtva’/’guarnizione’ - ostaje mali broj grešaka koje administrator klijenta mora ispraviti.
Ovdje administrator ima tri opcije:
- Ručno prepravljanje po jeziku i ključnoj riječi: Svaki unos za prevođenje može se otvoriti u Upravitelju aplikacije i prilagoditi za svaki jezik. Odabirom opcije ‘zaključaj’, ovaj ručni prijevod će biti sačuvan u sljedećem automatskom pokretanju.
- Uvoz rječnika: Postojeća terminologija iz alata za prevođenje ili PDF rječnika može se uvesti kao CSV datoteka i koristiti za direktno generisanje unosa za prevođenje.
- Korekcije po jeziku dok sistem radi: Italijanski prodajni tim primijeti grešku, ispravi je u Upravitelju aplikacije - ispravka stupa na snagu odmah, dok ostali prijevodi ostaju nepromijenjeni.
Stvarnost jezika EU
24 službena jezika EU zvuči kao mnogo. U praksi, oni spadaju u tri kategorije:
- Osnovna tržišta: DE, EN, FR, IT, ES, NL - ovdje svaki potrošač očekuje savršenstvo
- Značajna tržišta: PT, PL, SV, DA, FI - dobar standard, iako je mašinski prijevod povremeno primjetan
- Rijetki jezici: MT, GA, ET, LV, LT - ponekad imate DPP na maltaljskom bez da ga ikada skenira krajnji potrošač na Malti. Ipak, obavezno je.
Ovaj zahtjev nije opcionalan. ESPR nalaže da se sadržaj DPP-a dostavi na jeziku države članice u kojoj se proizvod prodaje. Stoga svako ko opslužuje 27 zemalja mora da se nosi sa 24 jezika (neke zemlje dijele jezike).
Zašto centralizirani sloj lokalizacije?
Većina platformi pohranjuje prijevode kao dodatna polja u zapisu podataka: description_de, description_en, … 39 polja po prijevodnom atributu. Zvuči jednostavno, ali ima tri nedostatka:
- Duplikirani tekst. Dva proizvoda sa istom napomenom o materijalu generišu 39 + 39 prijevoda umjesto samo 39
- Teško skaliranje. Dodavanje 40. jezika podrazumijeva migraciju šeme za sve prevodive modele
- Teško je primijeniti ispravke globalno. Ako se ‘guarnizione’ ispravi svugdje, sve zapise podataka bi trebalo urediti pojedinačno.
Razdvojeni sloj prevođenja to rješava: jedan unos, mnogo referenci. Jedna ispravka, a koriste svi zapisi podataka.
Šta još nemamo
Databaza prilagođene terminologije sa automatskim prepoznavanjem prijedloga je u razvoju, ali trenutno nije dostupna. Svi koji danas počinju mogu daleko dogurati sa postojećim alatima: ručna preusmjeravanja, uvoz rječnika i oznaka ‘zadrži’ pokrivaju najčešće slučajeve upotrebe.
Vjerujemo da mašine trebaju obaviti veći dio posla, a da ljudi trebaju intervenisati samo kada je to zaista neophodno. Dok automatsko prepoznavanje terminologije ne bude dostupno, ručni proces je transparentan - a to je iskrenije od obećanja koje se ne ispuni.
