মেশিন অনুবাদ এখন এতটাই উন্নত হয়েছে যে, অনেক ক্ষেত্রেই এটিকে মানব অনুবাদের থেকে পৃথক করা অসম্ভব। অনুবাদ সেবাগুলো সাবলীল, প্রবাদপ্রতিম অনুবাদ তৈরি করে, যার মধ্যে নিখুঁত রেজিস্টারের অনুভূতি থাকে। তারপর আপনি একটি DPP ডেটা সেট অনুবাদ করেন - এবং হঠাৎ ‘rear lock fibre closure’ হয়ে যায় ‘Hinterschloss-Faserverschluss’।
সমস্যাটি হলো প্রযুক্তি গত পরিভাষা। এখানে আমরা ব্যাখ্যা করছি কেন পণ্য ডেটা উপন্যাসের মতো বিবেচনা করা উচিত নয়, এবং Transpareo কোন সরঞ্জামগুলি প্রদান করে যাতে আপনার ৪০টি ভাষার সংস্করণ বোঝারযোগ্য থাকে।
মৌলিক সমস্যা: একটি শব্দ, একাধিক অর্থ
আউটডোর জ্যাকেটের DPP-তে ‘Seal’: জলরোধী করা। ল্যাবরেটরিতে ‘Seal’: প্রসঙ্গ অনুযায়ী একটি সীল (প্রাণী) বা একটি গ্যাসকেট। রক্ষণাবেক্ষণ লগে ‘Seal’: সম্ভবত একটি সীল (যেমন স্ট্যাম্পের সীল)।
একটি সাধারণ অনুবাদ মডেল পরিসংখ্যানগত প্রেক্ষাপটের ভিত্তিতে তার পছন্দ নির্ধারণ করে। ধারাবাহিক লেখার ক্ষেত্রে এটি কাজ করে - একটি উপন্যাস প্রচুর প্রেক্ষাপট প্রদান করে। কিন্তু primary_closure: seal-এর মতো একটি ডেটা ক্ষেত্রের জন্য, প্রায় কোনো প্রেক্ষাপটই থাকে না। মডেলটি একটি শিক্ষিত অনুমান করে।
ফলাফল সূক্ষ্ম ত্রুটি। ‘Hinterschloss-Faserverschluss’ এর মতো নাটকীয় নয়, তবে তাৎপর্যপূর্ণ: জার্মান ভাষায় ‘Dichtung’ নামে পরিচিত একটি উপাদান হঠাৎ করেই ইতালীয় DPP-তে ‘guarnizione’ এর পরিবর্তে ‘sigillo’ হিসেবে উল্লেখ করা হয়েছে। একজন ক্রেতা আর স্পেয়ার পার্টটি খুঁজে পাচ্ছে না।
Transpareo আজ যা অর্জন করেছে
আমাদের অনুবাদ সিস্টেম স্বয়ংক্রিয়ভাবে প্রতিটি নতুন বিষয়বস্তুকে সমস্ত সক্রিয় ভাষায় অনুবাদ করে। এটি চারটি মূল বৈশিষ্ট্যে চিহ্নিত:
-
মার্কডাউন এবং ভেরিয়েবল সংরক্ষণ:
<a href="/bn/nibndhn-krun">Pro-Membership</a>-এর মতো প্লেসহোল্ডার এবং মার্কডাউন কাঠামো অনুবাদের আগে বের করে নেওয়া হয়; সাধারণ টেক্সট অনুবাদ করা হয়, এবং কাঠামোগুলো অপরিবর্তিত অবস্থায় পুনরায় সন্নিবেশিত করা হয়। এটি নিশ্চিত করে যে লিঙ্ক, ফর্ম এবং বিন্যাস সব ভাষায়ই সামঞ্জস্যপূর্ণ থাকে। - কেন্দ্রীভূত অনুবাদ এন্ট্রি: অনুবাদগুলো ডেটা রেকর্ডের মধ্যে সংরক্ষণ করা হয় না, বরং একটি শেয়ার্ড লেয়ারে সংরক্ষণ করা হয়। একই উৎস পাঠ্যের একাধিক ডেটা রেকর্ড একটি একক অনুবাদ শেয়ার করে। এতে অনুবাদ খরচ বাঁচে এবং ডেটা মডেলের শব্দভাণ্ডার স্বয়ংক্রিয়ভাবে মানসম্মত হয়।
- পরিবর্তন হলে স্বয়ংক্রিয় পুনরায় অনুবাদ: যদি মূল পাঠ্য পরিবর্তন করা হয়, তাহলে সমস্ত ভাষার অনুবাদ পুনরায় তৈরি করা হয়। জার্মান ভাষায় একটি সংশোধন স্বয়ংক্রিয়ভাবে অন্যান্য ৩৮টি ভাষার সংস্করণ আপডেট করে।
- প্রতি ডেটা রেকর্ডে মার্কিং: স্বয়ংক্রিয় প্রক্রিয়া থেকে বিষয়বস্তু বাদ দেওয়া যেতে পারে, অথবা বিদ্যমান অনুবাদ লক করা যেতে পারে - উদাহরণস্বরূপ, আন্তর্জাতিক পণ্যের নাম বা ম্যানুয়াল সংশোধনের জন্য।
যেখানে গ্রাহক প্রক্রিয়াকরণ সম্পূরক করে
স্বয়ংক্রিয় অনুবাদ বর্ণনামূলক টেক্সট, মার্কেটিং কপি এবং যত্নের নির্দেশনার জন্য সাধারণত সঠিক ফলাফল প্রদান করে। তবে, ‘seal’/’guarnizione’ এর মতো গুরুত্বপূর্ণ প্রযুক্তিগত পরিভাষায় কিছু ত্রুটি থেকে যায়, যা গ্রাহকের প্রশাসককে সংশোধন করতে হবে।
এখানে, অ্যাডমিনের তিনটি বিকল্প রয়েছে:
১. ভাষা এবং কী অনুযায়ী ম্যানুয়াল ওভাররাইড: প্রতিটি অনুবাদ এন্ট্রি অ্যাপ্লিকেশন ম্যানেজারে খুলে প্রতিটি ভাষার জন্য সামঞ্জস্য করা যেতে পারে। ‘লক’ অপশন নির্বাচন করলে, এই ম্যানুয়াল অনুবাদটি পরবর্তী স্বয়ংক্রিয় রানে সংরক্ষিত থাকবে। ২. গ্লossary আমদানি: অনুবাদ টুল বা PDF গ্লossary থেকে বিদ্যমান পরিভাষা CSV ফাইল হিসেবে আমদানি করে সরাসরি অনুবাদ এন্ট্রি তৈরি করতে ব্যবহার করা যেতে পারে। ৩. সিস্টেম চলমান অবস্থায় প্রতি-ভাষা সংশোধন: একটি ইতালীয় বিক্রয় দল একটি ত্রুটি খুঁজে পেলে, এটি অ্যাপ্লিকেশন ম্যানেজারে সংশোধন করে - সংশোধনটি তৎক্ষণাৎ কার্যকর হয়, অন্য অনুবাদগুলো অপরিবর্তিত থাকে।
ইইউ ভাষার বাস্তবতা
২৪টি সরকারি ইইউ ভাষা শুনতে অনেক মনে হতে পারে। বাস্তবে, এগুলো তিনটি বিভাগে পড়ে:
- মূল বাজার: DE, EN, FR, IT, ES, NL - এখানে, প্রতিটি ভোক্তা নিখুঁততা আশা করে
- গুরুত্বপূর্ণ বাজার: PT, PL, SV, DA, FI - একটি ভালো মান, যদিও মেশিন অনুবাদ মাঝে মাঝে লক্ষণীয় হয়
- বিরল ভাষা: MT, GA, ET, LV, LT - কখনও কখনও মাল্টায় কোনো শেষ ভোক্তা এটি স্ক্যান না করলেও আপনার কাছে মাল্টিজ ভাষায় একটি DPP থাকে। তবুও, এটি বাধ্যতামূলক।
এই শর্তটি ঐচ্ছিক নয়। ESPR নির্দেশ করে যে DPP বিষয়বস্তু সেই সদস্য রাষ্ট্রের ভাষায় প্রদান করতে হবে যেখানে পণ্যটি বিক্রি হয়। অতএব, 27টি দেশে সেবা প্রদানকারী যে কেউ 24টি ভাষার মোকাবিলা করতে হয় (কিছু দেশ ভাষা ভাগাভাগি করে)।
কেন একটি কেন্দ্রীভূত স্থানীয়করণ স্তর?
অধিকাংশ প্ল্যাটফর্ম অনুবাদগুলিকে ডেটা রেকর্ডে অতিরিক্ত ফিল্ড হিসেবে সংরক্ষণ করে: description_de, description_en, … প্রতিটি অনুবাদযোগ্য অ্যাট্রিবিউটের জন্য ৪০টি ফিল্ড। এটি শুনতে সহজ মনে হলেও, এর তিনটি অসুবিধা রয়েছে:
- ডুপ্লিকেট টেক্সট। একই উপাদানের নোট সহ দুটি পণ্য মাত্র ৪০টির পরিবর্তে ৪০+৪০টি অনুবাদ তৈরি করে
- স্কেল করা কঠিন। ৪১তম ভাষা যোগ করার অর্থ হল সমস্ত অনুবাদযোগ্য মডেলের জন্য একটি স্কিমা মাইগ্রেশন
- সংশোধনগুলি বিশ্বব্যাপী প্রয়োগ করা কঠিন। যদি ‘guarnizione’ সর্বত্র সংশোধন করা হয়, তাহলে সমস্ত ডেটা রেকর্ড আলাদাভাবে সম্পাদনা করতে হবে
বিভক্ত অনুবাদ স্তর এটি সমাধান করে: একটি এন্ট্রি, অনেক রেফারেন্স। একটি সংশোধন, সমস্ত ডেটা রেকর্ড উপকৃত হয়।
যা আমাদের এখনও নেই
স্বয়ংক্রিয় প্রস্তাবনা স্বীকৃতি সহ একটি কাস্টম পরিভাষা ডাটাবেস উন্নয়নাধীন রয়েছে, তবে বর্তমানে এটি উপলব্ধ নয়। আজ যারা শুরু করছেন তারা বিদ্যমান টুলস দিয়ে অনেকদূর এগিয়ে যেতে পারবেন: ম্যানুয়াল ওভাররাইড, গ্লossary আমদানি এবং ‘keep’ ফ্ল্যাগ সবচেয়ে সাধারণ ব্যবহারের ক্ষেত্রে সমাধান দেয়।
আমরা বিশ্বাস করি যে মেশিনগুলোই মূল কাজটি করা উচিত এবং মানুষ শুধুমাত্র তখনই হস্তক্ষেপ করা উচিত যখন তা সত্যিই প্রয়োজন। স্বয়ংক্রিয় পরিভাষা স্বীকৃতি উপলব্ধ না হওয়া পর্যন্ত, ম্যানুয়াল প্রক্রিয়াটি স্বচ্ছ - এবং তা পূরণ না হওয়া প্রতিশ্রুতির তুলনায় বেশি সৎ।
