মেশিন অনুবাদ এখন এতটাই উন্নত যে অনেক ক্ষেত্রেই এটি মানব অনুবাদের থেকে পৃথক করা যায় না। অনুবাদ সেবাগুলো সাবলীল, প্রবাদপ্রতিম অনুবাদ তৈরি করে, যা নিবন্ধনের অনুভূতি ধরে রাখে। তারপর আপনি একটি DPP ডেটা সেট অনুবাদ করেন - এবং হঠাৎ ‘rear lock fibre closure’ হয়ে যায় ‘Hinterschloss-Faserverschluss’।
সমস্যাটি হলো প্রযুক্তি গত পরিভাষা। এখানে আমরা ব্যাখ্যা করছি কেন পণ্য ডেটা উপন্যাসের মতো বিবেচনা করা উচিত নয়, এবং Transpareo কোন সরঞ্জামগুলি প্রদান করে যাতে আপনার ৩৯টি ভাষা সংস্করণ বোধগম্য থাকে।
মৌলিক সমস্যা: একটি শব্দ, একাধিক অর্থ
আউটডোর জ্যাকেটের DPP-তে ‘Seal’: জলরোধী করা। ল্যাবরেটরিতে ‘Seal’: প্রেক্ষাপটের ওপর নির্ভর করে সীল (প্রাণী) বা একটি গ্যাসকেট। রক্ষণাবেক্ষণ লগে ‘Seal’: সম্ভবত একটি স্ট্যাম্প।
একটি সাধারণ অনুবাদ মডেল পরিসংখ্যানগত প্রেক্ষাপটের ভিত্তিতে তার পছন্দ নির্ধারণ করে। ধারাবাহিক লেখার ক্ষেত্রে এটি কাজ করে - একটি উপন্যাস প্রচুর প্রেক্ষাপট প্রদান করে। কিন্তু primary_closure: seal-এর মতো একটি ডেটা ক্ষেত্রের জন্য, প্রায় কোনো প্রেক্ষাপটই থাকে না। মডেলটি একটি শিক্ষিত অনুমান করে।
ফলাফল সূক্ষ্ম ত্রুটি। ‘Hinterschloss-Faserverschluss’ এর মতো নাটকীয় নয়, তবে তাৎপর্যপূর্ণ: জার্মান ভাষায় ‘Dichtung’ নামে পরিচিত একটি উপাদান হঠাৎ করেই ইতালীয় DPP-তে ‘guarnizione’ এর পরিবর্তে ‘sigillo’ হিসেবে উল্লেখ করা হয়েছে। একজন ক্রেতা আর স্পেয়ার পার্টটি খুঁজে পাচ্ছে না।
Transpareo আজ যা অর্জন করেছে
আমাদের অনুবাদ সিস্টেম স্বয়ংক্রিয়ভাবে প্রতিটি নতুন বিষয়বস্তুকে সমস্ত সক্রিয় ভাষায় অনুবাদ করে। এটি চারটি মূল বৈশিষ্ট্যে চিহ্নিত:
-
মার্কডাউন এবং ভেরিয়েবল সংরক্ষণ:
<a href="/bn/নিবন্ধন করুন">Pro-Membership</a>-এর মতো প্লেসহোল্ডার এবং মার্কডাউন কাঠামো অনুবাদের আগে বের করে নেওয়া হয়; সাধারণ টেক্সট অনুবাদ করা হয়, এবং কাঠামোগুলো অপরিবর্তিত অবস্থায় পুনরায় সন্নিবেশিত করা হয়। এটি নিশ্চিত করে যে লিঙ্ক, ফর্ম এবং লেআউট সব ভাষায়ই সামঞ্জস্যপূর্ণ থাকে। - কেন্দ্রীভূত অনুবাদ এন্ট্রি: অনুবাদগুলি ডেটা রেকর্ডের মধ্যে সংরক্ষণ করা হয় না, বরং একটি ভাগ করা স্তরে সংরক্ষণ করা হয়। একই উৎস পাঠ্যের একাধিক ডেটা রেকর্ড একটি একক অনুবাদ শেয়ার করে। এতে অনুবাদের খরচ বাঁচে এবং ডেটা মডেলের জুড়ে পরিভাষা স্বয়ংক্রিয়ভাবে মানসম্মত হয়।
- পরিবর্তন হলে স্বয়ংক্রিয় পুনরায় অনুবাদ: যদি মূল পাঠ্য পরিবর্তন করা হয়, তাহলে সমস্ত ভাষার অনুবাদ পুনরায় তৈরি করা হয়। জার্মান ভাষায় একটি সংশোধন স্বয়ংক্রিয়ভাবে অন্যান্য ৩৮টি ভাষার সংস্করণ আপডেট করে।
- প্রতি ডেটা রেকর্ডে মার্কিং: বিষয়বস্তুকে স্বয়ংক্রিয় প্রক্রিয়া থেকে বাদ দেওয়া যেতে পারে, অথবা বিদ্যমান অনুবাদগুলিকে লক করা যেতে পারে - উদাহরণস্বরূপ, আন্তর্জাতিক পণ্যের নাম বা ম্যানুয়াল সংশোধনের জন্য।
যেখানে গ্রাহক প্রক্রিয়াকরণে সংযোজন করে
স্বয়ংক্রিয় অনুবাদ বর্ণনামূলক টেক্সট, মার্কেটিং কপি এবং যত্নের নির্দেশনার জন্য সাধারণত সঠিক ফলাফল প্রদান করে। তবে, ‘seal’/’guarnizione’ এর মতো গুরুত্বপূর্ণ প্রযুক্তিগত পরিভাষায় কিছু ত্রুটি থেকে যায়, যা গ্রাহকের প্রশাসককে সংশোধন করতে হবে।
এখানে, অ্যাডমিনের তিনটি বিকল্প রয়েছে:
১. ভাষা এবং কী অনুযায়ী ম্যানুয়াল ওভাররাইড: প্রতিটি অনুবাদ এন্ট্রি অ্যাপ্লিকেশন ম্যানেজারে খুলে প্রতিটি ভাষার জন্য সামঞ্জস্য করা যেতে পারে। ‘লক’ অপশন নির্বাচন করলে, পরবর্তী স্বয়ংক্রিয় রানে এই ম্যানুয়াল অনুবাদটি সংরক্ষিত থাকবে। ২. গ্লossary আমদানি: অনুবাদ টুল বা PDF গ্লossary থেকে বিদ্যমান পরিভাষা CSV ফাইল হিসেবে আমদানি করে সরাসরি অনুবাদ এন্ট্রি তৈরি করতে ব্যবহার করা যেতে পারে। ৩. সিস্টেম চলমান অবস্থায় প্রতি-ভাষা সংশোধন: একটি ইতালীয় বিক্রয় দল একটি ত্রুটি খুঁজে পেলে, অ্যাপ্লিকেশন ম্যানেজারে তা সংশোধন করে - সংশোধনটি তৎক্ষণাৎ কার্যকর হয়, অন্য অনুবাদগুলো অপরিবর্তিত থাকে।
ইইউ ভাষাগুলির বাস্তবতা
২৪টি সরকারি ইইউ ভাষা অনেক মনে হতে পারে। বাস্তবে, এগুলো তিনটি বিভাগে পড়ে:
- মূল বাজার: DE, EN, FR, IT, ES, NL - এখানে, প্রতিটি ভোক্তা নিখুঁততা আশা করে
- গুরুত্বপূর্ণ বাজার: PT, PL, SV, DA, FI - একটি ভালো মান, যদিও মেশিন অনুবাদ মাঝে মাঝে লক্ষণীয় হয়
- বিরল ভাষা: MT, GA, ET, LV, LT - কখনও কখনও মাল্টায় কোনো শেষ ভোক্তা এটি স্ক্যান না করলেও আপনার কাছে মাল্টিজ ভাষায় একটি DPP থাকে। তবুও, এটি বাধ্যতামূলক।
এই শর্তটি ঐচ্ছিক নয়। ESPR নির্দেশ করে যে DPP বিষয়বস্তু সেই সদস্য রাষ্ট্রের ভাষায় প্রদান করতে হবে যেখানে পণ্যটি বিক্রি হয়। তাই, ২৭টি দেশে সেবা প্রদানকারী যে কেউ ২৪টি ভাষার মোকাবিলা করতে হয় (কিছু দেশ ভাষা ভাগাভাগি করে)।
কেন একটি কেন্দ্রীভূত স্থানীয়করণ স্তর?
অধিকাংশ প্ল্যাটফর্ম অনুবাদগুলিকে ডেটা রেকর্ডে অতিরিক্ত ফিল্ড হিসেবে সংরক্ষণ করে: description_de, description_en, … প্রতিটি অনুবাদযোগ্য অ্যাট্রিবিউটের জন্য ৩৯টি ফিল্ড। এটি শুনতে সহজ মনে হলেও এর তিনটি অসুবিধা রয়েছে:
- ডুপ্লিকেট টেক্সট। একই উপাদানের নোট সহ দুটি পণ্য মাত্র 39টির পরিবর্তে 39 + 39টি অনুবাদ তৈরি করে
- স্কেল করা কঠিন। ৪০তম ভাষা যোগ করার অর্থ হল সমস্ত অনুবাদযোগ্য মডেলের জন্য একটি স্কিমা মাইগ্রেশন
- সংশোধনগুলি বিশ্বব্যাপী প্রয়োগ করা কঠিন। যদি ‘guarnizione’ সর্বত্র সংশোধন করা হয়, তাহলে সমস্ত ডেটা রেকর্ড আলাদাভাবে সম্পাদনা করতে হবে
বিভক্ত অনুবাদ স্তর এটি সমাধান করে: একটি এন্ট্রি, অনেক রেফারেন্স। একটি সংশোধন, সমস্ত ডেটা রেকর্ড উপকৃত হয়।
যা আমাদের এখনও নেই
স্বয়ংক্রিয় প্রস্তাবনা স্বীকৃতি সহ একটি কাস্টম পরিভাষা ডাটাবেস উন্নয়নাধীন রয়েছে, তবে বর্তমানে এটি উপলব্ধ নয়। আজ যারা শুরু করছেন তারা বিদ্যমান টুলস দিয়ে অনেকদূর এগিয়ে যেতে পারবেন: ম্যানুয়াল ওভাররাইড, গ্লসারি ইমপোর্ট এবং ‘keep’ ফ্ল্যাগ সবচেয়ে সাধারণ ব্যবহারের ক্ষেত্রে কাজ করে।
আমরা বিশ্বাস করি যে মেশিনগুলোই মূল কাজটি করবে এবং মানুষ শুধুমাত্র তখনই হস্তক্ষেপ করবে যখন তা সত্যিই প্রয়োজন। স্বয়ংক্রিয় পরিভাষা স্বীকৃতি উপলব্ধ না হওয়া পর্যন্ত, ম্যানুয়াল প্রক্রিয়াটি স্বচ্ছ - এবং তা পূরণ না হওয়া প্রতিশ্রুতির চেয়ে বেশি সৎ।
