39 γλώσσες αυτόματα: πώς χειρίζεται η μετάφραση με τεχνητή νοημοσύνη την εξειδικευμένη ορολογία

39 γλώσσες αυτόματα: πώς χειρίζεται η μετάφραση με τεχνητή νοημοσύνη την εξειδικευμένη ορολογία

Μια ματιά στα παρασκήνια της αυτόματης μετάφρασης δεδομένων προϊόντων - και γιατί η εξειδικευμένη ορολογία πρέπει να αντιμετωπίζεται διαφορετικά από το κείμενο ενός μυθιστορήματος.

Η αυτόματη μετάφραση είναι σήμερα τόσο καλή, που σε πολλές περιπτώσεις δεν διακρίνεται πλέον από την ανθρώπινη. Οι μεταφραστικές υπηρεσίες λειτουργούν με ευχέρεια, χρησιμοποιούν ιδιωματισμούς και έχουν αίσθηση του ύφους. Τότε, όμως, μεταφράζεις ένα σύνολο δεδομένων DPP - και ξαφνικά το «rear lock fiber closure» «κλείσιμο ινών πίσω κλειδαριάς».

Το πρόβλημα ονομάζεται τεχνική ορολογία. Εδώ εξηγούμε γιατί τα δεδομένα προϊόντων δεν πρέπει να αντιμετωπίζονται όπως τα μυθιστορήματα και ποια εργαλεία παρέχει η Transpareo, ώστε οι 39 γλωσσικές εκδόσεις σας να παραμένουν κατανοητές.

Το βασικό πρόβλημα: μία λέξη, πολλές έννοιες

«Seal» στο DPP ενός μπουφάν για υπαίθριες δραστηριότητες: στεγανοποίηση. «Seal» σε ένα εργαστήριο: φώκια ή στεγανοποιητικό, ανάλογα με το πλαίσιο. «Seal» σε ένα πρωτόκολλο συντήρησης: ενδεχομένως μια σφραγίδα.

Ένα γενικό μεταφραστικό μοντέλο επιλέγει με βάση το στατιστικό πλαίσιο. Σε ένα συνεχές κείμενο αυτό λειτουργεί - το μυθιστόρημα παρέχει άφθονο πλαίσιο. Σε ένα πεδίο δεδομένων primary_closure: seal δεν υπάρχει σχεδόν καθόλου πλαίσιο. Το μοντέλο κάνει μια υπόθεση.

Το αποτέλεσμα είναι λεπτές ανακρίβειες. Όχι τόσο δραματικές όσο το «Hinterschloss-Faserverschluss», αλλά με σοβαρές συνέπειες: ένα εξάρτημα που στα γερμανικά ονομάζεται «Dichtung», σε ένα ιταλικό DPP ονομάζεται ξαφνικά «sigillo» αντί για «guarnizione». Ένας υπεύθυνος προμηθειών δεν μπορεί πλέον να βρει το ανταλλακτικό.

Τι προσφέρει σήμερα η Transpareo

Το μεταφραστικό μας σύστημα μεταφέρει αυτόματα κάθε νέο περιεχόμενο σε όλες τις ενεργές γλώσσες. Χαρακτηρίζεται από τέσσερα χαρακτηριστικά:

  • Διατήρηση Markdown και μεταβλητών: Οι θέσεις κράτησης όπως <a href="/el/eggraphe">Pro-Mitgliedschaft</a> και οι δομές Markdown εξάγονται πριν από τη μετάφραση, μεταφράζεται το καθαρό κείμενο και, στη συνέχεια, οι δομές επανατοποθετούνται χωρίς αλλαγές. Έτσι, οι σύνδεσμοι, τα έντυπα και η διάταξη παραμένουν συνεπείς σε όλες τις γλώσσες.
  • Κεντρικές εγγραφές μετάφρασης: Οι μεταφράσεις δεν αποθηκεύονται στο ίδιο το σύνολο δεδομένων, αλλά σε ένα κοινόχρηστο επίπεδο. Πολλά σύνολα δεδομένων με το ίδιο πρωτότυπο κείμενο μοιράζονται μια μετάφραση. Αυτό εξοικονομεί κόστος μετάφρασης και ενοποιεί αυτόματα τους όρους σε όλο το μοντέλο δεδομένων.
  • Αυτόματη επαναμετάφραση σε περίπτωση αλλαγής: Εάν το αρχικό κείμενο τροποποιηθεί, οι μεταφράσεις σε όλες τις γλώσσες δημιουργούνται εκ νέου. Μια διόρθωση στα γερμανικά - ακολουθούν αυτόματα 38 άλλες γλωσσικές εκδόσεις.
  • Επισημάνσεις ανά εγγραφή: Τα περιεχόμενα μπορούν να εξαιρούνται από την αυτόματη διαδικασία ή να καθορίζονται οι υπάρχουσες μεταφράσεις - για παράδειγμα, για διεθνείς ονομασίες προϊόντων ή χειροκίνητες διορθώσεις.

Πού συμπληρώνει ο πελάτης την επεξεργασία

Η αυτόματη μετάφραση παρέχει ως επί το πλείστον σωστά αποτελέσματα για περιγραφικά κείμενα, κείμενα μάρκετινγκ και οδηγίες συντήρησης. Όσον αφορά την κρίσιμη ειδική ορολογία - όπως το «seal»/«guarnizione» - παραμένει ένας μικρός αριθμός λαθών, τα οποία πρέπει να διορθώσει ο διαχειριστής του πελάτη.

Εδώ ο διαχειριστής έχει τρεις επιλογές:

  1. Χειροκίνητη αντικατάσταση ανά γλώσσα και κλειδί: Κάθε μεταφραστική καταχώριση μπορεί να ανοιχτεί στον Διαχειριστή Εφαρμογών και να προσαρμοστεί ανά γλώσσα. Με την επισήμανση «Κλείδωμα», αυτή η χειροκίνητη μετάφραση διατηρείται στην επόμενη αυτόματη διαδικασία.
  2. Εισαγωγή γλωσσάριου: Η υπάρχουσα ορολογία από εργαλεία μετάφρασης ή γλωσσάρια σε μορφή PDF μπορεί να εισαχθεί ως αρχείο CSV και να δημιουργήσει άμεσα καταχωρήσεις μετάφρασης.
  3. Διορθώσεις ανά γλώσσα κατά τη διάρκεια της λειτουργίας: Ένα τμήμα πωλήσεων στην Ιταλία εντοπίζει ένα λάθος, το διορθώνει στον Διαχειριστή Εφαρμογών - η διόρθωση εφαρμόζεται αμέσως, ενώ οι υπόλοιπες μεταφράσεις παραμένουν ανέπαφες.

Η πραγματικότητα των γλωσσών της ΕΕ

24 επίσημες γλώσσες της ΕΕ ακούγονται πολλές. Στην πράξη, υπάρχουν τρία επίπεδα:

  • Βασικές αγορές: DE, EN, FR, IT, ES, NL - εδώ κάθε καταναλωτής αναμένει τελειότητα
  • Σημαντικές αγορές: PT, PL, SV, DA, FI - καλό επίπεδο, περιστασιακά γίνεται αντιληπτή η χρήση μηχανικής μετάφρασης
  • Σπάνιες γλώσσες: MT, GA, ET, LV, LT - μερικές φορές υπάρχει ένα DPP στα μαλτέζικα, χωρίς να το διαβάσει ποτέ τελικός καταναλωτής στη Μάλτα. Παρ’ όλα αυτά, είναι υποχρεωτικό.

Η υποχρέωση αυτή δεν είναι προαιρετική. Ο κανονισμός ESPR απαιτεί το περιεχόμενο του DPP στη γλώσσα του κράτους μέλους στο οποίο πωλείται το προϊόν. Όποιος εξυπηρετεί 27 κράτη, λοιπόν, έχει να διαχειριστεί 24 γλώσσες (ορισμένες από τις οποίες μοιράζονται μεταξύ τους).

Γιατί ένα κεντρικό επίπεδο τοπικής προσαρμογής

Οι περισσότερες πλατφόρμες αποθηκεύουν τις μεταφράσεις ως πρόσθετα πεδία στο σύνολο δεδομένων: description_de, description_en, … 39 πεδία ανά μεταφράσιμο χαρακτηριστικό. Ακούγεται απλό, αλλά έχει τρία μειονεκτήματα:

  • Διπλό κείμενο. Δύο προϊόντα με την ίδια περιγραφή υλικού δημιουργούν 39 + 39 μεταφράσεις αντί για μία φορά 39
  • Δύσκολη κλιμάκωση. Η προσθήκη μιας 40ής γλώσσας σημαίνει: μετεγκατάσταση του σχήματος σε όλα τα μεταφράσιμα μοντέλα
  • Δύσκολη εφαρμογή διορθώσεων σε παγκόσμιο επίπεδο. Αν διορθωθεί η λέξη «guarnizione» παντού, θα πρέπει να επεξεργαστούν όλες οι εγγραφές ξεχωριστά

Το διαχωρισμένο επίπεδο μετάφρασης λύνει αυτό το πρόβλημα: μία καταχώριση, πολλές αναφορές. Μία διόρθωση, όλες οι εγγραφές επωφελούνται.

Τι δεν έχουμε ακόμα

Μια βάση δεδομένων ορολογίας προσαρμοσμένη στον πελάτη με αυτόματη αναγνώριση προτάσεων βρίσκεται στο στάδιο του σχεδιασμού ανάπτυξης, αλλά δεν έχει ακόμη παραδοθεί. Όποιος ξεκινά σήμερα, μπορεί να προχωρήσει αρκετά με τα υπάρχοντα εργαλεία: οι χειροκίνητες αντικαταστάσεις, οι εισαγωγές γλωσσαρίων και η επισήμανση «διατήρησης» καλύπτουν τις πιο συχνές περιπτώσεις χρήσης.

Πιστεύουμε ότι οι μηχανές πρέπει να αναλαμβάνουν το μεγαλύτερο μέρος της εργασίας και οι άνθρωποι να παρεμβαίνουν μόνο όπου είναι πραγματικά απαραίτητο. Μέχρι να είναι διαθέσιμη η αυτόματη αναγνώριση ορολογίας, η χειροκίνητη παρέμβαση είναι διαφανής - και αυτό είναι πιο ειλικρινές από μια υπόσχεση που δεν τηρείται.

Ενημερώσεις σχετικά με την πολυγλωσσία και την εφαρμογή του DPP

Νέες γλώσσες, ποιότητα δεδομένων και λειτουργίες προϊόντων - μια φορά το μήνα, επιλεγμένες και αποσταλμένες στο ηλεκτρονικό σας ταχυδρομείο.