medias

Traduction de contenus complexes : l'aide des réseaux neuronaux

Clément Solym - 13.04.2017

Lecture numérique - Acteurs numériques - traduction de contenus complexes - aide réseaux neuronaux


Le développement de l’intelligence artificielle pour faire évoluer la traduction automatique progresse sans cesse. Plusieurs tendances existent, qui fournissent un service encore loin de ce qu’un être humain peut réaliser. Pour autant, les modèles automatisés explorent des pistes, pour fournir des outils plus efficients.

 

IMAGINE • NO WAR
frank carman, CC BY 2.0
 

 

La société Lingua et Machina travaille depuis une dizaine d’années aux outils de traduction. Son fonctionnement repose avant tout sur la traduction de contenus complexes, dans le cadre de corpus terminologiques – principalement tournés vers la recherche.

 

On peut classifier en trois approches les modèles de traduction automatique.

 

Traduction à base de règles


Il s’agit d’un système basé sur l’application de règles à divers niveaux d’échelles d’analyse linguistique (lexicale, syntaxique, et grammaticale). Il intègre la gestion d’un très grand nombre de cas particuliers et d’exceptions. Elle produit des textes cohérents, mais finalement peu adaptés à des éléments trop spécialisés.

 

Traduction statistique


Ce modèle repose sur une analyse statistique d’un grand volume d’exemples déjà traduits. Il identifie les transformations de groupes de mots, d’une langue vers une autre, pour reproduire celles estimées les plus probables sur tes nouvelles phrases à traduire. Il s’avère finalement adapté à des contenus de spécifiques, mais peut manquer de fluidité.

 

Traduction neuronale


Système basé sur des algorithmes neuronaux Le moteur utilise l’intelligence artificielle et apprend, toujours à partir d’un grand volume d’exemples déjà traduits, à traduire par le biais d’un réseau neuronal. C’est ce dernier que prône la société Lingua Machina.

 

Étienne Monneret, Chef de Projets et Développements Informatiques, en précise les grands axes.

 

Comment travaille votre entreprise ?


L’innovation fait partie des gènes de notre entreprise. Le fondateur, Emmanuel Planas, a créé Lingua et Machina suite à sa thèse sur l’analyse sous-phrastique. Cette technologie était novatrice à l’époque. Ensuite, la traduction statistique s’est développée et, aujourd’hui, la traduction neuronale fait un immense bond en avant. Chez Lingua et Machina, nous mettons donc tout en œuvre pour conserver cet ADN empreint de travaux de recherche appliqués aux problématiques industrielles.

 

Pourquoi vous êtes-vous intéressé à la traduction neuronale ?


Les réseaux neuronaux ont été une des grandes tendances de la recherche il y a une trentaine d’années. Longtemps passés de mode, ils reviennent aujourd’hui sur le devant de la scène grâce à l’augmentation impressionnante des puissances de calcul, et à des masses de données devenues facilement accessibles, sous l’appellation de Deep Learning (apprentissage par utilisation de réseaux de neurones avec un très grand nombre d’éléments).

 

Quel est l’intérêt de cette technologie pour un projet de traduction ?


Nous avons perçu très tôt l’intérêt de cette approche. Grâce à la complémentarité de nos technologies, les performances de la TA (ndlr : Traduction Automatique) s’améliorent à mesure qu’elle est alimentée avec de nouveaux contenus et que le fond terminologique associé s’étoffe. Plus le nombre de traductions réalisées augmente, plus la qualité et la fluidité des livrables se rapprochent de la qualité d’une traduction humaine.
 

 

Google limite son outil de traduction gratuit au profit de Cloud Translation, payant


La traduction neuronale, ajoutée à nos autres outils, permet donc à nos clients de comprendre des textes techniques, dans un métier donné, tout en restant au sein du pare-feu de l’entreprise. Ce sont des économies substantielles de coût et de temps : un traducteur professionnel peut travailler jusqu’à deux à trois fois plus vite en maintenant une haute qualité de traduction.