Comment un ordinateur peut-il aider à traduire ?

De quand date la traduction automatique ?

Les pre­mières solu­tions de tra­duc­tion auto­ma­tique et de tra­duc­tion assis­tée par ordi­na­teur sont appa­rues dès le milieu du XXème siècle. Les cher­cheurs ont en effet per­çu très tôt que la puis­sance de cal­cul offerte par les ordi­na­teurs pou­vait gran­de­ment faci­li­ter le pro­ces­sus de tra­duc­tion. Les pre­mières démons­tra­tions de tra­duc­tion auto­ma­tique datent de 1954, lors de l’ex­pé­rience Geor­ge­town (Geor­ge­town expe­riment). On pen­sait alors que la ques­tion de la tra­duc­tion auto­ma­tique serait réglée dans les cinq ans.

Quels outils pour la traduction ?

Trois grandes familles d’ou­tils peuvent assis­ter le tra­duc­teur dans son acti­vi­té de traduction : 

Quels outils d’aide au traducteur ?

Il existe une large palettes de logi­ciels qui aident le tra­duc­teur dans son acti­vi­té quo­ti­dienne, par exemple :

  • les logi­ciels de Recon­nais­sance Optique de Carac­tères (OCR) qui trans­forment une image en texte jus­qu’au solu­tions de ges­tion de terminologie. 
  • les logi­ciels de ges­tion de terminologie
  • les logi­ciels de véri­fi­ca­tion orthographique.

Qu’est-ce qu’un logiciel à mémoire de traduction ?

Les logi­ciels à mémoire de tra­duc­tion sont bien adap­tés aux entre­prise ame­nées à tra­duire des docu­ments fré­quem­ment, par exemple dans le cas de tra­duc­tion de docu­ments tech­niques ou de tra­duc­tions de rap­ports finan­ciers. Le prin­cipe des logi­ciels à mémoire de tra­duc­tion est de consti­tuer une mémoire des seg­ments déjà tra­duits afin de les com­pa­rer aux textes à tra­duire. Ces logi­ciels à mémoire de tra­duc­tion sont désor­mais sophis­ti­qués et, grâce à une ana­lyse lin­guis­tique, peuvent recon­naître des seg­ments ayant peu de pro­prié­tés en commun.

Ces types de solu­tions apportent au tra­duc­teur un gain de temps consi­dé­rable et assurent une grande cohé­rence entre les tra­duc­tions d’une même entreprise.

Quelles sont les différentes familles de solutions de traduction automatique ?

Les solu­tions de tra­duc­tion auto­ma­tique, si elles sont mieux adap­tées aux docu­ments d’en­tre­prise qu’à la tra­duc­tion lit­té­raire, ont fait de grands pro­grès en quelques décen­nies. Alors que les pre­mières solu­tions repo­saient sur des approches par règles, les pro­grès dans les tech­niques d’ap­pren­tis­sage et les réseaux neu­ro­naux pour la tra­duc­tion auto­ma­tique ont per­mis de nou­velles approches. Les solu­tions de tra­duc­tions auto­ma­tiques hybrides allient les deux approches.

Qu’est-ce que la traduction automatique à base de règles ?

De nom­breuses tech­niques dif­fé­rentes sont uti­li­sées pour la tra­duc­tion auto­ma­tique à base de règles. Elles reposent géné­ra­le­ment sur une repré­sen­ta­tion indé­pen­dante de la langue qui est uti­li­sée comme pivot entre les dif­fé­rentes langues. La tra­duc­tion auto­ma­tique à base de règles consiste alors à éla­bo­rer les règles d’a­na­lyse du texte source vers cette repré­sen­ta­tion pivot, et, par ailleurs, les règles de géné­ra­tion du texte cible depuis la repré­sen­ta­tion pivot. D’autres familles de tech­niques consistent à éla­bo­rer des règles de trans­for­ma­tion d’une langue à l’autre sans pas­ser par une repré­sen­ta­tion pivot.

Apprentissage, réseaux de neurones, intelligence artificielle et traduction automatique, de quoi parle-t-on ?

Les pro­grès et la dis­po­ni­bi­li­té de tech­niques par appren­tis­sage ont vu l’es­sor de solu­tions d’ap­pren­tis­sage pour la tra­duc­tion auto­ma­tique. Ces tech­niques reposent sur l’u­ti­li­sa­tion de grands cor­pus de textes bilingues ali­gnés, c’est à dire que l’on connaît la cor­res­pon­dance entre les seg­ments plus ou moins longs des textes (para­graphes, phrases). Les tech­niques d’ap­pren­tis­sage auto­ma­tique sophis­ti­quées sont uti­li­sées pour entraî­ner un logi­ciel à la traduction.

Qu’est-ce que la traduction automatique hybride ?

Les solu­tions de tra­duc­tion auto­ma­tique hybride com­binent les approches de tra­duc­tion auto­ma­tique par appren­tis­sage et de tra­duc­tion auto­ma­tique à base de règles de dif­fé­rentes façons. Des règles d’a­na­lyse lin­guis­tique, comme par exemple de l’a­na­lyse mor­pho-syn­taxique, peuvent être appli­quées sur le texte source avant la phase d’ap­pren­tis­sage. A contra­rio, des règles syn­taxiques peuvent être appli­quées pour redres­ser le texte géné­ré par un module repo­sant sur des tech­niques de tra­duc­tion auto­ma­tique par apprentissage.

Par Alain Couillault
PhD Chargé de Mission Innovation APIL

Études de cas associés

Comprendre le fonctionnement et les limites des correcteurs orthographique et grammatical

Dans ma pratique professionnelle, je dois rédiger de nombreux rapports. La correction orthographique et grammaticale amène un gain de temps considérable. Souvent surpris par l'efficacité de ce type d'outils, j'aimerais comprendre comment ils fonctionnent afin de mieux jauger les corrections proposées.

La relation client multicanale : comment équilibrer le service entre coût et opportunités ?

Je suis responsable du service client de mon entreprise. Mon équipe et moi devons traiter quotidiennement un volume important de demandes clients dans un environnement multicanal, avec une réactivité optimale.

Repérer et quantifier les effets des traitements ainsi que leur contexte d'apparition

Je suis responsable de la pharmacovigilance au sein d'une structure publique de veille sanitaire. Je souhaite pouvoir exploiter plus largement les sources d'information sur les effets des traitements et garantir une certaine objectivité des analyses à partir des textes libres : l'analyse linguistique automatisée répond-elle à ces objectifs et comment ?

Comment identifier la plagiat dans les copies des étudiants de manière simple, rapide et la plus exhaustive possible ?

Enseignant dans l'enseignement supérieur, je dois vérifier que les copies de mes étudiants ne contiennent pas d'extraits traduits d'articles scientifiques disponibles en ligne.

Pousser au client l'information qu'il ne cherche pas encore

Responsable de la commercialisation de plusieurs titres de presse, je dois acquérir ou fidéliser mes abonnés en ligne en leur proposant l’actualité cruciale, voire critique dans leur activité, parmi des masses d’informations quotidiennes. Les mêmes outils de veille constituent un support précieux pour les journalistes de mes publications, à partir de sources externes.

La chasse aux infox, aussi impérieuse que complexe

Je suis directeur de la publication d'un journal d'information généraliste. A l'heure des médias sociaux, tout le monde ou presque peut publier de l'information visible de toute la planète. Cette formidable opportunité est hélas une aubaine pour les rumeurs voire la désinformation délibérée. Ne pas se faire le relais des infox est un devoir des médias désormais inscrit dans la loi. Débusquer et dénoncer la désinformation n'est pas une obligation légale mais un objectif éthique pour les médias.

Mettre à disposition immédiatement les réponses adéquates dans une documentation technique multilingue

Je suis chef de produit dans une entreprise industrielle multinationale et dans un domaine de haute technicité, où l'accès aux notices de maintenance est critique par ses enjeux financiers, environnementaux, ses risques associés en termes de sécurité ou d'image. Comment s'assurer que les équipes de production ou de maintenance trouvent immédiatement la réponse adéquate dans leur langue au sein de la documentation technique des installations et des outils ?

Comment gérer de l'information promotionnelle touristique multilingue

Je suis responsable d'un office de tourisme, CDT ou CRT, et je souhaite promouvoir mon territoire auprès des touristes internationaux via des plaquettes et un ou plusieurs sites Internet. Quelles solutions sont disponibles pour gérer ces différents contenus.

Quelle solution de fact checking pour mon ONG ?

Je suis responsable de la communication pour une ONG dans un domaine où l'information au public est essentielle et controversée et où le lobbying est très actif. Je dois repérer quotidiennement les informations diffusées et relayées sur les réseaux sociaux et dans la presse afin d'ajuster ma stratégie de communication. Existe-t-il des solutions de fact checking pour lutter contre la diffusion des infox (fake news) ?

Produire et publier des centaines de commentaires d'actualité en quelques minutes

Responsable d'un domaine de publication, je dois assurer la mise en ligne en temps quasiment réel de bulletins d’analyse et de synthèse de données chiffrées massives telles que des résultats de rencontres sportives locales ou d'élections, les derniers chiffres de la pandémie COVID ou les prévisions météorologiques régionales et nationales.