Vasco Pedro était convaincu que, malgré l’essor de l’intelligence artificielle (IA), pour que les machines parviennent à traduire aussi bien que les traducteurs professionnels, il faudrait toujours qu’un humain intervienne. C’est alors qu’il a vu les résultats d’un concours organisé par Unbabel, sa jeune entreprise basée à Lisbonne, opposant son dernier modèle d’IA aux traducteurs humains de l’entreprise. « Je me suis dit… ça y est, on est fichu », raconte-t-il. « Les humains en ont terminé avec la traduction ». M. Pedro estime que la traduction humaine représente actuellement environ 95 % de l’industrie mondiale de la traduction. Il estime que dans les trois prochaines années, la participation humaine tombera à un niveau proche de zéro.
Il n’est guère surprenant que les concepteurs de modèles d’IA soient optimistes, mais leur optimisme est de mise. La traduction automatique est devenue si fiable et si omniprésente que de nombreux utilisateurs ne la voient plus. Les premiers essais de traduction informatisée ont eu lieu il y a plus de 70 ans, lorsqu’un ordinateur IBM a été programmé avec un lexique de 250 mots d’anglais et de russe et six règles grammaticales. Cette approche « basée sur des règles “a été remplacée dans les années 1990 par une approche” statistique », fondée sur l’analyse de vastes ensembles de données, qui était encore considérée comme l’état de l’art au moment du lancement de Google Translate en 2006. Le domaine a cependant explosé en 2016, lorsque Google est passé à un moteur « neuronal », ancêtre des grands modèles de langage (LLM) d’aujourd’hui. L’influence s’est exercée dans les deux sens : l’amélioration des LLM a entraîné celle de la traduction automatique.
Dans le cadre du test d’Unbabel, des traducteurs humains et automatiques ont été invités à tout traduire, du simple message texte aux contrats juridiques complexes, en passant par l’anglais archaïque d’une ancienne traduction des « Méditations » de Marc-Aurèle. Le modèle d’IA d’Unbabel s’est montré à la hauteur. Mesurés par Multidimensional Quality Metrics, un référentiel de suivi de la qualité des traductions, les humains étaient meilleurs que les machines s’ils parlaient couramment les deux langues et s’ils étaient également experts dans le domaine traduit (par exemple, les traducteurs juridiques spécialisés dans les contrats). Mais l’avance est minime, déclare M. Pedro, qui ajoute qu’il serait difficile d’imaginer que, d’ici deux ou trois ans, les machines ne supplantent pas totalement les humains.
Marco Trombetti, patron de Translated, basée à Rome, a créé une autre mesure de la qualité des traductions automatiques, appelée Time to Edit (TTE). Il s’agit du temps nécessaire à un traducteur humain pour vérifier une transcription produite par une machine. Plus il y a d’erreurs dans la transcription, plus le traducteur humain doit travailler lentement. Entre 2017 et 2022, le TTE est passé de trois à deux secondes par mot dans les dix langues les plus traduites. M. Trombetti prévoit qu’elle tombera à une seconde dans les deux prochaines années. À ce stade, un humain n’apporte pas grand-chose au processus pour la plupart des tâches, si ce n’est ce que Madeleine Clare Elish, responsable de l’IA responsable chez Google Cloud, appelle une « zone de déformation morale » : une personne qui portera le chapeau lorsque les choses tourneront mal, mais sans espoir raisonnable d’améliorer les résultats.
Le problème de la traduction d’une phrase à l’autre est « presque résolu » pour les langues « à ressources élevées » disposant du plus grand nombre de données d’entraînement comme le français et l’anglais, explique Isaac Caswell, chercheur scientifique chez Google Translate.
Mais aller plus loin et rendre la traduction automatique aussi performante qu’une personne multilingue — en particulier pour les langues qui ne disposent pas d’une multitude de données d’apprentissage — sera une tâche plus ardue.
Les traductions complexes sont confrontées aux mêmes problèmes que ceux auxquels sont confrontés les linguistes en général. Sans la possibilité de planifier, de se référer à la mémoire à long terme, de s’appuyer sur des sources factuelles ou de réviser leur production, même les meilleurs outils de traduction ont du mal à traiter les ouvrages volumineux ou les tâches de précision telles que le respect de la longueur d’un titre traduit. Des tâches qu’un être humain considère comme triviales continuent de dérouter les outils d’aide à la traduction. Ils « oublient », par exemple, les traductions de termes figés tels que les noms de magasins, et les traduisent à nouveau, et souvent différemment, chaque fois qu’ils les rencontrent. Ils peuvent également halluciner des informations qu’ils ne possèdent pas pour les faire correspondre aux structures grammaticales de la langue cible. « Pour obtenir une traduction parfaite, il faut aussi une intelligence de niveau humain », explique M. Caswell. Sans être un poète compétent, il est difficile de traduire un haïku.
Encore faut-il que les utilisateurs puissent se mettre d’accord sur ce qu’est une traduction parfaite. La traduction a longtemps été caractérisée par une tension entre la « transparence » et la « fidélité », c’est-à-dire le choix entre traduire des phrases mot à mot telles qu’elles sont dans la langue originale ou telles qu’elles sont ressenties par le public cible. Une traduction transparente laisserait une expression idiomatique telle quelle, fera entendre aux francophones un Polonais balayer un problème en traduisant littéralement « pas mon cirque, pas mes singes » alors qu’une traduction fidèle (aussi appelée libre ou contextuelle) irait jusqu’à changer des références culturelles entières afin, par exemple, que les Américains ne soient pas pris au dépourvu par l’utilisation dans un texte britannique de « football-shaped » pour décrire un objet sphérique alors qu’aux États-Unis le ballon de football est ovale.
Même s’il existait un simple réglage qui permette de passer de la transparence à la fidélité, le perfectionnement de l’interface d’un tel système nécessiterait l’assistance de l’IA. La traduction d’une langue à l’autre peut parfois nécessiter plus d’informations que celles présentes dans le document source : pour traduire « Je t’aime bien » du français au japonais, par exemple, il faut connaître le sexe de l’interlocuteur, sa relation avec la personne à laquelle on s’adresse et, idéalement, son nom pour éviter l’utilisation impolie du mot « tu ». Un traducteur automatique parfait devrait être capable d’interpréter et de reproduire tous ces indices et inflexions subtils.
L’ajout de cases à cocher et de sélecteurs à une interface aurait pour effet d’embrouiller les utilisateurs. Dans la pratique, un traducteur automatique parfait devrait offrir une qualité de résultat et une méthode d’entrée de données dignes d’un être humain. L’obligation de poser des questions complémentaires, de savoir quand troquer la transparence contre la fidélité et de comprendre à quoi sert une traduction signifie que la traduction avancée aura besoin de plus d’informations que le simple texte source, explique Jarek Kutylowski, fondateur de DeepL, une jeune entreprise allemande. Si nous pouvons voir l’adresse à laquelle vous envoyez un courriel, voire l’historique de la conversation, nous pourrons dire « Hé, cette personne est en fait votre patron » et l’adapter en conséquence.
Il y a ensuite la question des langues à faibles ressources, où la rareté des textes écrits signifie que la précision des traductions n’est pas améliorée par les percées du LLM qui ont transformé le reste de l’industrie. Des approches moins gourmandes en données sont actuellement testées. Une équipe de Google, par exemple, a mis au point un système permettant d’ajouter la traduction de la parole à la parole pour 15 langues africaines. Plutôt que d’être formé sur des gigaoctets de données audio, ce système apprend à lire les mots écrits comme le ferait un enfant, en associant les sons de la parole à des séquences de caractères sous forme écrite.
La traduction en direct est également en préparation. DeepL a lancé en novembre un système de traduction orale, qui offre des services d’interprétation pour les conversations individuelles en personne et les vidéoconférences entre plusieurs participants. Unbabel, quant à elle, a fait la démonstration d’un appareil capable de lire les petits mouvements musculaires des poignets ou des sourcils et de les associer à du texte généré par le modèle LLM pour permettre la communication sans qu’il soit nécessaire de parler ou de taper à la machine. L’entreprise a l’intention d’intégrer cette technologie dans un dispositif d’assistance destiné aux personnes atteintes de lésions neuromotrices et qui ne peuvent plus parler.
Malgré ces progrès, et le rôle qu’il y a joué, M. Caswell espère que l’intérêt de parler d’autres langues ne disparaîtra pas complètement. « Les outils de traduction sont très utiles pour se déplacer dans le monde, mais ce ne sont que des outils », explique-t-il. « Ils ne peuvent pas remplacer l’expérience humaine de l’apprentissage d’une langue, qui permet de comprendre d’où viennent les autres, de comprendre à quoi ressemble un endroit différent. »