Des chercheurs effrayés par la qualité des textes de leur robot auteur

Antoine Oury - 19.02.2019

Lecture numérique - Usages - robot auteur textes - intelligence artificielle texte - seigneur anneaux ia texte


Si elles paraissent encore maladroites et risibles, les intelligences artificielles apprennent vite. Trop vite, même, au point d'effrayer leurs créateurs. L'association à but non lucratif OpenAI a développé une intelligence artificielle capable de générer des textes à partir d'une phrase rédigée par un humain. Generative Pre-trained Transformer-2, ou GPT-2 de son petit nom, s'est révélée tellement douée que ses créateurs ont préféré conserver une partie de son mécanisme secret, afin d'éviter les dérives.

Silly Robot
(Javier Arce, CC BY-NC-ND 2.0)


On connait l'appétit des chercheurs spécialisés dans le développement des intelligences artificielles pour les exercices littéraires. Le texte, en tant que donnée, est particulièrement simple à traiter pour ces « robots qui apprennent » : en utilisant des techniques de fouilles de textes, les chercheurs sont capables de donner une grande quantité d'informations à « apprendre » aux machines.

Autrement dit, ces dernières vont effectuer quantité de recoupements, d'hypothèses et de constructions pour analyser et restituer des déductions tirées de ces données. Par exemple, comment rédiger une phrase qui fait sens. Ou, mieux encore, écrire un texte de fiction à partir d'une phrase imposée.

C'est au point où en sont les chercheurs de l'association OpenAI, avec GPT-2, leur intelligence artificielle capable de générer des textes. « Nous sommes à l'origine d'un modèle de langage à grande échelle, non supervisé, qui génère des paragraphes de texte cohérents, réalise des performances de pointe sur de nombreux tests de modélisation de langage et peut comprendre de manière rudimentaire un texte lu, réaliser une traduction automatique, apporter des réponses à des questions ainsi qu'une synthèse, le tout sans formation spécifique à l'une de ses tâches », annonce ainsi l'équipe.
 

Le Seigneur des Boulons


Entraîné à l'aide de 8 millions de pages web, GPT-2 est un auteur particulièrement doué, annonce OpenAI : il est ainsi capable d'adapter son style au contexte et à la finalité du texte. Il peut par exemple signer un texte journalistique à propos du vol d'un conteneur rempli de matériel radioactif. Une fiction, bien entendu, mais le résultat est cohérent, cite les paroles de représentants officiels et donne quelques détails sur l'événement, proposant un article comme un journal pourrait en publier.

L'équipe souligne toutefois que quelques erreurs apparaissent, notamment des répétitions et des problèmes de cohérence — le robot aurait ainsi écrit « le feu s'est déclaré sous l'eau ».

Mais l'expérience s'est révélée très enthousiasmante sur un exercice des plus ardus : écrire un texte basé sur les personnages et l'univers du Seigneur des Anneaux, de J.R.R. Tolkien. Là encore, le résultat est surprenant : le robot, qui devait poursuivre un récit commençant par « Legolas et Gimli se jetèrent sur les orcs, brandissant leurs armes, en poussant un puissant cri de guerre », s'en est très bien sorti.

Elrond, Aragorn et Gandalf sont évoqués dans le texte, ainsi que Frodon, Sam et deux anneaux... Si le texte contient là aussi quelques incohérences, on est loin des incompréhensibles passages de Harry Potter qu'un robot avait commis il y a quelques années... Bien entendu, précise l'équipe, plus le robot « connait » son sujet, plus le résultat est convaincant. 
 

Des résultats trop probants


L'association OpenAI s'était donné comme credo de toujours partager le plus possible les résultats de leurs recherches, pour que l'étude et l'usage des intelligences artificielles progressent plus rapidement. Néanmoins, ce vœu pieux vient de trouver ses limites : « En raison des préoccupations portant sur l'utilisation de modèles de langage à grande échelle pour générer un langage trompeur, biaisé ou abusif, nous ne publions qu'une version restreinte de GPT-2 », indique l'équipe derrière la recherche.

La charte d'Open AI précisait également que la prudence devait prévaloir dans la recherche sur les intelligences artificielles et sur la libre réutilisation des résultats, pour éviter que certaines informations ne soient utilisées à des fins malhonnêtes.
Apparemment, c'est le cas pour GPT-2, qui pourrait par exemple servir à générer des dizaines d'articles colportant des « infox ». « Nous pensons également que les gouvernements devraient envisager d'élargir ou de lancer des initiatives visant à surveiller plus systématiquement l'impact sociétal et la diffusion des technologies liées à l'intelligence artificielle », termine OpenAI...

L'intelligence artificielle au service du livre et de la lecture


Commentaires

Pas de commentaires

Poster un commentaire

 

grin LOL cheese smile wink smirk rolleyes confused surprised big surprise tongue laugh tongue rolleye tongue wink raspberry blank stare long face ohh grrr gulp oh oh downer red face sick shut eye hmmm mad angry zipper kiss shock cool smile cool smirk cool grin cool hmm cool mad cool cheese vampire snake exclaim question

Vous répondez au commentaire de

Cliquez ici pour ne plus répondre à ce commentaire

* Laisser vide pour ne pas reçevoir de notification par email de nouveaux commentaires.