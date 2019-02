(Javier Arce, CC BY-NC-ND 2.0)

Le Seigneur des Boulons

Des résultats trop probants

On connait l'appétit des chercheurs spécialisés dans le développement des intelligences artificielles pour les exercices littéraires. Le texte, en tant que donnée, est particulièrement simple à traiter pour ces « robots qui apprennent » : en utilisant des techniques de fouilles de textes, les chercheurs sont capables de donner une grande quantité d'informations à « apprendre » aux machines.Autrement dit, ces dernières vont effectuer quantité de recoupements, d'hypothèses et de constructions pour analyser et restituer des déductions tirées de ces données. Par exemple, comment rédiger une phrase qui fait sens. Ou, mieux encore, écrire un texte de fiction à partir d'une phrase imposée.C'est au point où en sont les chercheurs de l'association OpenAI, avec GPT-2, leur intelligence artificielle capable de générer des textes. « Nous sommes à l'origine d'un modèle de langage à grande échelle, non supervisé, qui génère des paragraphes de texte cohérents, réalise des performances de pointe sur de nombreux tests de modélisation de langage et peut comprendre de manière rudimentaire un texte lu, réaliser une traduction automatique, apporter des réponses à des questions ainsi qu'une synthèse, le tout sans formation spécifique à l'une de ses tâches », annonce ainsi l'équipe.Entraîné à l'aide de 8 millions de pages web, GPT-2 est un auteur particulièrement doué, annonce OpenAI : il est ainsi capable d'adapter son style au contexte et à la finalité du texte. Il peut par exemple signer un texte journalistique à propos du vol d'un conteneur rempli de matériel radioactif. Une fiction, bien entendu, mais le résultat est cohérent, cite les paroles de représentants officiels et donne quelques détails sur l'événement, proposant un article comme un journal pourrait en publier.L'équipe souligne toutefois que quelques erreurs apparaissent, notamment des répétitions et des problèmes de cohérence — le robot aurait ainsi écrit « le feu s'est déclaré sous l'eau ».Mais l'expérience s'est révélée très enthousiasmante sur un exercice des plus ardus : écrire un texte basé sur les personnages et l'univers du Seigneur des Anneaux, de J.R.R. Tolkien. Là encore, le résultat est surprenant : le robot, qui devait poursuivre un récit commençant par « Legolas et Gimli se jetèrent sur les orcs, brandissant leurs armes, en poussant un puissant cri de guerre », s'en est très bien sorti.Elrond, Aragorn et Gandalf sont évoqués dans le texte, ainsi que Frodon, Sam et deux anneaux... Si le texte contient là aussi quelques incohérences, on est loin des incompréhensibles passages de Harry Potter qu'un robot avait commis il y a quelques années ... Bien entendu, précise l'équipe, plus le robot « connait » son sujet, plus le résultat est convaincant.L'association OpenAI s'était donné comme credo de toujours partager le plus possible les résultats de leurs recherches, pour que l'étude et l'usage des intelligences artificielles progressent plus rapidement. Néanmoins, ce vœu pieux vient de trouver ses limites : « En raison des préoccupations portant sur l'utilisation de modèles de langage à grande échelle pour générer un langage trompeur, biaisé ou abusif, nous ne publions qu'une version restreinte de GPT-2 », indique l'équipe derrière la recherche.La charte d'Open AI précisait également que la prudence devait prévaloir dans la recherche sur les intelligences artificielles et sur la libre réutilisation des résultats, pour éviter que certaines informations ne soient utilisées à des fins malhonnêtes.Apparemment, c'est le cas pour GPT-2, qui pourrait par exemple servir à générer des dizaines d'articles colportant des « infox ». « Nous pensons également que les gouvernements devraient envisager d'élargir ou de lancer des initiatives visant à surveiller plus systématiquement l'impact sociétal et la diffusion des technologies liées à l'intelligence artificielle », termine OpenAI...