En matière d'écriture, les intelligences artificielles génératives ne sont jamais en manque d'inspiration. En les couplant à une interface logicielle, il devient possible de les automatiser, les rendant capables de rédiger des textes au kilomètre, sans intervention humaine. Des titres « signés » grâce à ce stratagème ont pris d'assaut la boutique Kindle d'Amazon, dédiée aux ouvrages autopubliés.
Le 04/07/2023 à 16:14 par Antoine Oury
4 Réactions | 554 Partages
Publié le :
04/07/2023 à 16:14
4
Commentaires
554
Partages
Les intelligences artificielles génératives textuelles, à l'instar de la plus connue, ChatGPT, rédigent en quelques secondes un texte concis et compréhensible sur un sujet donné. L'utilisateur peut ensuite affiner le résultat en demandant à l'outil de préciser certains éléments, ou d'en retirer d'autres. Pour donner naissance à sa prose, l'IA générative s'appuie sur les textes disponibles en accès libre sur le web.
Ce recours à des sources externes, non créditées, soulève des questions relatives au droit d'auteur et à l'honnêteté intellectuelle : si le texte généré semble original, il s'apparente en réalité à une sorte de patchwork d'éléments composites glanés çà et là.
La conception même des intelligences artificielles génératives interroge, puisqu'elle fait entrer en jeu un volume considérable de textes, utilisés pour « entraîner » les machines — l'apprentissage automatique. Or, certains de ses écrits sont couverts par le droit d'auteur, et leurs rédacteurs n'ont tiré ni rémunération ni reconnaissance de cette exploitation.
Deux auteurs américains ont récemment porté plainte, à ce titre, contre OpenAI, la société derrière ChatGPT, pour violation du copyright sur leurs œuvres...
Généralement mises à profit pour rédiger des textes simples, les intelligences artificielles génératives demandent une attention soutenue de la part de l'utilisateur, dès lors qu'il souhaite les pousser dans leurs retranchements. D'une part, parce qu'il est nécessaire de vérifier la plupart des éléments avancés par l'outil, faute d'indication des sources. D'autre part, parce que des interventions fréquentes sont requises, pour affiner et corriger le résultat obtenu.
Le 20 juin dernier, Matt Shumer, PDG de la société HyperWriteAI, qui commercialise un « assistant d'écriture basé sur l'intelligence artificielle », publie un message pour présenter « gpt-author ». Après la description de quelques points au sein d'une interface de programmation, celle-ci utilise GPT-4 pour rédiger un « roman fantasy original ».
L'IA est invitée à générer une liste d'intrigues potentielles à partir d'une suggestion de l'utilisateur. Elle sélectionne ensuite l'intrigue la plus engageante, la corrige et en extrait un titre. Puis, elle créé un scénario détaillé avec un nombre spécifié de chapitres, avant de tenter d'améliorer ce scénario.
Chaque chapitre est ainsi écrit individuellement par l'IA, en suivant l'intrigue et en tenant compte du contenu des chapitres précédents. Une commande pour concevoir la pochette est générée et la couverture est créée. Enfin, tout est rassemblé et le roman est proposé dans un fichier EPUB.
– Mode d'emploi de « gpt-author » sur GitHub
En retirant les nécessaires interventions de l'utilisateur, GPT-4 deviendrait un « romancier » autonome, capable de produire plus de romans que Barbara Cartland elle-même...
Difficile d'établir un lien de causalité, mais la présentation au monde de « gpt-author » a été suivie, quelques jours plus tard, d'une prise d'assaut de la plateforme Kindle, d'Amazon, par des ouvrages rédigés par des intelligences artificielles.
Ces livres peinent à dissimuler la véritable nature de leur auteur, dès le titre : Apricot bar code architecture, Department of Vinh Du Stands in Front of His Parents’ Tombstone (La filiale de Vinh Du se tient devant la tombe de ses parents) ou encore Ma La Er snorted scornfully (Ma La Er renifla avec mépris) sont quelques-uns des exemples les plus improbables relevés par Vice. Les textes sont largement incompréhensibles, et totalement incohérents.
En cette fin de mois de juin, des dizaines de livres numériques générés par des IA se sont retrouvés dans les classements des best-sellers, notamment dans la catégorie « Romance pour adolescents et jeunes adultes », comme l'indique Caitlyn Lynch, autrice indépendante américaine, dans un message sur Twitter.
D'autres sections, parfois de niche, sont concernées, comme la « fiction militaire » ou les textes demandant deux heures de lecture, selon DailyDot.
Amazon a visiblement corrigé les listes des meilleures ventes dans la foulée des messages et articles sur le sujet, mais les titres restaient disponibles sur la plateforme, selon Vice.
L'automatisation de l'écriture fait bien sûr saliver les magouilleurs de tout poil : la perspective de se tailler une bibliographie sans trop se fatiguer peut stimuler. Et semble lucrative, puisque les classements des meilleures ventes s'emballent.
Selon DailyDot, l'explication est simple : ces livres générés automatiquement sont lus, de manière tout aussi automatique, par des « bots », une application logicielle à laquelle cette tâche est confiée. Les titres se retrouvent ainsi mis en avant dans l'écosystème Kindle et sont susceptibles d'être achetés, ou même simplement parcourus, via l'abonnement Kindle des utilisateurs.
Certes, les sommes récoltées à chaque lecture sont minimes, mais restent appréciables lorsqu'aucun effort n'est fourni derrière.
Dans un message adressé à Vice, Amazon indique que la société investit « massivement, des fonds, du temps et des ressources internes, afin de proposer une expérience d'achat en toute confiance et de protéger les consommateurs et les auteurs des abus ».
En mars dernier, un porte-parole d'Amazon nous précisait, au sujet des livres écrits à l’aide d’une intelligence artificielle : « Tous les livres disponibles dans notre boutique doivent être conformes à nos règles relatives au contenu, et notamment aux droits de propriété intellectuelle et à la législation en vigueur. »
Amazon n'est pas la seule plateforme concernée : du côté de Wattpad, un de ses concurrents dans le domaine de l'autopublication, des sections réunissent déjà des contenus générés automatiquement. Interrogée, la société, qui appartient désormais au Sud-Coréen Naver, nous indique :
En tant que plateforme mondiale phare pour les webnovels, notre priorité a toujours été de soutenir les auteurs, leurs intérêts et leur carrière. Alors que les technologies d'intelligence artificielle pour l'écriture et la publication évoluent rapidement, nos équipes suivent avec attention l'émergence de la législation sur ces outils et développent de nouvelles règles pour nous assurer qu'ils pourront nous aider dans notre mission : divertir et relier les publics à travers des récits, tout en portant une nouvelle génération d'auteurs du monde entier.
- Wattpad
Autrement dit, les plateformes restent à l'affût, mais agissent encore avec prudence. Accumuler les contenus, pour commencer, permet de multiplier le trafic. Toutefois, une trop mauvaise expérience des utilisateurs peut aussi les amener à déserter une application ou une librairie en ligne...
À ce jour, il reste par ailleurs complexe de déterminer le statut légal de tous ces textes rédigés par des IA : étant donné qu'aucune intervention humaine n'aurait participé à la conception de l’oeuvre, celle-ci ne pourrait pas être couverte par le droit d'auteur, du moins aux États-Unis.
En février dernier, le Copyright Office avait en effet tranché, au moins de manière temporaire : le copyright ne pouvait s'appliquer qu'à des éléments reconnus comme le fruit d'une création humaine. Allant plus loin, l'institution américaine ajoutait même que les fameuses prompts, ou les directives données à l'IA par l'utilisateur, ne pouvaient pas être assimilées « aux éléments traditionnels de l'auctorialité ».
Tous ces textes commercialisés relèveraient donc en réalité du domaine public : chacun pourrait s'en emparer et les vendre à son tour, dans une autre édition.
Du côté de l'Union européenne, un règlement, qui reste à adopter, pourrait obliger à la présence d'une mention, en cas de contenu créé avec ou par une intelligence artificielle.
Une chose est certaine : les IA auront de quoi lire, à l'avenir.
Photographie : illustration, Matthew Hurst, CC BY-SA 2.0
4 Commentaires
Lyo
04/07/2023 à 23:01
Il y a des livres genre "50 Shades of grey" , "Twilight", "La Vérité sur l’affaire Harry Quebert" qui sont super nuls mais en tête des ventes.
Après, je pense que là où ça changera ça sera sur la concurrence entre auteur autopublié. Avec toutes ces offres, les IA inondent les marchés donc forcément, ça sera à celui qui vend le moins cher à mon avis.
Bianca
05/07/2023 à 10:08
Lapsus calami d'une IA "amazonienne" ?
"et de protéger les consommateurs et les auteurs des abus »
Lorda
05/07/2023 à 11:33
Bonjour Actualitté,
Une légère approximation s'est glissée dans votre article. Votre sous titre "des livres à l'infini", bien que séduisant, sous estime la part matérielle liée à l'utilisation d'une IA et au stockage de données. Il est aisé d'oublier ceci lorsqu'on nous présente le numérique comme un "cloud" ou "dématérialisé", mais ce sont des abus de langage.
Je vous conseille le livre Cyberstructure de Stéphane Bortzmeyer aux excellentes éditions C&F, ainsi que cet article sur le coût énergétique et en ressources de ChatGPT : https://www.lebigdata.fr/argent-energie-vrai-cout-chatgpt
On aborde régulièrement la question des IA génératrices sur l'angle de ses infractions au droit d'auteur et sur la qualité des contenus sur lesquels elles sont entraînées, plus rarement sur le côté colonial de son fine tuning perpétuel (merci d'y avoir fait allusion), mais il est encore plus rare de voir abordées les questions liées à son coût sur les écosystèmes. Pourtant, il semble intéressant de soulever ces questions alors que nous sommes sensés et sensées effectuer une transition énergétique d'ampleur.
Aurelien Terrassier
05/07/2023 à 11:39
C'est flippant et inquiétant de voir une telle dérive productiviste avec Chatgpt qui se substituerait après les correcteurs maintenant aux auteurs. Mais ce qui est écrit sur le papier ne se s'amplifiera peut-être pas car il y aura forcément des problèmes de droits d'auteurs même si Amazon garantit l'inverse..