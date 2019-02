Saundra Castaneda, CC BY 2.0 Saundra Castaneda, CC BY 2.0

Et quand on en vient à parler de livres, d’internet et de recommandation, c’est avec des algorithmes qu’il vient s’amuser...

On a beaucoup parlé de l’annonce de la plateforme d’autopublication Wattpad – une annonce en deux temps, puisque d’un côté elle faisait savoir qu’elle créait une maison d’édition (dès lors qu’adviendra-t-il du partenariat lié il y a un peu plus d’un an avec Hachette ?), et de l’autre que les éditeurs de Wattpad Books seraient épaulés dans leur travail par un algorithme de sélection.



C’est surtout cette seconde annonce qui a fait grand bruit, même si personne n’est dupe du fait qu’un tel communiqué était l’assurance d’obtenir une bonne couverture média. Passons. Un algorithme de sélection des manuscrits : hérésie littéraire ou progrès ? Dans pareil cas, on serait tenté de répondre : « Les deux, mon capitaine ! »



Le monde se divise en deux catégories...



Évacuons d’emblée l’argument du combat littéraire : quelques années s’écouleront encore avant qu’un algorithme soit capable de faire la différence entre un véritable talent artistique et une exécution scolaire (si jamais cela arrive un jour). Et cela tombe bien, puisque le but de Wattpad Books n’est pas de trouver la prochaine Marguerite Duras ou le prochain Julien Gracq, mais de fabriquer des livres calibrés pour le succès. Wattpad Books ambitionne de devenir une fabrique à best-sellers, ni plus ni moins. Comme n’importe quel pari d’édition, cela ne fonctionnera pas à tous les coups… mais l’algorithme travaillera pour limiter les risques.



Il faut d’abord dissiper le brouillard quasi mystique dont le terme « algorithme » est auréolé. Un algorithme n’est pas une intelligence artificielle, comme on l’entend parfois. Du moins il n’en est pas encore une. Un algorithme n’a rien d’intrinsèquement intelligent : il ne s’agit que d’une suite d’instructions. Une recette de cuisine en est l’illustration parfaite :



• ouvre le frigo ;

• trouve les œufs dans le frigo ;

• sors les œufs et casse-les dans un bol ;

• ouvre le tiroir des couverts et sors-en une cuillère | si tu ne trouves pas de cuillère, prends une fourchette ;

• mélange les œufs | pendant ce temps, allume la plaque et pose une poêle dessus ;

• ajoute une noix de beurre | si tu n’as pas de beurre, mets un peu d’huile ;

• mets les œufs dans la poêle et laisse cuire jusqu’à solidification des œufs ;

• l’omelette est prête (ne me remerciez pas pour la recette)



Un algorithme n’est jamais rien d’autre qu’une liste d’instructions, rédigées au préalable par un humain et exécutées par une machine capable de travailler bien plus vite que nous. L’algorithme reflète donc la manière dont un être humain envisage de répondre à une question ou à un besoin donné.



... les algorithmes avec un pistolet chargé...



Cet algorithme peut ensuite s’enrichir, par observation, par éducation, ou en apprenant de ses erreurs : c’est pour cette raison que Facebook vous demande parfois si une publication est pertinente, ou que Google vous demande de chercher les panneaux routiers dans ses captchas. Combinés à de colossales masses de données, ces algorithmes apprennent, s’affinent et s’enrichissent. Mais il ne s’agit pas encore de céder son fauteuil d’éditeur à un robot. Le but est d’automatiser certaines tâches, dans un but très défini. Et ce but n’a rien d’anodin : il s’agit de fabriquer un best-seller.



Je répète : un best-seller. Pas forcément un excellent livre ou un livre qui révolutionnera l’histoire de la littérature, juste un livre qui se vend (si possible en grandes quantités).

Considérant que l’algorithme de Wattpad Books analysera les textes publiés sur sa plateforme sociale, celui-ci pourra prendre un certain nombre de variables « objectives » en considération :



• combien de lectures a obtenu le texte ? et si beaucoup de lectures, en combien de temps ont-elles été obtenues ?

• quelle est la proportion de lectures entre les premiers chapitres et les derniers chapitres d’une histoire complète ? quelle proportion de lecteurs a abandonné sa lecture en cours de route ?

• combien de notes ces histoires ont-elles obtenu ? Avec quelle moyenne ? sur quelle plage de temps ?

• l’auteur a-t-il publié autre chose sur la plateforme ? ses autres publications ont-elles rencontré un succès similaire ?

• combien d’occurrences obtient-on pour son nom lors d’une recherche sur Google ? est-il présent sur d’autres plateformes, comme Amazon ? Si oui, quel est son ratio de notation là-bas ?

• l’histoire est-elle rédigée dans une langue intelligible et correcte ? se conforme-t-elle aux « canons » de la dramaturgie ? (on pourrait en juger en analysant les commentaires des lecteurs)

• l’histoire est-elle ancrée dans une actualité ou dans un thème à la mode ? ses personnages représentent-ils une communauté particulière ?

• etc...



On peut voir dans le recours aux algorithmes de bonnes et de mauvaises choses. D’abord de bonnes choses, puisqu’il s’agit de minimiser les risques financiers lors de la production de livres et non pas de déceler un talent qui révolutionnera la littérature. Un algorithme débusque les redondances, pas les originalités.



... et ceux qui creusent... Toi, tu creuses...



Dès lors, face à l’explosion de la publication en ligne – des centaines de milliers de textes sont publiés chaque jour par des auteurs en herbe aux quatre coins du globe –, il faut trouver des moyens d’analyser cette production pour y trouver la perle rare. Car à moins d’embaucher des armées d’éditeurs chargés de lire tout ce qui se publie sur internet, on n’y parviendra pas : la tâche est surhumaine. Elle est donc précisément faite pour une machine.



Les algorithmes ne remplaceront pas de sitôt le travail d’un éditeur à la recherche d’un talent. Ils pourront en revanche aider les maisons d’édition qui tablent sur des succès commerciaux ou qui recherchent des sujets en particulier, notamment dans des niches éditoriales.



Avec toutefois un bémol : les programmes informatiques « lisent » aussi. Des quantités astronomiques de bots scannent le web et faussent les statistiques en permanence. Cela pourrait déboucher sur une falsification des statistiques, et donc sur des erreurs de jugement de l’algorithme, incapable de discerner une lecture informatique d’une lecture humaine.



Mais rassurons-nous : des hackers pourraient certes offrir à certains auteurs peu scrupuleux des moyens de s’affranchir des étapes de sélection, mais en l’état des choses, ces artistes n’échapperaient pas à l’examen de leur manuscrit par un éditeur en chair et en os. Celui-là seul sera à même d’évaluer la qualité intrinsèque de leurs textes.



À considérer qu’une frange écrasante de la production littéraire naît aujourd’hui sur internet, il n’est pas absurde de penser que des éditeurs puissent vouloir exploiter cette manne, et donc s’en donner les moyens : la plateforme Wattpad ne fait ici que récolter les fruits de ce qu’elle a semés ces treize dernières années. Mais à ce jeu, les plateformes de publication ayant déjà intégré des mécanismes de recommandation et de notation partent avec une longueur d’avance sur les maisons d’édition : elles disposent de données en grandes quantités. Comment un éditeur pourra-t-il rivaliser avec elles sur le terrain du best-seller ?



Avec le développement et l’entraînement de tels algorithmes, ce sont aussi les auteurs qui doivent se faire du souci : car à synthétiser les mécanismes qui font et défont le succès d’un roman, les machines pourraient bien apprendre à les écrire toutes seules, et plus vite que prévu. Le reste n’est qu’affaire d’art, de philosophie et d’éthique. Presque rien, en somme.