Rentrée littéraire : La fashion week des libraires


Les pseudonymes qu’emploient les auteurs sont-ils voués à une fin certaine ? Les programmes d’intelligence artificielle se perfectionnant, l’hypothèse semble se confirmer. Avec Emma Identity, un nouveau bond s’opère dans la détection et la reconnaissance du style. Voici la première application web en mesure de déterminer l’auteur d’un texte...



 

 

Voilà quelques années, JK Rowling s’était fait prendre au jeu de la machine intelligente : pour trouver un peu de repos et retrouver l’anonymat, la romancière signait quelques thrillers sous le pseudo de Robert Galbraith. Mais un programme, baptisé Signature, avait été en mesure de rapprocher les deux styles d’écriture, et de confondre l’auteure. 

 

Il avait suffi d’une étude comparative des différents livres d’Harry Potter, ainsi que The Casual Vacancy, le tout confronté à The Cuckoo’s Calling et deux titres d’autres écrivains pour y parvenir. Fastidieux pour un humain, mais relativement aisé pour un programme.

 

Emma Identity fonctionne sur le même procédé : il s’agit d’une exploitation du machine learning, qui parvient à détecter des éléments avec 85 % de réussite. Il lui suffit de 8000 mots écrits par un auteur pour lui attribuer une « voix ». Elle parvient alors à identifier toute paternité de texte, ce qui simplifierait les recherches dans les cas de plagiats mis en balance.

 

Concrètement, Emma servirait alors tant aux écrivains qu’aux journalistes, aux éditeurs, avocats et bien d’autres – jusqu’au FBI qui définirait alors l’auteur de messages de chantage. Si, si... Pour l’instant en version bêta, elle s’occupe depuis juin dernier de faire sensation sur la toile.

 

Prenant en compte une cinquantaine de paramètres mathématiquement définis, à travers l’examen d’un texte, Emma va donc creuser les ressemblances qu’elle a en base de données pour trouver un profil. Aleksandr Marchenko, le directeur de cette initiative, indique que, même avec 5000 mots d’un auteur, Emma est en mesure de faire des conclusions probantes. 
 


 

L’algorithme sur lequel repose cette IA parviendrait à faire de véritables miracles dans des cas de plagiats portés devant la justice : là où l’appréciation humaine peut incliner d’un côté ou de l’autre, la machine apporterait une réponse implacable. 

 

En 2049, les livres des robots seront meilleurs que ceux des humains 

 

Pour l’heure, Emma ne fonctionne qu’en anglais, bien que les paramètres soient évidemment adaptables pour d’autres langues. Qui sait quelles découvertes sur l’inspiration, la paternité ou l’origine des inspirations de grandes œuvres Emma entraînerait ? 

 

Aujourd’hui, Emma continue de se tromper quand on tente de la coincer, mais ses erreurs sont autant d’apprentissages complexes qu’elle réalise. Seule difficulté majeure : les traductions, qui posent un véritable cas de conscience à la machine, ainsi qu’elle l’explique. « Tout texte traduit comporte deux identités d’écriture (ou plus) : l’auteur originel et le(s) traducteur(s). »

 

L'intelligence artificielle au service du livre et de la lecture