Oeuvres indisponibles : "Autant d’erreurs dans si peu de livres, c’est infernal"

Nicolas Gary - 04.09.2015

Tests - registre ReLIRE - livres numériques - oeuvres indisponibles


Le registre ReLIRE ne pouvait pas manquer de faire sa rentrée. En revanche, il lui était difficile de si bien rater la rentrée. Très attendu, le catalogue de livres numérisés, sous couvert de la loi sur l’Exploitation numérique des livres indisponibles, vend maintenant ses premiers titres. Entre droit moral malmené, indélicatesse avec les droits des créateurs sur les couvertures, heureusement, les fichiers sont décents. ActuaLitté a passé tout cela au crible.

 

Registre ReLIRE - Centre national du livre

ActuaLitté, CC BY SA 2.0

 

 

Avec quatre titres, sur les 260 aujourd’hui commercialisés, il était assez facile de se faire une idée du travail réalisé par les équipes de FeniXX, société en charge de la numérisation. Il faut comprendre que ces livres, n’étant plus commercialisés, sont difficiles à trouver. Raison pour laquelle la BnF a été engagée dans le projet : en ouvrant grand ses portes, l’établissement permet de trouver toutes les œuvres référencées dans le registre ReLIRE. Et de procéder à leur transformation en ebook.

 

D’ailleurs, on peut lire à la fin des ouvrages :

 

Participant d’une démarche de transmission de fictions ou de savoirs rendus difficiles d’accès par le temps, cette édition numérique redonne vie à une œuvre existant jusqu’alors uniquement sur un support imprimé, conformément à la loi n° 2012-287 du 1er mars 2012 relative à l’exploitation des Livres indisponibles du XXe siècle.

Cette édition numérique a été réalisée à partir d’un support physique parfois ancien conservé au sein des collections de la Bibliothèque nationale de France, notamment au titre du dépôt légal. Elle peut donc reproduire, au-delà du texte lui-même, des éléments propres à l’exemplaire qui a servi à la numérisation.

 

Pour certains, il s’agira d’une jolie pirouette pour se dédouaner par avance de toute critique. Mais c’est également un système pour minimiser le travail opéré. Explications : pour changer un livre papier en ebook, il faut photographier les pages, transformer ces images en texte (le processus de reconnaissance de caractère), puis relire pour éliminer les coquilles et, enfin, passer dans les formats numériques. 

 

"L'EPUB, compromis acceptable entre code de qualité et automatisation"

 

Or, les organisateurs de ReLIRE avaient assuré qu’ils se montreraient exigeants, avec un seuil maximum d’une erreur par page. À ce titre, et selon les manuscrits que nous avons consultés, il semble bien que le pari soit remporté. Et ce n’était pas nécessairement gagné d’avance.

 

Et de toute manière, il n’y aurait pas de relecture des livres, avait assuré Alain Absire, président de la SOFIA. Pour s’assurer d’optimiser ses fichiers, FeniXX a donc recruté un ancien de la société ePagine, qui avait beaucoup travaillé sur les questions de reconnaissance de caractères. Le grand risque était en effet, non de voir une faute par page, mais d'en ajouter une, avec un mauvais OCR... 

 

De ce que nous avons observé, le code, fort logiquement, rappelle donc celui que l’on peut trouver dans des fichiers ePagine. Le fait de retrouver les crédits du livre dans son format papier, et bien d’autres informations totalement obsolètes ne dérangera pas : Fenixx s’en est prémuni avec son avertissement. 

 

 

 

 

Dans l’ensemble, le codage en EPUB 3 est assez léger, ne contient pas de surcharges – des lignes superflues pour exécuter une action, comme l’italique, le gras, etc. On notera que le fichier contient également la langue du texte, ce qui est déjà un bon début. Ne pas sourire : cela permet de mieux gérer la césure sur certaines machines. Or, les appareils ne cherchent pas cette information de la même manière. Et pour en favoriser la détection, il faudra donc en rajouter.

 

Le CSS en revanche, est souvent trop long, et contient, sur ses centaines de lignes, des éléments superflus. Il faudra également renoncer aux notes de bas de page sur tablettes ou lecteur ebook. Des lecteurs ebook de deux ans pourront rencontrer certains problèmes à lire les fichiers – notamment quand une couverture dépasse une résolution de 3 millions de pixels. En somme, les fichiers sont de bonne facture, certainement pas suffisants pour convaincre des spécialistes. Ils présentent un compromis acceptable entre du code de qualité et un processus d’automatisation.

 

Et il est heureux que l’ebook soit, dans son code, relativement irréprochable – encore que l’absence, par défaut, de marge est tout de même pénible. Comme tous les appareils ne les gèrent pas, les clients apprécieront. Les pratiques tarifaires relèvent en revanche du pur délire : des textes d’une cinquantaine de pages, vendus pour 5 à 8 euros, sont légion. Mais ce n’est pas le plus dérangeant.

 

Côté couverture, le droit moral en prend plein les dents

 

ActuaLitté avait déjà noté que les couvertures étaient entachées de vilaines étiquettes, qui proviennent donc du catalogage BnF. Cette question sera particulièrement délicate, et nous avons sollicité François Gèze, directeur des éditions de La Découverte, et président du comité scientifique de ReLIRE, pour qu’il apporte des précisions. Voici quelques exemples, évocateurs : 

 

 

La question est en effet de savoir pourquoi, d’un côté on trouve les couvertures génériques FeniXX – issues d’un jeu-concours organisé sur Facebook, où des étudiants furent sollicités, mais rémunérés – et de l’autre, des couvertures reproduisant celle de l’ouvrage scanné : la question du droit moral des illustrateurs devrait donc se poser. Peut-on flanquer une couverture d’une vilaine étiquette, et prétendre à vendre des fichiers de la sorte – qui ressemblent alors à des photos d’amateurs vendant des ouvrages d’occasion ? Sur quelle base les couvertures sont choisies... mystère.

 

On peut lire ce qui suit, sur certains livres, sans que cela n’apporte plus de renseignements : 

 

 « La couverture reproduit celle du livre original conservé au sein des collections de la Bibliothèque nationale de France, notamment au titre du dépôt légal. »

Couverture : Conception graphique ‒ Coraline Mas-Prévost, Programme de génération ‒ Louis Eveillard, Typographie ‒ Linux Libertine, Licence OFL

 

De même, personne ne manquera de remarquer que la licence Eden Livres, le distributeur numérique, dégrade un peu plus la couverture, parvenant même à dissimuler le nom de l’auteur dans certains cas. 

 

 

Cette première partie de l’offre, de 260 ouvrages, ne représente cependant qu’un infime extrait de 15.000 titres qui devraient être commercialisés dans les prochains jours. 5000 devaient sortir en juillet – que personne n’a jamais vus – et le reste, pour la rentrée.

 

Or, on s’amusera à retrouver, dans cette première fournée, des titres qui ne devraient pas du tout y figurer. Ainsi, Multivers Edition nous assure que des auteurs belges, en contrat avec la maison, ont retrouvé leurs titres. De même, ReLIRE qui ne devait pas comprendre de livres traduits est passé outre. On retrouve Le marchand de mort, de Joseph Rosenberg, dans les ebooks vendus. Une traduction de l’américain. 

 

Le ministère de la Culture s’était pourtant fait tirer les oreilles par des écrivains britanniques et Nicolas Georges, directeur adjoint de la direction générale des médias et des industries culturelles, avait assuré à la Society of Authors : « Un petit nombre de livres anglais traduits a été enregistré dans la base de données des livres indisponibles, ce pour quoi je souhaite présenter mes excuses au nom des autorités françaises. » Les erreurs devaient avoir été corrigées... en mai 2013. 

 

 

 

Et puis, il y a des exemples de livres qui n’ont pas tout à fait le même titre que celui affiché par la couverture. Mieux encore : il est possible de trouver des titres vendus, alors qu’ils n’existent pas dans la base du registre ReLIRE. Ainsi, un certain Joël Houssin, farouchement opposé au livre numérique, découvrira avec bonheur que L’Écho des suppliciés est en vente en numérique, avec la couverture du livre de Hershell Gordon Lewis. Mais plus encore que son livre ne figure pas dans la liste de ReLIRE.

 

 

 

En revanche, on y trouvera un exemplaire de Locomotive rictus... pourtant réédité aux Éditions Ring, sous le titre Loco. Une version qui a été réécrite pour partie, certes. Mais comment expliquer qu’un auteur contre l’ebook, dont cette nouvelle version est publiée chez un éditeur qui ne commercialise aucun ebook, se retrouve dans la réédition FeniXX ?

 

Sauf à considérer que même les professionnels ne sont pas tous au courant de son existence ? « Autant d’erreurs dans si peu de livres, c’est infernal. Et combien de problèmes quand ils auront mis des 50 000 dans la base ? », s’interroge un auteur. Une question de plus, à ajouter, sans rire : tout cela est malgré tout opéré avec de l'argent public. Et les députés commencent à s'en inquiéter... 

 

« Après les contenus, voici que l’on retrouve les couvertures d’origine, et saccagées ? Et sans droits pour les illustrateurs ? Cela pourrait ressembler à s’y méprendre à du vol qualifié », réagit le président du SELF, Syndicat des Écrivains de Langue Française. De quoi conforter l’action intentée en France contre la législation ReLIRE, désormais dans les mains de la Cour de justice de l’Union européenne, à la demande du Conseil d’État. « Quant aux prix publics scandaleusement élevés mentionnés, ils démontrent une fois encore que certains éditeurs font leur possible pour vendre le moins possible de livres au format numérique. »