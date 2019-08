domaine public

Des données trop brutales pour être exploitées

Et maintenant, le vrai classement commence

Le système avait été amplement détaillé : avant 1976, les œuvres — films, livres, musique, etc. — ne disposaient que de 28 années de protection par le droit d’auteur. Une fois cette période écoulée, les titres devaient alors être réenregistrés pour bénéficier d’une nouvelle couverture. Mais par défaut, ils étaient logiquement versés dans le domaine public Or, des lacunes techniques ou une bureaucratie pesante ont rendu la tâche trop complexe, décourageant certainement, par ignorance également, les ayants droit.Or, depuis toutes ces années, la Library of Congress a conservé les archives des livres enregistrés et renouvelés, on pouvait donc soupçonner que par défaut existait un registre des œuvres qui n’étaient plus sous droits. La réalité, comme toujours, se trouve entre les deux. Seules les informations concernant le renouvellement de copyright pouvaient être absorbées par les ordinateurs, les autres devaient être traitées à la main. Long et fastidieux, mais les résultats sont sidérants.La New York Public Library a pris part à cette entreprise, analysant la période de 1923 à 1964. Une période conscrite précisément, puisqu’avant 1923, le domaine public est évident, et après 1963, il s’applique systématiquement. Durant ces 41 années, on nageait dans la zone grise. Les données dont disposait la NYPL ont été transformées pour être passées en format XML, ce qui rendait le décryptage plus aisé.Conclusion : les ordinateurs ont tranché et 80 % des livres publiés durant cette quarantaine d’années relèvent du domaine public. Autrement dit, sont gratuitement et légalement téléchargeables. Toute la procédure a été savamment détaillée à cette adresse Le problème est de savoir où l’on pourra découvrir ces centaines de milliers de livres. Des outils comme le projet Gutenberg ou Hathi Trust, et même Google Books disposent déjà de certains de ces titres numérisés patiemment – voir ici . Mais reste que la totalité de ces œuvres n’est pas encore centralisée de façon claire, de même que tous les ouvrages n’offriront pas un intérêt absolument évident.Nul doute qu’avec le temps, les choses vont s’affiner, et permettre de mettre la main sur l’ensemble de ces titres, aujourd’hui appartenant au public. Le problème sera ensuite de pouvoir classer et ranger quelque peu cette masse d’informations, sans quoi les livres, pour gratuits qu’ils soient, tomberont dans un oubli certain.