PPP : La numérisation du domaine public entre de bonnes mains

Nicolas Gary - 15.04.2013

Edition - Bibliothèques - domaine public - numérisation - Bruno Racine


La numérisation dans le cadre du Partenariat Public Privé, qui associe BnF Partenariats à la société Proquest, pour les ouvrages anciens n'en finit pas de rebondir. Récemment, Bruno Racine, président de la BnF a été auditionné par la Commission des affaires culturelles de l'Assemblée nationale, pour apporter quelques réponses. Et les députés souhaitent notamment que les accords passés entre BnF Partenariats et Proquest soient définitivement rendus publics.

 

 

 

 

Hasard des calendriers, la société Numen, vient de diffuser un communiqué présentant des résultats particulièrement bons, pour l'année 2012. « Le chiffre d'affaires de la société s'élève aujourd'hui à 70 millions d'euros, et voit son activité dématérialisation croître de +23 % et personnalisation carte de +42 % par rapport à l'exercice 2011. »

 

Croissance à deux chiffres

 

Marc Le Vernoy, président du directoire du groupe Numen, assure que les investissements réalisés durant l'année 2012 sont conformes à la feuille de route. Et dans le domaine de la numérisation patrimoniale, la société affiche un joli carnet d'adresses. 

 

Numen a conforté sa position de n°2 Européen et a notamment participé à la dématérialisation de plus de 80 000 images, vidéos et textes pour le Centre Pompidou Virtuel et compte désormais de nouvelles références dans les institutions européennes (Archives Historiques de la Commission Européenne), les universités (Université du Luxembourg) et dans le secteur de l'ePub pour tablettes (Hachette).

À noter les gains de marché significatifs auprès de la BnF (Bibliothèque Nationale de France) pour la numérisation de livres et journaux anciens, ProQuest, les Archives Nationales ou Infoterra, projet international de dématérialisation du cadastre de l'Ile Maurice.

 

On notera cet autre commentaire, particulièrement intéressant : « Je regrette que l'évolution du marché de la numérisation culturelle, en France, soit ralentie et que les financements destinés, notamment à la numérisation de livres anciens, n'aient pas été alloués comme prévus. Nous avons cependant accéléré notre développement vers de nouveaux marchés tels que celui de l'ePub et le text mining. »

 

Numen et Proquest, partenaires particuliers

 

Pourtant, Numen vient de reporter, au titre de prestataire, un marché des plus intéressants : celui de la numérisation des oeuvres du domaine public, celui dont Proquest a la responsabilité. Si Numen a refusé catégoriquement de répondre à nos demandes d'entretien, la société Proquest, elle, se montre un peu plus loquace. Voilà la réponse apportée, lorsque ActuaLitté demande quelles sont les relations avec la société Numen, et comment se déroule la numérisation : 

 

Numen est le partenaire que nous avons choisi pour ce projet de numérisation, et nous sommes heureux qu'ils n'utilisent que des machines produisant des images de haute qualité (en accord avec l'exigence propre à nos standards). La qualité des images scannées est aussi examinée par la BnF. La délocalisation des livres scannés répond à des problématiques habituelles liées au cropping d'images et l'indexation par les méta-données, qu'il ne serait pas judicieux de réaliser dans le même temps que la numérisation.

Dans la mesure où les images sont déjà de haute qualité, nul besoin de travail supplémentaire pour compenser des défauts (et nous ne pensons pas qu'il soit possible d'améliorer des images de mauvaise qualité de cette façon). 

 

De même, Proquest garantit que la numérisation se déroule dans les meilleures conditions : « Les personnes responsables de la numérisation suivent une formation pour être certain qu'il savent manipuler des objets de ce type d'une manière satisfaisante pour la bibliothèque. » C'est que les ouvrages sont en effet particulièrement fragiles, et Proquest garantit que « les volumes considérés comme pouvant être abîmés par la numérisation sont mis de côté au moment du choix ».

 

Et de souligner que dizaines de milliers de livres ont déjà été numérisés pour le programme Early European Books, « et nous n'avons eu à déplorer aucun incident concernant des livres détériorés par le processus de numérisation ». Ce qui est étonnant, c'est cette assurance de la part de Proquest : la société américaine ne dispose d'aucune installation en France, et les échanges se font avec Numen, sans qu'il soit possible de contrôler visuellement l'état de la numérisation. Comment peut-on, dans ces circonstances, avoir tant d'assurance ?

 

Le choix pour la date des oeuvres ?

 

A ce titre, nous avons pu remarquer que le corpus d'oeuvres qui doivent être numérisées, dans le cadre du PPP avec BnF Partenariats, regroupe des ouvrages entre 1470 et 1701. Précisément ceux qui intéressent Early European Books. La BnF assure :

 

a. Sélection des documents

Le corpus concerne le Livre Ancien de 1470 à 1701, représentant un total de 10 000 000 de pages, soit environ 70 000 ouvrages.

La sélection retenue par la BnF est la suivante :

tous les exemplaires des incunables ;

un ouvrage par édition pour la période de 1501 à 1701.

b. Statut juridique

Compte tenu de l'ancienneté des ouvrages concernés, il est entendu que l'ensemble des œuvres relève du domaine public.

 

Or, lors de son appel à partenariat, la BnF avait présenté plusieurs corpus, et c'est justement celui-ci qui a été retenu par Proquest, qui a inité le programme Early European Books, lequel se consacre aux oeuvres de 1450-1700. Une coïncidence troublante, surtout quand on remarque l'intérêt commercial pour Proquest. 

 

« Les livres sont sélectionnés pour la numérisation par l'équipe des conservateurs de la BnF, dans le respect des paramètres du projet. Ni ProQuest ni Numen n'ont sélectionné les livres qui doivent être numérisés », nous assure la société.

 

Aucune recherche de potentiel marchand

 

Bruno Racine, de son côté, avait garanti dans Le Monde : « Il n'y a aucune sélection des corpus en fonction de leur potentiel marchand. » Et pourtant, les oeuvres seront bel et bien vendues, alors à qui profite donc cette numérisation, si le potentiel marchand n'a pas été un critère ? Bruno Racine a plusieurs fois rappelé que le corpus intéressait les chercheurs en priorité, avec des ouvrages majoritairement en latin. L'usage et la destination en étaient donc clairement scientifiques, en priorité.

 

Mais dans ces conditions, il est légitime de se demander si ce partenariat émanait d'un réel besoin de la BnF. Attendu que l'argent public va faire numériser (financement du Ministère de la Culture et de la Communication) et que l'argent public achètera la base de données (achat par le Ministère de l'Enseignement supérieur, pour les bibliothèques universitaires), l'enjeu de cette numérisation est plus que douteux.

 

Si la société Proquest avait porté le projet à la BnF, afin d'enrichir sa base de données actuelle, il semble qu'elle n'aurait pas pu mieux y parvenir qu'en agissant de la sorte. Une pure supposition cela dit.

 

Car, en parallèle, plusieurs acteurs s'interrogent sur cette qualité de numérisation, mettant en cause les appareils en charge de ce travail, mais également la fluidité des échanges - ou plutôt, la difficulté à communiquer. En effet, c'est d'une part en anglais que les communications s'opèrent entre Proquest et Numen, mais surtout, les conservateurs doivent transiter par BnF Partenariats pour transmettre des consignes. Un intermédiaire d'une opacité étonnante, autour duquel n'en finissent pas de tourner les plus sérieux doutes...