Archiver Internet : la BnF fait un effort d'ouverture aux bibliothèques

Cécile Mazin - 13.10.2014

Lecture numérique - Acteurs numériques - archives BnF - sites internet - bibliothèques consultation


Selon la loi du 1er août 2006 qui étend le dépôt légal à internet, la BnF a le droit de collecter, de conserver et de communiquer au public, les sites du « domaine français ». Ainsi, les éditeurs n'ont pas le droit de s'opposer à cette collecte et doivent fournir si besoin est, sur demande de la Bibliothèque les moyens d'accéder à leurs ressources en ligne. Ce boulot titanesque est fourni par des « robots moissonneurs » qui copient toutes les pages, animations, contenus audio ou vidéo, fichiers ou images et les indexent et les datent.

 

Ethernet plug

Henrik Bennetsen, CC BY SA 2.0

 

 

En avril 2008, la BnF mettait en place deux méthodes pour établir des « échantillons représentatifs de l'Internet français ». Des collectes dites « larges » qui permettent de faire un tour d'horizon de quelques centaines de milliers de sites, réalisées une fois par an et des collectes plus « ciblées » permettant de faire des archives plus denses de certains sites sélectionnés par des bibliothécaires.

 

Par l'intermédiaire d'un décret du 19 décembre 2011, les missions de l'établissement ont été recadrées. Le décret précisait en effet les modalités d'exercice du dépôt légal de l'Internet, qui s'inscrit dans la continuité des systèmes déjà existants pour les livres, les journaux, les disques, etc. Le dépôt légal de l'Internet s'applique à toutes les publications de l'Internet français (autrement dit le .fr), sauf les correspondances privées, bien entendu.

 

Désormais, l'ensemble des archives opérées est accessible à des bibliothèques situées en région, grâce à un arrêté ministériel, en date du 16 septembre. Ainsi, la consultation qui était réservée à la BnF, est opérationnelle dans 26 établissements de France. La médiathèque Émile Zola de Montpellier Agglomération est la première à proposer ce nouveau service. Cet accès distant aux archives du web sera progressivement étendu aux autres bibliothèques de dépôt légal imprimeur, renforçant ainsi les liens entre la BnF et les régions.

 

En 2014, 21 milliards de fichiers collectés, représentant 468 téraoctets, constituent « les archives de l'internet ». La BnF réalise des collectes automatiques à l'aide de robots logiciels qui opèrent des collectes larges, à grande échelle, de plusieurs millions de sites, une fois par an. Elle effectue aussi des collectes ciblées sur différents thèmes, à des fréquences et des profondeurs variables.

 

Les bibliothèques chargées du dépôt légal imprimeur en région s'associent régulièrement à la BnF pour la collecte du web électoral et la sélection de sites web d'intérêt régional. Elles sont désormais autorisées à proposer, dans leurs emprises, la consultation de ces archives de l'internet dans leur intégralité.