L'ebook a 40 ans > 1996 > L'Internet Archive, pour les générations futures

Marie Lebert - 30.05.2011

Reportage - anniversaire - ebook - internet


 

Fondée en avril 1996 par Brewster Kahle à San Francisco (Californie), l’Internet Archive a pour but de constituer, stocker, préserver et gérer une archive de l’internet, en sauvegardant et stockant la totalité du web tous les deux mois.
Le but est d’offrir un outil de travail aux universitaires, chercheurs et historiens, et de préserver un historique de l’internet pour les générations futures. L’Internet Archive se présente donc comme « une bibliothèque de l’internet » puis, dans un deuxième temps, comme « une bibliothèque numérique à but non lucratif destinée à procurer un accès universel au savoir humain ».

L’importance d’un archivage du web

Comme expliqué sur le site, de tout temps les sociétés ont voulu préserver leur culture et leur héritage pour les générations présentes et futures, et les bibliothèques ont donc eu pour vocation de conserver les traces écrites de cette culture et de cet héritage, et d’en procurer l’accès au grand public et aux chercheurs. Il paraît donc essentiel qu’elles étendent leur mission aux nouvelles technologies.

Paradoxalement, le travail de sauvegarde a souvent été mal fait au début du 20e siècle. Nombreux ont été les premiers films qui ont été recyclés - et donc définitivement perdus - pour récupérer la couche d’argent présente sur la pellicule. Nombre d’émissions de radio et de télévision n’ont pas été conservées. Il importe donc de ne pas reproduire la même erreur pour l’internet, et particulièrement pour le web, un nouveau médium dont la portée, immense, est encore méconnue en 1996. C’est la raison d’être de l’Internet Archive.

La Wayback Machine

En octobre 2001, avec 30 milliards de pages archivées, l'Internet Archive met ses archives en accès libre grâce à la Wayback Machine, qui permet à tout un chacun de voir l'historique d'un site web - à savoir la présentation et le contenu d'un site web donné - théoriquement tous les deux mois à partir de 1996, date de la création de l'Internet Archive.

 

 

 


En 2004, les archives du web représentent plus de 300 To (téraoctets) de données, avec une croissance de 12 To par mois. Le nombre de pages web visibles avec la Wayback Machine est de 65 milliards (provenant de 50 millions de sites web) en décembre 2006, 85 milliards de pages web en mai 2007 et 150 milliards de pages web en mars 2010.

Des collections numériques

En 2000, l’Internet Archive débute aussi la constitution de collections numériques, en hébergeant notamment une partie du Million Book Project (10.520 livres en avril 2005), tout comme des archives de films de la période 1903-1973, des archives de concerts live récents, des archives de logiciels, des archives d’images et de vidéos, les sites relatifs au 11 septembre (2001), les sites relatifs aux élections de 2000 (présidentielles) et 2002 (élection du Congrès et des gouverneurs des États), les sites relatifs aux pionniers du web, etc. Toutes ces collections sont en consultation libre sur le web.

 

 

 

 


De plus, en réaction au projet Google Books, l’Internet Archive pense qu'une bibliothèque numérique à vocation mondiale ne doit pas être liée à des enjeux commerciaux. En octobre 2005, elle lance l’Open Content Alliance (OCA) dans l'optique de fédérer un grand nombre de partenaires pour créer une bibliothèque planétaire publique respectueuse du copyright et sur un modèle ouvert, avec des collections consultables sur tout moteur de recherche. Un épisode sera consacré à l’Open Content Alliance lorsque nous arriverons à l’année 2005.


Notre prochain épisode : 1996 > CyLibris, éditeur électronique


Copyright © 2011 Marie Lebert