Un éléphant de 78 Teraoctets contre Google Book Search : HathiTrust

Clément Solym - 14.10.2008

Edition - Bibliothèques - HathiTrust - elephant - bibliothèque


Elles sont 23 universités qui se sont entendues pour partager et combiner leur contenu numérisé - des millions de livres et de documents - dans une bibliothèque de 78 Teraoctets, nommée HathiThrust, un nom aux résonnances éléphantesques... Pour donner une indication, 78 To représentent 78.000 Go d'informations : un must-have.

Un éléphant, ça trompe ?

Avant le lancement de ce consortium, chaque établissement disposait d'un contenu isolé. Aujourd'hui « cet effort combine l'expertise et les ressources des plus fameuses bibliothèques de recherche du pays, et s'avère prometteur, car son extension ira bien au-delà des partenaires initiaux », explique John Wilkin, de l'université du Michigan.


Très semblable à Google Recherche de livres, projet qui a lui-même réussi à convaincre bon nombre d'universités ou de ville, comme celle de Lyon en France, d'accepter la numérisation de leurs fichiers, HathiTrust n'existe pas dans un autre but que le partage des informations. Alors que de son côté, Google tire des profits de l'affichage des pages numérisées...

Une mémoire éléphantesque

Et le parallèle ne manquera pas d'éléments communs, sauf pour les bibliothécaires pour qui la vision d'une conservation à long terme chez Google ne s'apparente pas assez à une conservation pour toujours. Le fait de dépendre d'une société qui pourrait être - quoiqu'improbablement - soumise à la faillite rend certains assez nerveux. D'autant que depuis la fin du projet de Microsoft Search Book, le géant se retrouvait un peu seul.

Reste à savoir comme l'éléphant contournera le problème rencontré par Google dans la gestion du droit d'auteur, et qui avait déclenché un procès emmené par plusieurs syndicats des éditeurs, que ce soit outre-Atlantique ou en France.

D'autre part, la majorité des 2 millions d'ouvrages contenus dans les bases de HathiTrust se retrouve déjà chez Google et si le moteur est déjà bien implanté auprès du grand public, l'éléphant pourrait pourtant barrir prochainement.

Au fait, pourquoi parler d'éléphant ? Parce Hathi est le mot hindou qui désigne l'animal...

On trouvera la liste des universités participant ci-dessous :

California Digital Library
Indiana University
Michigan State University
Northwestern University
The Ohio State University
Penn State University
Purdue University
University of California Berkeley
University of California Davis
University of California Irvine
University of California Los Angeles
University of California Merced
University of California Riverside University of California San Diego
University of California San Francisco
University of California Santa Barbara
University of California Santa Cruz
The University of Chicago
University of Illinois
University of Illinois at Chicago
The University of Iowa
University of Michigan
University of Minnesota
University of Wisconsin-Madison
University of Virginia