Google Books : que faire du corpus d'oeuvres numérisées ?

Clément Solym - 04.04.2010

Edition - Société - google - books - subvention


Que faire à partir du corpus d'oeuvres numérisées ? Avec les millions de livres passés sous ses scanners, Google ne semble plus savoir comment utiliser la somme de données dont il dispose, ni même comment l'explorer. Attention, on ne parle pas de recherche dans le texte, en évoquant l'exploration, mais bien plutôt l'exploitation.

Ainsi, une sorte d'appel à projet a été lancé avec une prime de 50.000 $ pour une année, renouvelable sur une année supplémentaire, est offerte, pour toute personne qui saura quoi faire des 12 millions de livres numérisés - en 300 langues en tout. Google ne précise cependant pas qui peut accéder à cette bourse, on évoque en revanche l'arrivée de « nouvelles voies de recherche littéraire ».

D'ailleurs, la question se pose : est-ce que les chercheurs auront le droit d'utiliser les ouvrages pour lesquels le litige juridique est actuellement toujours en cours ? (en savoir plus)

Bon, soit, après tout, on ne sait pas grand-chose de cette bourse, mais admettons même que l'on enlève les oeuvres sous droit, le corpus reste tout de même gigantesque. Bien plus impressionnant que tout ce que l'on avait pu réunir jusqu'à présent. Et l'appel est valable jusqu'au 15 avril.

En outre, Google s'est déjà posé ses propres jalons, en identifiant huit « disciplines d'intérêt » à travers sont programme Books : littérature, linguistique, histoire, classiques, philosophie, sociologie, archéologie et anthropologie. Et pour ces différents thèmes voici les différentes options qui pourraient ressortir : fabrication de logiciels pour suivre l'évolution des langues dans le temps, développement d'outils de correction, etc.

The Chronicle
, qui dévoile toute l'envergure de ce projet - et presque le désarroi de Google face à l'immensité des connaissances engrangées - note tout de même les difficultés à rester indépendant de Google dans ce travail de recherche. Le rapport entre les recherches et les découvertes, ce sera Google, et les applications qui en découleraient suivront, évidemment. Finalement, les 50.000 $ de bourse offerts pour réfléchir à ce que l'on peut faire de ces livres, c'est assez peu quand on prend l'envergure de ce que Google pourra faire avec les conclusions de ces personnes.