Lecture numérique > Acteurs numériques > Actualité
Numérisation manuelle pour Google Book Search
Le programme Book Search de Google va peut-être vite, mais on oublie les fourmis qui travaille pour le Grand Oeuvre
Par Cecile Mazin, le vendredi 25 avril 2008 à 08:01:45 - 0 commentaire
12
Sisyphe est-il un bibliothécaire ?
« C'est monotone, commente, laconique, Mitchel. Mais j'apprends pourtant quelque chose de précieux : comment interagir avec des matériaux vraiment anciens et travailler avec l'imagerie numérique, ce qui se révèle très utile pour l'histoire de l'art. »
La conception de l'ouvrage en question rend particulièrement difficile le scan des parties centrales du livre et la méthode employée, qui photographie chaque double page ne facilite pas la tâche. Pourtant, cet exemplaire pourrait compter parmi les plus anciens.
De son côté, Google affirme que son processus de numérisation ne détériore pas les livres, et s'avère bien plus rapide que la technique employée par Mitchel. « Il nous a fallu du temps pour le développer, c'est pour cela que nous gardons précieusement notre secret », déclare un responsable de Book Search, Ben Bunnell, qui refuse même de dire où s'effectue la numérisation.
Partenaire particulier
Pour de nombreuses autres bibliothèques, cette campagne de sauvegarde des livres a commencé voilà une dizaine d'années. Google alloue à 28 d'entre elles un financement, qui permet au moteur de récupérer en contrepartie un exemplaire du livre. Ainsi, dans le cas du Michigan, cet accord a permis la numérisation d'un million d'ouvrages depuis 2004 quand il en demeure encore presque six millions à passer à la machine.
Les accords ne manquent pas entre le géant et les éditeurs ou les bibliothèques : on recense Cambridge university press ou encore Wisdom Publications. Pourtant, des procédures judiciaires ont été entamées, affirmant que Google viole le droit d'auteur. Mais le moteur clame que l'utilisateur ne peut déposer que des livres qui ne sont plus sous le coup du copyright, et que les livres soumis au droit d'auteur ne sont que partiellement consultables.
Danger de la centralisation ou centralisation des dangers ?
Pour Brewster Kahle, fondateur de l'Internet Archive pour l'Open Content Alliance, Google tente ni plus ni moins que de « verrouiller le domaine public », en réalisant des copies d'oeuvres pour lesquelles le droit d'auteur ne s'applique plus. Sa plus grande angoisse est de savoir si le moteur partagera éternellement les livres numérises. « Nous pensons que l'on devrait multiplier les bibliothèques, les éditeurs et les moteurs de recherche ainsi que les utilisateurs, pour disposer de plusieurs points de vue », considère Kahle.
Une conception théorique louable, mais que John Price Wilkin, bibliothécaire à l'université du Michigan, estime toute théorique. « Nos ouvrages sont entièrement consultables en ce que les gens peuvent les trouver, les lire, les utiliser et faire tout ce qu'ils souhaitent pour leur scolarité ou pour le plaisir. » Reste que Google disposerait effectivement au terme de ces partenariats de fonds issus de toutes les grandes bibliothèques...
Esclave de la machine, par une chaleur d'enfer
Il fait très chaud dans la pièce où travaille Mitchel. On y travaille dans un silence seulement interrompu par les bruits des ordinateurs et des scanners, les clics de souris, pour visualiser l'image, et la corriger à l'aide du logiciel Omniscan, créé par une société allemande, Zeutschel GmbH.
D'un clic, il envoie le livre numérisé à Google, qui se chargera de réaliser la reconnaissance des caractères, qui rend possible la recherche dans le livre et la navigation plus fluide. Alors, le moteur fait parvenir une copie de sa réalisation à la bibliothèque puis en place une dans son stock de livres en ligne.
Pour Chava Israel, collègue de Mitchel, qui réalise des numérisations depuis trois ans, il existe une philosophie derrière ce travail de fourmi. « Ce que je préfère, c'est d'être face à un livre ancien, et d'être alors en mesure de préserver les connaissances, pour ainsi aider les autres et leur permettre d'accéder à davantage de contenu. Je tourne alors les pages. C'est une sorte de méditation. »
Par Cecile Mazin, le vendredi 25 avril 2008 à 08:01:45 - 0 commentaire
Mots clés :
Google -
numérisation -
bibliothèque -
scanner
Reportages
"Forces et faiblesses de la librairie indépendante en Languedoc Roussillon"
L'association Languedoc Roussillon livre et lecture (LR2L) a dévoilé lundi 6 février un rapport présentant un état des lieux de la librairie dans la région, issu de rencontres avec 70 % de ces entreprises.
Tribunes
"La campagne Sempé contre la hausse de la TVA se poursuit"
Rappel de la campagne Sempé contre le relèvement de la tva, elle se poursuit et prend une dimension à la mesure des impacts négatifs qui paraissent semaine après semaine.
Reportages
"Numérisation à la BnF : dégradations, retards et scandales"
Dans le cadre d'un marché public, la société Jouve a pris la main pour la numérisation de 70.000 oeuvres chaque année durant trois ans. Mais après quelques mois à peine, la question de la réalisation du marché se pose lourdement...
Reportages
"Pandas et libraires, une histoire de survie pour espèces menacées"
Pour une fois que l'on ne parle pas de moteur de recherche ni d'algorithme avec cette histoire de bestioles...
Précédentes Suivantes
Suivez-nous
Communiqué
Enjeux contemporains de la littérature
Jeudi 26 janvier : coup d’envoi des Enjeux contemporains de la littérature organisés par la Maison des écrivains et de la...
Profitez d'un vaste réseau de diffusion pour communiquer sur votre actualité, vos événements et vos parutions !
En savoir +






















Publier un commentaire