Découvrez la bibliothèque numérique d'Actuallité avec Google books


Le monde de l'édition > Bibliothèques > Actualité

Métadonnées Google books : Des milliers, des millions d'erreurs

Mais on tente de s'améliorer chaque jour un peu plus.

Par Cecile Mazin, le vendredi 04 septembre 2009 à 14:44:19 - 0 commentaire

Zoom moins Zoom plus Signaler erreur Imprimer Envoyer à un(e) ami(e)

12

On pouvait déjà accuser les fichiers ePub proposés aux lecteurs, qui souhaitaient s'offrir une petite lecture d'oeuvre libre de droit, de ne pas vraiment être des plus efficaces. Maintenant, on va pouvoir incriminer directement les métadonnées, si l'on se fie aux informations données par le professeur Geoffrey Nunberg, à la School of Information at UC Berkeley. C'est avec une ironie désabusée qu'il note toutes les erreurs contenues dans les métadonnées.

Les archives recensées pour l'année 1899 sont par exemple complètement faussées, rendant la base de données de recherche du moteur caduque. Ainsi en fonction des recherches que l'on effectue, par exemple donné sur les livres publiés avant 1920 et contenant "candy bar", on tombe sur 66 réponses dont 46 à 70 % sont erronées.

La proportion des oeuvres contenant des erreurs dans les métadonnées augmente ainsi à mesure que l'on recule dans le temps. Chose tout à fait compréhensible, étant donné que les titres récents proviennent directement des éditeurs. Sur Language Log, Geoff multiplie ainsi les exemples de ce genre, relevant uniquement de recherches qu'il a pu effectuer.

Pour les étudiants ou les universitaires, ce genre de bévues devient non seulement problématique, mais surtout inconciliable avec des recherches sur certains thèmes, attendu que les ouvrages mentionnés ou les itérations de tel ou tel terme sont faux.

Google a cependant répondu à ce billet. « Geoff explique que nous avons des centaines de milliers d'erreurs. J'aimerais bien qu'il en soit ainsi. Nous en avons des millions. » Et bien plus encore selon leurs propres recherches. « Certaines d'entre elles sont évidemment évitables, d'autres persistent parce que nous sommes à la merci des données dont nous disposons. La qualité de nos métadonnées est bien meilleure qu'elle ne l'était voilà six mois et ce sera encore mieux dans six mois. Nous ne cesserons jamais de l'améliorer. »

Ayez confiance...

On pourra également consulter pour plus de détails l'article de Library Journal.

Sources :



Par Cecile Mazin, le vendredi 04 septembre 2009 à 14:44:19 - 0 commentaire

Mots clés :
métadonnées - Google - book - millions

Publier un commentaire

 

publier mon commentaire

Focus flux rss

Numérisation à la BnF : dégradations, retards et scandales

Reportages

"Numérisation à la BnF : dégradations, retards et scandales"

Dans le cadre d'un marché public, la société Jouve a pris la main pour la numérisation de 70.000 oeuvres chaque année durant trois ans. Mais après quelques mois à peine, la question de la réalisation du marché se pose lourdement...

Lire la suite...

Pandas et libraires, une histoire de survie pour espèces menacées

Reportages

"Pandas et libraires, une histoire de survie pour espèces menacées"

Pour une fois que l'on ne parle pas de moteur de recherche ni d'algorithme avec cette histoire de bestioles...

Lire la suite...

Réalité Bis : l'intersection entre lecture et écriture interactive

Reportages

"Réalité Bis : l'intersection entre lecture et écriture interactive"

Réalité [?ea.li.te] : (n.f) Un récit dont vous incarnez le personnage principal, confronté à une succession de choix.

Lire la suite...

iBooks Author : l'éducatif révolutionné, au prix d'un écosystème fermé

Tests

"iBooks Author : l'éducatif révolutionné, au prix d'un écosystème fermé"

De prime abord, le logiciel apparaît puissant et user-friendly. La curiosité nous pousse donc à le tester au plus vite. C'est parti !

Lire la suite...

Précédentes Suivantes

pub

Suivez-nous

Désinscription

critiques

critiques Le sillage de l'oubli, Bruce Machart

critiques Mr. Peanut, Adam Ross

critiques Sous le couvercle, le chant des sirènes : Todo, Todo, Todo...

critiques De Montparnasse à Montmartre, les artistes dans leur tanière

pub

Communiqué

Enjeux contemporains de la littérature

Jeudi 26 janvier : coup d’envoi des Enjeux contemporains de la littérature organisés par la Maison des écrivains et de la...

maestro diffusez vos communiqué sur actualitté

Profitez d'un vaste réseau de diffusion pour communiquer sur votre actualité, vos événements et vos parutions !
En savoir +

Sondage

Alors, combien de livres lus cette année ?

 

 

 

 

 

 

 

 

 

Voir les résultats

design background

© 2012 - actualitté.com