Le monde de l'édition > Bibliothèques > Actualité
Métadonnées Google books : Des milliers, des millions d'erreurs
Mais on tente de s'améliorer chaque jour un peu plus.
Par Cecile Mazin, le vendredi 04 septembre 2009 à 14:44:19 - 0 commentaire
12
Les archives recensées pour l'année 1899 sont par exemple complètement faussées, rendant la base de données de recherche du moteur caduque. Ainsi en fonction des recherches que l'on effectue, par exemple donné sur les livres publiés avant 1920 et contenant "candy bar", on tombe sur 66 réponses dont 46 à 70 % sont erronées.
La proportion des oeuvres contenant des erreurs dans les métadonnées augmente ainsi à mesure que l'on recule dans le temps. Chose tout à fait compréhensible, étant donné que les titres récents proviennent directement des éditeurs. Sur Language Log, Geoff multiplie ainsi les exemples de ce genre, relevant uniquement de recherches qu'il a pu effectuer.
Pour les étudiants ou les universitaires, ce genre de bévues devient non seulement problématique, mais surtout inconciliable avec des recherches sur certains thèmes, attendu que les ouvrages mentionnés ou les itérations de tel ou tel terme sont faux.
Google a cependant répondu à ce billet. « Geoff explique que nous avons des centaines de milliers d'erreurs. J'aimerais bien qu'il en soit ainsi. Nous en avons des millions. » Et bien plus encore selon leurs propres recherches. « Certaines d'entre elles sont évidemment évitables, d'autres persistent parce que nous sommes à la merci des données dont nous disposons. La qualité de nos métadonnées est bien meilleure qu'elle ne l'était voilà six mois et ce sera encore mieux dans six mois. Nous ne cesserons jamais de l'améliorer. »
Ayez confiance...
On pourra également consulter pour plus de détails l'article de Library Journal.
Par Cecile Mazin, le vendredi 04 septembre 2009 à 14:44:19 - 0 commentaire
Mots clés :
métadonnées -
Google -
book -
millions
Reportages
"Numérisation à la BnF : dégradations, retards et scandales"
Dans le cadre d'un marché public, la société Jouve a pris la main pour la numérisation de 70.000 oeuvres chaque année durant trois ans. Mais après quelques mois à peine, la question de la réalisation du marché se pose lourdement...
Reportages
"Pandas et libraires, une histoire de survie pour espèces menacées"
Pour une fois que l'on ne parle pas de moteur de recherche ni d'algorithme avec cette histoire de bestioles...
Reportages
"Réalité Bis : l'intersection entre lecture et écriture interactive"
Réalité [?ea.li.te] : (n.f) Un récit dont vous incarnez le personnage principal, confronté à une succession de choix.
Tests
"iBooks Author : l'éducatif révolutionné, au prix d'un écosystème fermé"
De prime abord, le logiciel apparaît puissant et user-friendly. La curiosité nous pousse donc à le tester au plus vite. C'est parti !
Précédentes Suivantes
Suivez-nous
Communiqué
Enjeux contemporains de la littérature
Jeudi 26 janvier : coup d’envoi des Enjeux contemporains de la littérature organisés par la Maison des écrivains et de la...
Profitez d'un vaste réseau de diffusion pour communiquer sur votre actualité, vos événements et vos parutions !
En savoir +






















Publier un commentaire