medias

Métadonnées de l'édition : 'Si vous ne le faites pas, Google s'en chargera'

Antoine Oury - 11.10.2013

Edition - Société - métadonnées - édition - John Wiley


Depuis la fin des années 1980, l'archivage des documents, leur classification et dénomination ont acquis au moins autant d'importance que leur production. La « discoverability », autrement dit les potentialités de découverte d'un document, doit être prise en compte par les éditeurs, au travers d'une mise en place sérieuse et suivie des métadonnées.

De notre envoyé spécial à Francfort

 

 

 

 

« Nous sommes habitués à rechercher des éléments à l'aide des métadonnées », commence David Worlock, de la société de conseil et de recherche Outsell, spécialisée dans les médias et l'information. De fait, la plupart des navigations sur Internet, ou des recherches documentaires, commencent par l'entrée d'un mot-clé. 

 

Mais la recherche par mots-clés n'est plus le seul enjeu des métadonnées : « La recherche n'est plus seule », note Jason Markos, de John Wiley & Sons, « et elle doublée par les suggestions sur YouTube, les liens dans les articles, les autres travaux d'un auteur ou les ressources d'une institution ». Le terme « discoverability » semble alors bien approprié pour le traitement des documents : on parlera de détectabilité, ou de visibilité des contenus créés.

 

Finalement, les métadonnées d'un document peuvent être classifiées tant elles sont diverses, ce que s'empresse de faire Timo Hannay, du service Digital Science de Macmillan. 

Métadonnées bibliographiques : celles des catalogues

Métadonnées bibliométriques : des citations, liens Internet

Métadonnées des usages : le nombre d' achats/de prêts, de téléchargements

Métadonnées critiques : les posts de blogs, les tweets, les commentaires

Métadonnées d'indexation : le sommaire, index, recherche au coeur

« Pour l'éditeur », poursuit-il, « tous ces éléments arrivent en deuxième ou troisième position, après la production du contenu. Mais il ne faut pas oublier que ce sont ces éléments, en premier, qui conduiront le lecteur au texte. » Pour le bien du Web sémantique, confie Sven Fund de chez Walter de Gruyer, éditeur scientifique, les standards en la matière devront suivre ceux du World Web Consortium.

 

Pour tous autour de la table, il ne fait aucun doute qu'une équipe solide devrait prendre en charge, dans toute maison d'édition, la gestion des métadonnées : « Si vous ne le faites pas, Google s'en chargera », plaisante à moitié Jason Markos, qui déplore que le passage des fichiers PDF au format XML n'ait pas encore été fait dans la plupart des maisons d'édition. 

 

« Un éditeur doit s'y connaître en technologie, particulièrement en technologies de l'information. Les éditeurs scientifiques, techniques et médicaux se sont longtemps demandé s'ils devaient laisser les robots du Web exploiter leurs données, je crois que l'éditeur doit prendre des risques. Il faut être ouvert quand à l'exploitation des données, cela aidera avant tout la détectabilité des produits », conclut 

Timo Hannay.