Lecture numérique > Usages > Actualité

Les métadonnées, baliser le Web pour mieux le parcourir

Les fameuses "metadatas" contiennent l'avenir du commerce et des publications sur le Web

Le mardi 24 juin 2014 à 15:23:15 - 0 commentaire

Zoom moins Zoom plus Signaler erreur Imprimer Envoyer à un(e) ami(e)

12

Depuis quelques années, et en attendant le perfectionnement du Web sémantique, les métadonnées sont devenues un sujet de préoccupation pour les éditeurs et créateurs de contenu. Elles permettent de classifier les différents documents, ce qui s'avère particulièrement utile pour la commercialisation, entre autres...

 

 Avec Lettres Numériques

 

Elles intéressent bibliothécaires comme entrepreneurs, et pour cause : elles peuvent permettre de mettre en avant de l'information sur la toile !

 

Les métadonnées sont des données au sujet des données. Ces marqueurs peuvent être introduits dans le langage XML. Ce sont en fait toutes les informations que l'on ajoute sur et, à l'âge numérique, dans le document, qu'il soit fait de texte, de son ou d'images. Lorsque les informations sont déplacées (téléchargées par exemple), les métadonnées continuent à en faire partie. Par leur nature même, elles apportent des informations quant au contenu des textes. Les fiches cartonnées qui serv(ai)ent au classement dans les bibliothèques papiers permett(ai)ent aux bibliothécaires comme aux usagers de localiser, de gérer et de traiter les données dont ils avaient besoin.

 

De la même façon, le balisage par les métadonnées permet d'établir de l'ordre et un classement dans les résultats des recherches internet. En les prenant en compte, les moteurs de recherche sont capables de répondre plus précisément aux requêtes des utilisateurs. Les algorithmes des moteurs de recherche des sites internet recourent donc à ces métadonnées, de même que les annuaires de site, de moins en moins utilisés.

 

 

Metadata

(gabitogol, CC BY 2.0)

 

 

Ce sont donc ces balises de métadonnées, et les mots-clés qui y sont repris, qu'on a dit si stratégiques pour tous ceux qui veulent arriver en tête des recherches internet. Leur utilité est maintenant discutée : Google, et un de ses ingénieurs, Matt Cuts, expliquent sur ce blog que Google ne lit pas les mots-clés intégrés dans le code source via la balise Meta Keywords. Celle-ci peut cependant servir à la recherche dans le cadre du classement interne du site.

 

Des générateurs de mots-clés, du type Google Adwords ou Microsoft Adcenter ou encore Ubersuggest, aident à trouver les mots-clés les plus susceptibles de coller aux recherches lancées par les internautes. Notons au passage qu'Ubersuggest a la particularité de travailler avec Google Autocomplete, donc avec les mots suggérés par Google aux internautes lorsque ceux-ci entrent une requête.  Ces mots peuvent apparaître sur la page de résultats via le titre SEO, ou metatitle – celui qui apparaîtra dans l'onglet et dans les résultats de recherche Google – comme dans l'URL et dans le contenu du site. En fait, ces mots, s'ils sont sélectionnés adroitement, guideront l'internaute vers le site en question.

 

Afin de pouvoir générer une connaissance commune à partir de l'ensemble des données présentes sur le Web – selon l'idéal du web sémantique -, les métadonnées doivent suivre certains standards. Le Dublin Core, par le Dublin Core Metadata Initiative, est un schéma organisant les métadonnées et permettant ainsi leur standardisation. La Bibliothèque nationale de France (BnF) l'a adopté pour sa bibliothèque numérique, dans le cadre du projet data.bnf.fr. Elle souhaite ainsi s'inscrire « dans une démarche d'ouverture des données sur le Web, y compris hors de la communauté des bibliothèques ».

 

La Digital Library Foundation, avec le soutien de la Bibliothèque du Congrès aux États-Unis, a également mis au point un format, le METS, codé sous format XML. Celui-ci vise à  « exprimer des métadonnées de nature diverse portant sur un document numérique, dans le but de faciliter son échange, sa gestion et sa préservation », selon la formulation de la BnF qui a adopté ce système pour le projet SPAR, un entrepôt de préservation d'archives numériques. Le METS a une grande qualité : sa flexibilité. Le format est composé de sept sections, qui dissèquent les différents aspects du document. Une seule de ces sections doit obligatoirement être remplie, ce qui laisse une marge de manœuvre à l'heure de s'exprimer sur le contenu d'un document. Le revers de la médaille, c'est que les utilisateurs doivent poser plus de choix et les résultats finaux sont donc susceptibles d'être plus divers.

 

Le Graal – un standard pour tous les documents – n'est pas encore là. Le souhaite-t-on même vraiment, vu la variété de contenus auxquels les métadonnées s'appliquent ? Peut-être suffit-il simplement de savoir que les métadonnées nous conduisent aux contenus les plus pertinents… à condition de les utiliser à bon escient !

 

Ailleurs sur la toile :

 

Le site du consortium World Wide Web, qui promeut la compatibilité des technologies telles qu'HTML et XML ainsi que l'interopérabilité.

 

La BnF qui explique son projet lié au Web sémantique.

Pour approfondir

photo Lettres numériques

   

Toute l'actualité du livre numérique en Belgique francophone et ailleurs.

 

Mots clés :
métadonnées - fichier numérique - Internet - classification



Publier un commentaire

 

publier mon commentaire

Suivez-nous

Désinscription

Les blogs de la rédaction

Les écrivains et leurs lecteurs

  Je viens de lire deux ouvrages très différents qui mettent cependant en scène tous les deux des écrivains et des [...]

Surfing, Jim Heimann

Présentation de l'éditeur : Apportez une touche d'adrénaline à votre quotidien. Avec le calendrier perpétuel [...]

La traversée du chien, Pierre Puchot

Quatrième de couverture : « Elle se tient là, à trente kilomètres de Paris, cette immense ville-cité de la Grande Borne, [...]

pub

Sondage

Un abonnement pour les livres numériques, en illimité, ça vous inspire quoi ?

 

 

 

 

 

 

 

Voir les résultats

 

© 2007 - 2014 - actualitté.com