Sémanticpédia et DBpédia : exporter et partager la culture

Clément Solym - 19.11.2012

Patrimoine et éducation - Patrimoine - DBpédia - Sémanticpédia - ministère de la Culture


Ils sont trois acteurs, autour de la table, réunis pour concrétiser les projets Sémanticpédia et DBpédia : le ministère de la Culture et de la Communication, l'Inria et Wikimedia France. La plateforme Sémanticpédia réunira les acteurs, en s'appuyant sur les données contenues dans l'encyclopédie Wikipedia, version francophone, « pour réaliser des programmes de recherche et développement appliqués à des corpus ou des projets collaboratifs culturels ». 

 

 

 

 

 

Les trois intervenants vont ainsi mettre la main à une version francophone de DBpédia, dont Fabien Gandon, chercheur à l'Inria, sera le responsable. Cet effort d'internationalisation de DBpédia, vise à « maintenir des données structurées extraites de différents chapitres de Wikipedia », et s'inscrit donc dans le développement de la plateforme Sémanticpédia, qui chapeautera l'ensemble. 

 

Il offrira ainsi des données culturelles extraites de l'encyclopédie, pour une diffusion plus large avec les musées, bibliothèques et autres opérateurs culturels. Le ministère s'enthousiasme dans un communiqué : 

Les possibilités de recherches (chronologiques, thématiques, géographiques, etc.) sont démultipliées, permettant au spécialiste, à l'étudiant comme au simple curieux, de trouver aisément l'information qui lui est utile.

En permettant de procéder à des requêtes à partir de contenus en langue française, le projet place également notre langue au cœur du « Web de données », enjeu culturel et technologique majeur.

 

La ministre évoque à ce titre « un partenariat avec deux acteurs majeurs du monde numérique », qui s'inscrit dans une démarche de démocratisation de l'accès à la culture pour tous. « Ce système est amené à jouer un rôle essentiel dans la navigation sur l'Internet, dans la transmission et le partage des connaissances, dans les interactions entre langues et cultures médiatisées par les outils numériques. Pour qu'il participe pleinement au bien commun, il doit être pensé comme un lieu d'échange ouvert, et il importe évidemment que notre langue et notre culture y trouvent leur place. »

 

Les données présentes dans les colonnes de Wikipédia, et profitant de l'enrichissement apporté par les internautes, seront ainsi réutilisées pour « remettre les données francophones au coeur du numérique ». L'autre pan concerne l'enrichissement dont les établissements culturels pourront profiter, tout en devenant visibles dans les pages de sites qui sont consultés par le grand public. Ils profiteront donc d'une part des contenus déjà présents, mais offriront en retour des contributions aux articles de l'encyclopédie, assure la ministre. 

 

« Je suis d'ores et déjà heureuse de vous annoncer le lancement dès 2013 d'une version «sémantique» du Wiktionnaire francophone, projet soutenu par la Délégation générale à la langue française et aux langues de France. C'est ainsi plus de deux millions de termes qui viendront s'ajouter au réseau sémantique des articles de Wikipédia », conclut la ministre. 

 

Plus d'informations sur le site INRIA. Voir aussi Sémanticpédia et DBpédia