France : une mission pour faciliter le recours à la fouille et l’exploration de textes et de données

Antoine Oury - 21.01.2016

Edition - Les maisons - text and data mining éditeurs - exploration textes données - France édition scientifique


La technologie modifie en profondeur la façon dont on s'approche et s'approprie les textes : dans le domaine de la recherche, le text and data mining, ou la fouille et l’exploration de textes et de données en bon français, est une nouvelle méthode pour étudier les textes, en prenant en compte un corpus beaucoup plus important, de manière informatisée. Le ministère de la Culture et de la Communication vient de confier une mission pour faciliter le recours à cette méthode de recherche.

 

Ministère de la Culture et de la Communication

(ActuaLitté, CC BY SA 2.0)

 

 

Comme d'autres dispositions de la loi République numérique portée par la Secrétaire d'État chargée du Numérique Axelle Lemaire, la réduction de l'embargo imposé par les éditeurs scientifiques sur la fouille de textes et de données a fait polémique au sein de l'édition. 

 

Christine de Mazières, alors déléguée générale du Syndicat national de l'édition, nous expliquait ainsi que « les offres et licences existent déjà et qu’elles sont peu utilisées » par les chercheurs, et que cette méthode de recherche, selon l'édition, ne nécessitait ni réduction d'embargo, ni exception au niveau européen. A contrario, Vincent Bonnet, directeur d'Eblida, Bureau européen des associations de bibliothèques, d'information et de documentation, assurait qu'une « absence d'harmonisation pour cette exception pourrait entraîner une fuite des cerveaux vers un pays, et renforcer la position d'un pays au détriment d'un autre ».

 

Probablement soucieuse de se réapproprier la question, Fleur Pellerin, ministre de la Culture et de la Communication, et Thierry Mandon, secrétaire d’État chargé de l’Enseignement supérieur et de la Recherche, annoncent la mise en place d'une mission « pour faciliter le recours à la fouille et l’exploration de textes et de données », confiée à Charles Huot, le président du Groupement français des industriels de l’information. 

 

Les technologies de fouille et d’exploration de textes et de données, qui sont en plein développement,  favorisent, par leur application aux immenses gisements de données et de contenus numériques, l’éclosion de projets de recherche innovants. La communauté scientifique, qui nourrit de fortes attentes sur ce sujet, considère que les outils aujourd’hui mis à disposition des chercheurs restent encore limités et qu’ils devraient être élargis afin de permettre, notamment, de croiser, sans barrières financières ou techniques, les informations détenues par différents acteurs. Cette demande a été exprimée en particulier à l’occasion de la consultation en ligne conduite sur le projet de loi pour une République numérique.

Dans ce contexte, la mission confiée à Charles Huot a pour objet de rechercher, d’ici le mois de mars 2016, un accord entre les acteurs intéressés, en particulier la communauté de la recherche publique et les éditeurs scientifiques. Cet accord doit permettre aux chercheurs français de pouvoir rivaliser avec leurs homologues étrangers tout en apportant les garanties appropriées contre les risques de contrefaçon et de perte de valeur pour l’ensemble des acteurs.

 

Le CSPLA, Conseil Supérieur de la Propriété Littéraire et Artistique, avait déjà confié une mission relative au data mining à Me Jean Martin, dès 2013, avec pour objectif, déjà, de « favoriser le développement de cette activité en facilitant les relations entre les détenteurs de droits sur les contenus et les opérateurs concernés ».

 

Le rapport produit par Jean Martin avait été largement critiqué par le Syndicat national de l'édition et les éditeurs scientifiques, parce qu'il laissait entendre « que le TDM [Text and Data Mining, fouille de textes et de données] pourrait déjà être couvert par une exception actuelle, telle que les exceptions pour actes de reproduction transitoire, pour citation ou encore pour la recherche ». Ce qui sous-entendait que le Text and Data Mining ne nécessitait pas l'acquisition d'une autorisation ou d'une licence spécifique, dès lors que le corpus avait été acheté par les chercheurs ou le centre de recherche. 

 

Un droit que revendiquent déjà les universités, et notamment la Ligue européenne des universités de recherche (LEUR, League of European Research Universities, LERU) avec le slogan « The Right to Read is the Right to Mine » (« Le droit de lire est le droit de fouiller »). L'eurodéputée Julia Reda, dans son rapport sur la réforme du droit d'auteur, conseillait la mise en place d'une exception européenne pour le text and data mining, que la Commission européenne doit examiner dans le cadre de sa réforme.

 

« Charles Huot est président du Groupement français de l’industrie de l’information (GFII), association qui regroupe l’ensemble des acteurs de la chaîne de l’information spécialisée, des secteurs public et privé. Directeur général délégué en charge du développement stratégique et de l'innovation de la société TEMIS, il est également président de la commission connaissance et membre du bureau exécutif de Cap Digital. Docteur en intelligence économique, il est considéré comme l’un des meilleurs connaisseurs et praticiens du domaine », précise le ministère pour justifier son choix.