Data mining : le CSPLA enquête sur la fouille de données

Clément Solym - 29.07.2013

Lecture numérique - Usages - data mining - CSPLA - lettre de mission


Le président du CSPLA, Pierre-Jean Racine, vient de confier à Me Jean Martin, la responsabilité d'une mission concernant le data mining, ou la fouille de données. Pour le Conseil supérieur de la propriété littéraire et artistique, cette utilisation d'oeuvres soumises au droit d'auteur pourrait nécessiter l'introduction « d'une nouvelle exception au droit d'auteur », ainsi que nous l'avions dévoilé début juillet. 

 

 

 Facebook Data Center Server Board

Dans le data center de Facebook, autre explorateur de données

IntelFreePress, CC BY 2.0

 

 

Une mission qui souhaite « favoriser le développement de cette activité en facilitant les relations entre les détenteurs de droits sur les contenus et les opérateurs concernés ». Rassurer donc toutes les parties en présence, tant les détenteurs de droit, soucieux de ne pas être dépossédés, que les chercheurs, désireux de ne pas être freinés dans leur activité. 

 

« Les corpus d'oeuvres, ou les bases de données, qui sont explorées dans le cadre du data mining, nécessitent d'être pris en compte, sous l'angle du droit d'auteur. Les extraits d'oeuvres utilisées, leur réutilisation, ce sont autant de sujets qui nous intéressent », nous précisait, début juillet, le CSPLA

 

La mission s'inscrira par ailleurs dans « le contexte des travaux ouverts au plan européen », précise le président. En effet, tant en Grande-Bretagne, avec le rapport Hargreaves de mai 2011, qu'avec le projet Licences for Europe, la question du data mining est amplement étudiée. La CE souhaite d'ailleurs mettre en place une plateforme qui permettra aux ayants droits et aux personnes intéressées d'être en relation commerciale pour l'achat de droits.

 

Licences for Europe sera donc « l'opportunité unique pour l'ensemble des acteurs du marché de se réunir, d'identifier ensemble les problèmes et de trouver les solutions concrètes de court terme ». Avec l'obligation d'assurer aux producteurs des oeuvres une juste rétribution pour leur travail créatif, les commissaires ont rappelé que sans ces oeuvres, les tuyaux, comme Google ou d'autres, n'auraient probablement pas grand-chose à se mettre sous la dent...

 

Pour revenir à la mission de Jean Martin, deux approches : tout d'abord, « dresser un diagnostic des pratiques et besoins des chercheurs et des opérateurs de service et de logiciels d'exploration de données ». Une première salve d'entretiens, donc, qui permettront de mieux définir le projet. La seconde étape consistera à définir « les modalités de mise en oeuvre, voire d'adaptation, des droits de la propriété intellectuelle [...] et de déterminer comment peuvent mieux être appréhendées les pratiques dans une optique de facilitation de l'exploration de données sans dévalorisation des droits ». 

 

On retrouvera, pour l'assister dans cette mission, Liliane de Carvalho, que le milieu littéraire connaît bien. Elle était aux côtés de Pierre Sirinelli dans l'élaboration de l'accord-cadre entre organisations représentatives des auteurs et des éditeurs - présenté à la ministre en mars dernier. 

 

Chose intéressante, dans sa définition préalable du data mining, Pierre-François Racine évoque une exploration de données qui dépasse « la traditionnelle identification documentaire », en ce qu'elle va analyser « les données et les textes pour en extraire du sens, de la valeur, à l'aide de diverses méthodes ». Ainsi, c'est le domaine de l'intelligence artificielle qui prend le pas, en établissant dans les textes des « relations entre les données et textes, parfois invisibles à l'analyse de l'intelligence humaine et des instruments classiques ». 

 

(via pcinpact)