Propriété intellectuelle : une mission du CSPLA sur le data mining

Nicolas Gary - 04.07.2013

Lecture numérique - Législation - Data mining - CSPLA - exploration de données


Exclusif : Après son étude du cloud computing, le Conseil Supérieur de la Propriété Littéraire et Artistique, CSPLA, se penchera prochainement sur la question épineuse du data mining. En pleine période de crise après les révélations d'Edward Snowden sur la surveillance des réseaux à l'international par le gouvernement américain, la question des données est plus que jamais à l'ordre du jour. Et par extension, leur protection, en regard de la législation sur le droit d'auteur.

 

 

Data Mining

fdecomite, CC BY 2.0

 

 

Plusieurs points sont à remettre en perspective. D'abord, le data mining, petite explication : littéralement exploration de données, cela désigne la fouille d'une base de données, quelle qu'elle soit, et l'extraction d'éléments qui en est consécutive. Généralement, on l'emploie dans le cadre de recherches universitaires, où les chercheurs puisent dans des documents, et utilisent les éléments piochés, pour la rédaction de leurs études. Mais il ne s'agit là que d'une des possibilités. 

 

Cette question touche de près le droit d'auteur, nous précise le CSPLA, attendu « qu'il existe une exception droit de citation, dans le droit d'auteur, qui permet de se servir de quelques passages d'une oeuvre, sans avoir à demander l'autorisation de l'auteur ou de l'ayant droit ». Mais dans le cas du data mining, la question est de savoir « s'il faudrait introduire une nouvelle exception au droit d'auteur en France. C'est pour nous une mission prospective, comme celle menée sur le cloud computing ». De là, la mission de réflexion qui va être mise en place, soit au mois de juillet, soit en septembre, nous précise-t-on.

 

La question est double en réalité : d'un côté, cette pratique du data mining pourrait déborder l'exception de citation - et donc contrevenir au droit d'auteur. De l'autre, il faut savoir ce qui est fait de cette extraction de données, et comment sont-elles réutilisées. 

 

Modification du copyright en Grande-Bretagne

 

Pour mémoire, en mai 2011, Ian Hargreaves remettait au gouvernement britannique un rapport sur des reformes possibles de la Propriété Intellectuelle outre-Manche. Et parmi les questions évoquées, on retrouvait bien entendu celle du data mining. Selon les chiffres avancés, une réforme globale pourrait apporter entre 5 et 8 milliards £ à l'économie britannique d'ici 2020. Une véritable aubaine dans une période douloureuse. En août 2011, après de ongues réflexions, le gouvernement validait les propositions faites par Hargreaves. (voir une analyse par Author's Right)

 

Plus précisément, sur la question de l'exploration de données, Hargreaves soulignait que les établissements universitaires étaient souvent entravés par les restrictions qu'impose le copyright. La nécessité d'analyser des données - et donc de les prélever quelque part - avait alors conduit le gouvernement à accepter d'introduire une modification. Le projet était alors d'étendre l'exception pour la recherche non commerciale, et d'autoriser le data mining dans la mesure de ce qui était autorisé par la législation européenne.

 

Le gouvernement britannique décidait alors de mettre en place un Digital Copyright Exchange, suivant les recommandations de Hargreaves, destinée à simplifier la vie des ayants droit et des personnes désireuses d'utiliser du contenu sous droit. Une sorte de plateforme, qui faciliterait le règlement des uns à destination des autres.

 

En décembre 2012, Vince Cable, du département des Affaires, de l'Innovatio et du Savoir-Faire, dans le gouvernement de David Cameron présentait alors les nouvelles exceptions. 

 

Selon le gouvernement, les mesures proposées devraient permettre « aux éditeurs de contrôler l'accès à leurs systèmes informatiques et d'être payés pour les services qu'ils fournissent ». Par ailleurs, le gouvernement affirme être « prêt à faciliter les discussions entre les éditeurs et les chercheurs, à la fois commerciales et non commerciales, qui contribueront à établir le Royaume-Uni en tant que chef de file mondial dans les techniques d'exploration de données, de textes, et de services ».

 

Les éditeurs commerciaux et les détaillants de livres numériques pourraient toujours empêcher la reproduction d'oeuvres, mais le gouvernement mettrait en place une disposition d'appel permettant au secrétaire d'État de prendre des mesures sur les DRM, ou encore d'obliger un éditeur à fournir une version du titre qui soit libre de DRM. Un processus qui soulèverait d'ores et déjà des questions quant à sa faisabilité.

 

La décision était alors saluée par Richard Mollet, directeur de la Publishers Association, pour qui le gouvernement avait finalement entendu les demandes de respect de la propriété intellectuelle par les éditeurs. 

 

Licences for Europe, le grand projet de la CE

 

L'autre point, c'est celui des Licences for Europe. La Commission européenne entendait oeuvre en faveur du droit d'auteur. Michel Barnier, commissaire chargé du marché intérieur et des services, il s‘agit bien « d'établir un dialogue structuré entre toutes les parties prenantes ». Parmi les quatre grands points évoqués :  

3. Troisième question : celle de la situation caractérisant les contenus réutilisant d'autres contenus en ligne ["user-generated content"], ainsi que les difficultés des petites entreprises et des utilisateurs pour obtenir les licences nécessaires pour l'ensemble des droits.

Nous devons mieux cerner l'étendue des problèmes – s'ils existent car des arrangements pratiques dont déjà en place – et en tout cas faire en sorte que les solutions contractuelles ou technologiques soient trouvées pour le bénéfice de tous, lorsque le besoin existe.

4. Enfin, la dernière question concerne les réponses qu'il pourrait être nécessaire d'apporter à l'exploitation du potentiel des nouvelles activités dites de "fouille" ou d'exploration des données et des textes ("text and data mining").

 

Neelie Kroes, chargée des nouvelles technologies et présente avec Androulla Vassiliou, en charge de la Culture, avait également souligné l'importance économique que représentent les industries culturelles. Pour assurer la protection du droit d'auteur et aider à la diffusion, les solutions pourront venir d'approches contractuelles ou technologiques. Cependant, avec ces éléments « cela n'empêcherait pas que la législation puisse, le cas échéant, à plus long terme, représenter la réponse adaptée à certains problèmes », a-t-elle souligné. 

 

Licences for Europe sera donc « l'opportunité unique pour l'ensemble des acteurs du marché de se réunir, d'identifier ensemble les problèmes et de trouver les solutions concrètes de court terme ». Avec l'obligation d'assurer aux producteurs des oeuvres une juste rétribution pour leur travail créatif, les commissaires ont rappelé que sans ces oeuvres, les tuyaux, comme Google ou d'autres, n'auraient probablement pas grand-chose à se mettre sous la dent... (voir notre actualitté

 

L'angle du droit d'auteur, face au data mining

 

Pour le CSPLA, ce sont donc ces différents points qui doivent être examinés dans le cadre d'une mission prochaine. « Les corpus d'oeuvres, ou les bases de données, qui sont explorées dans le cadre du data mining, nécessitent d'être pris en compte, sous l'angle du droit d'auteur. Les extraits d'oeuvres utilisées, leur réutilisation, ce sont autant de sujets qui nous intéressent. »

 

La lettre de mission n'a pas encore été rédigée, pas plus que n'a encore été nommée la personne responsable de cette mission. Une réunion plénière doit avoir lieu le 9 juillet au matin, mais selon nos informations, la question pourrait ne pas être évoquée au cours de ce rendez-vous.

 

Il se pourrait tout à fait que, dans ce cadre, soient passés en revue des services comme celui d'Amazon, Kindle X-Ray, qui s'appuie sur les textes et apporte un enrichissement, par des contenus tiers, ou encore le Reading Life de Kobo, une fonctionnalité qui explore la manière dont le lecteur consomme son livre numérique.