Fair Use et Data mining : ces monstres incompris

La rédaction - 26.09.2015

Tribune - Richard Malka - data mining textes - droit d'auteur protection


Le data mining ou fouille de données, ainsi que l’open access compte parmi les sujets dont traite le livret de Richard Malka, La gratuité, c’est le vol. Parti en guerre contre la Commission européenne et la loi numérique d’Axelle Lemaire, l’avocat, mandaté par le syndicat des éditeurs dénonce avec un acharnement, qui ne fait volontairement pas dans la dentelle. En réponse, Christophe Pérales signe une longue réflexion, intitulé Le SNE est Big Brother, et Richard Malka est son prophète : le Syndicat national de l’édition contre le droit de lire à l’ère numérique, contre la fouille de contenus (TDM), contre la Recherche. Un fameux programme, ici reproduit avec son autorisation. 


Oh no, Krusty the Clown steals Maggie Simpson's teddy bear to show off

Teddy Kwok, CC BY ND 2.0

 

 

À la lecture du pamphlet (texte tiré à 50 000 exemplaires et distribué gratuitement dans toutes les librairies françaises) que Monsieur Richard Malka vient de publier avec le soutien du Syndicat national de l’édition (SNE), on ne peut s’empêcher de penser : mais qu’est-il donc allé faire dans cette galère ? Le texte en question multiplie en effet les approximations, les méconnaissances (dont je préfère penser qu’elles ne sont pas feintes, ce serait pire), les omissions. Monsieur Malka le dit lui-même pourtant, p.28 : les équilibres en jeu, lorsqu’il s’agit de droit d’auteur, sont « subtils ». On ne peut donc que déplorer que son argumentaire le soit si peu, même si après tout, il s’agit d’un pamphlet : tout y est plié et même tordu pour persuader ; c’est la loi du genre.

 

Je préfère convaincre. En puisant à davantage de pluralisme dans ses sources, Monsieur Malka aurait pu produire un texte tout autre, sans rien renier de ses convictions. Mais avec de tout autres conclusions, sans aucun doute.

 

En effet, certains des prémisses de son argumentation me semblent pouvoir être largement partagées. Tout d’abord, la conviction que c’est en rémunérant la création qu’on l’encourage. C’est la thèse centrale du livre : la gratuité est nocive, pas seulement pour le porte-monnaie des ayants droit, mais aussi pour la société dans son ensemble. Je le crois aussi.

 

"Tout mode de financement alternatif constitue un miroir aux alouettes"

 

C’est ensuite que tout se gâte : p. 26, il est affirmé de manière péremptoire que « tout mode de financement alternatif [au droit d’auteur] constitue un miroir aux alouettes. ». On a pourtant créé, avant le droit d’auteur, et de manière souvent fort impertinente. Sans remonter jusqu’à la plus haute antiquité, qu’on songe à Villon, Rabelais, Montaigne. Si désormais le modèle de rémunération attaché au droit d’auteur, qui repose toujours sur un nombre d’exemplaires vendus, est mis à mal par les spécificités du numérique (notamment parce ce dernier fait voler en éclats la notion d’original, partant, celle d’exemplaire), alors trouvons un mode de rémunération de la création adapté au monde qui vient (à supposer qu’il ne soit pas déjà là), et cessons de considérer les mécanismes mis en œuvre au XIXe siècle comme indépassables. L’important, c’est bien que la création soit rémunérée.

 

Et par exemple que les auteurs d’articles scientifiques soient payés : aujourd’hui, à l’exception notable des sciences juridiques, ils ne le sont pas.

 

Autre point de convergence forte avec Monsieur Malka : les grands plateformeurs du Net asphyxient aujourd’hui la création, en réalisant une captation abusive de la valeur produite par d’autres. Sur ce sujet, il convient de renvoyer aux excellentes analyses du Conseil national du numérique.

 

Mais il ne faudrait pas que sur cette question, Google et consorts accaparent toute l’attention. Sur le Web visible, ces acteurs jouissent indûment d’un statut d’hébergeur. Sur le Web invisible, d’autres profitent d’un statut aujourd’hui inadapté d’éditeur, et émargent au SNE. Le ver est dans le fruit, et l’on aimerait un peu de cohérence de la part du Syndicat national de l’édition sur ce sujet. 

 

Qu’il maîtrise mal, manifestement. Tout comme Monsieur Malka. Le sujet vaut la peine d’être creusé, et de quitter un peu le domaine du droit pour celui de l’économie. Follow the money.

 

Fair Use : de la France à l'Europe

 

Enfin, nous sommes bien d’accord : le fair use n’est pas soluble dans notre tradition juridique, profondément analytique. On entend par là que le périmètre des droits de l’auteur y est précisément défini (droit de représentation, droit de reproduction, etc. Et c’est être tout à fait fidèle à cette tradition que de soutenir une définition juridique positive, analytique, du domaine public, là où aujourd’hui le Code de la propriété intellectuelle n’en donne qu’une définition négative, en creux). Symétriquement, les exceptions au même droit d’auteur ne le sont pas moins.

 

Il en va tout autrement en droit communautaire : si les exceptions y sont précisément listées, le champ des droits de l’auteur est en revanche d’un flou consommé, puisque relève de l’exercice du droit d’auteur toute mise à disposition d’une œuvre au public.

 

Sans titre

"On ne fouille pas !" sprklg, CC BY 2.0

 

 

 C’est ainsi que lors des débats sur la DADVSI, il a pu être proposé que les récitations de textes effectués en classe par des élèves donnent lieu à versements sonnants et trébuchants au bénéfice des ayants droit. C’est ainsi que depuis 2003 tout prêt en bibliothèque donne lieu au paiement par la puissance publique de redevances forfaitaires. Le prêt en bibliothèque met-il en jeu le droit de reproduction ? Non. Le droit de représentation ? Non plus.

Mais il s’agit bien, selon les termes du droit communautaire, d’une mise à disposition du public. 

 

Je n’ai pas alors beaucoup entendu le SNE s’offusquer de cette torsion faite à notre tradition juridique. Le SNE a bien plutôt argué que cette redevance était de longue date pratiquée dans d’autres pays européens, à commencer par la Grande-Bretagne. Mais en omettant toutefois de préciser qu’en l’occurrence, de l’autre côté de la Manche, les bibliothèques scolaires et universitaires en étaient exemptées. 

 

Dans une vision équilibrée des choses, qui n’est pas celle du SNE, l’on prend en compte le fait que sans l’école, sans les bibliothèques, sans tout l’investissement public pour l’éducation, il n’y aurait pas de lecteurs. Et partant, pas d’auteurs non plus. Cela suffit probablement à situer ce que je pense de la charge de Monsieur Malka contre l’exception pédagogique (qui soit dit en passant, existe déjà en droit français, quoique de manière bancale).

 

La vision apocalyptique orwellienne, tendance 2015

 

Mais la plus grande tartufferie réside probablement dans la fin du pamphlet pour lequel le SNE a mandaté Monsieur Malka.  La vision orwellienne d’une société dominée par les grands acteurs de l’Internet est un risque à prendre très au sérieux, Monsieur Malka a raison de le souligner. Mais je ne crois malheureusement pas que le monde idéal qu’imagine le Syndicat national de l’édition soit plus enviable. 

 

Ce dernier est par exemple vent debout contre une exception qui viendrait autoriser la fouille de contenus (text and data mining), une opposition dont le pamphlet de Monsieur Malka se fait l’écho, de manière particulièrement mal informée et tendancieuse. Car la fouille de contenus concerne à peine le droit d’auteur : pour fouiller, il faut disposer d’une copie des bases à explorer, c’est vrai. Mais cette copie n’est que technique, elle ne vise absolument pas à opérer une publication indue de contenus sous droits. Et il existe des moyens simples d’éviter toute dissémination accidentelle : le recours à des tiers de confiance par exemple, seuls habilités à procéder à la duplication des bases, et à y donner accès de façon contrôlée.

 

Surtout, le texte de Monsieur Malka passe sous silence qu’il ne s’est jamais agi d’accéder gratuitement à des contenus protégés. Les bibliothèques universitaires paient annuellement des sommes astronomiques, en constante progression (+ 7% par an en moyenne !) pour s’abonner auprès d’éditeurs spécialisés à des bases de contenus produits gratuitement par des chercheurs. Gratuitement, oui ! Alors bien d’accord pour dire que la gratuité c’est le vol : que Tartuffe paie donc les chercheurs pour leurs publications (et à hauteur du nombre de fois où elles sont téléchargées).

 

Et dès lors on ne pas pourquoi ces mêmes chercheurs n’auraient pas le droit d’utiliser des méthodes algorithmiques pour procéder à une lecture, assistée par ordinateur, de ces bases devenues, du fait de l’inflation des publications scientifiques, impossibles à fouiller manuellement, alors qu’ils ont largement contribué (gratuitement) à les produire, et que les bibliothèques y sont dûment abonnées ?

 

La manière dont Monsieur Malka décrit ce qu’est la fouille de contenus montre assez clairement qu’il ignore totalement ce dont il parle : pour lui, taper quelques mots dans un moteur de recherche, c’est de la fouille. Indubitablement, le principe est le même : les moteurs en question, que ce soit celui de Google ou d’une base de données commerciale, utilisent des algorithmes. Mais consacrer une exception au titre du text and data mining permettrait aux scientifiques de définir, au plus près de leur travail de recherche, les algorithmes dont ils ont besoin, et qui n’ont rien de générique. Et ce, afin de se livrer à des analyses bien plus poussées que ce que permettent les moteurs de recherche : par exemple chercher dans la littérature scientifique toutes les occurrences d’un gène, mais aussi extraire automatiquement des éléments relatifs à l’environnement scientifique dans lequel ce gène est cité (quelle pathologie ? quelle population étudiée ? etc.).

 

Même sans être généticien, le gain de temps et d’efficacité permis par une telle pratique est évident. Et la méthodologie à l’œuvre apparaît clairement pour ce qu’elle est : l’informatisation de pratiques de lecture érudites qui existent depuis des siècles, et un enjeu essentiel de la compétitivité de la recherche scientifique d’aujourd’hui. La Grande-Bretagne, les États-Unis, le Japon autorisent déjà letext and data mining. Le dernier Pulitzer s’en vend-il plus mal ?


Lutter contre l’exception au titre de la fouille de contenus, c’est donc dénier à des lecteurs la liberté de lire comme il l’entendent des contenus pour lesquels ils se sont acquitté tout à fait légalement d’un droit d’accès, particulièrement onéreux dans le cas des articles scientifiques. On voit donc mal ce que cela vient faire dans un pamphlet contre la gratuité. Christophe Pérales

 

Sauf qu’ainsi la contre-offensive orchestrée par le SNE contre le risque d’une société orwellienne apparaît pour ce qu’elle est : la volonté non moins orwellienne de contrôler totalement la circulation de l’écrit, et de revenir sur les équilibres à l’oeuvre dans le domaine de l’imprimé. Vous voulez lire comme vous l’entendez, avec les lunettes que vous avez choisies, fussent-elles informatiques, un contenu auquel vous avez légalement accès ? Le SNE n’est pas d’accord, ou espère trouver un moyen que vous payiez pour cela.

 

Vous achetez un livre pour le prêter en bibliothèque ? Le SNE a obtenu le paiement d’une compensation. Pourtant toutes les études montrent que ceux qui empruntent le plus en bibliothèque sont aussi ceux qui achètent le plus en librairie. Peu importe : il n’y a rien à compenser, mais compensation est due.

 

Vous avez acquis un livre et vous voulez en faire don à quelqu’un d’autre ? La Direction générale de la concurrence, de la consommation et de la répression des fraudes s’en émeut. Et demain ? L’instauration d’un droit de suite pour les livres, à l’image de ce qui se pratique sur le marché de l’art ? La fin de la règle de l’épuisement des droits dans le domaine de l’imprimé ? Le sentiment qui se dégage de toutes ces manœuvres est bien que l’on tente aujourd’hui de se servir du numérique pour simplement mettre à bas jusqu’à l’écosystème qui régit actuellement le circuit du livre imprimé. 

 

Pauvres lecteurs ! N’aurons-nous le choix demain en France qu’entre deux Big Brothers, Google et consorts, ou le SNE et ses amis ? Décidément, Monsieur Malka, je me demande bien ce que vous êtes allé faire dans cette galère…

 

Christophe Pérales