L'Union européenne “en retard” pour l'exploration de textes et de données

Antoine Oury - 23.02.2015

Edition - Bibliothèques - Liber bibliothèques recherche - Commission européenne - réforme du copyright


Outre l'Open Access, que l'on évoque régulièrement, les nouvelles technologies de l'information et de la communication ont eu un autre impact sur la mission et le travail des bibliothèques de recherche. Le Text and Data Mining (TDM), exploration de textes et de données, permet d'extraire de manière automatique ou semi-automatique des connaissances, à partir de masses de données inégalées jusqu'à présent.

 


Derelict amber mining equipment, Покровское,Янтарный.Yantarny

L'exploration européenne à l'arrêt (Sludge G, CC BY-SA 2.0)

 

 

Pour les bibliothèques, mais surtout les chercheurs, cette méthode inédite permet de traiter un immense corpus de textes, d'en tirer des données, et de les structurer sous forme de résultats exploitables. Littérature, science, économie, médecine... Les secteurs intéressés par ce nouveau mode de recherche sont nombreux. Et quelque peu dépourvu devant l'actuelle législation européenne du droit d'auteur, qui n'autorise ce type d'exploitation des textes que sur la base de contrat individuel passé avec les éditeurs.

 

Le 19 février dernier, l'ancien président de la Ligue des Bibliothèques Européennes de Recherche, Paul Ayris, est intervenu à Bruxelles auprès du commissaire européen Günther Oettinger pour défendre la nécessité d'une réforme du droit d'auteur, sur ce point précis du Text and Data Mining.

 

« Pourquoi évoquer le TDM dans le cadre d'une réforme du droit d'auteur ? Parce que pour utiliser des méthodes automatisées de TDM, il faut réaliser une copie du matériel original. C'est la raison pour laquelle le TDM entre dans le cadre de la réforme européenne du droit d'auteur : l'acte de copie est aujourd'hui sanctionné par les lois sur le droit d'auteur », explique Paul Ayris.

 

Seul le Royaume-Uni a doté son corpus de lois sur le droit d'auteur d'une exception pour l'exploration de textes et de données : cela signifie que les chercheurs britanniques peuvent réaliser une copie des textes achetés par les bibliothèques du pays, à des fins de TDM. Les textes ont donc été payés, les éditeurs et les auteurs rémunérés, mais l'usage qu'il est possible d'en faire est plus large.

 

« C'est un avantage, mais c'est aussi une malédiction », explique cependant Paul Ayris. « Puisque les autres pays européens n'ont pas d'exception pour le Text and Data Mining dans leur législation nationale, il est extrêmement difficile pour les chercheurs et professeurs du Royaume-Uni de travailler au-delà des frontières », détaille-t-il. Autrement dit, le droit d'auteur européen limite la recherche au niveau national, au lieu de lui donner une dimension européenne.

 

Le sujet est délicat, car le Text and Data Mining est un usage des matériaux soumis aux contrats individuels des éditeurs, et donc à une rémunération particulière. Si l'ancien président de la Ligue reconnaît que « les éditeurs et les auteurs doivent continuer à être rémunérés », il estime que les bibliothèques ne doivent « pas payer deux fois ». « Le droit de lire doit être le droit d'explorer (to mine) », résume-t-il.

 

Les États-Unis disposent déjà d'une exception pour le Text and Data Mining, et Ayris signale que l'absence d'une exception obligatoire pour ce mode de recherche conduira au retard de l'Union européenne dans ce domaine. « Il est inconcevable que la Commission européenne mette les pays européens dans une situation de désavantage économique », termine-t-il.