Idée folle : sauver les données du plus grand site pirate de recherches scientifiques

Antoine Oury - 04.12.2019

Patrimoine et éducation - A l'international - archives LibGen - LibGen piratage - edition scientifique


Le site LibGen, en quelques années, est devenu une référence pour les chercheurs de tous les pays et nationalités : la plateforme ne propose rien de moins qu'un accès gratuit et facilité à des millions d'articles véhiculant les résultats de recherches. Le plus souvent, de manière illégale. Des archivistes se sont lancés dans une aventure peu banale, la sauvegarde de 33 téraoctets de documents, ce qui n'est pas rien.

Attention, pirates
(ActuaLitté, CC BY SA 2.0)


1 téraoctet représente environ 1024 gigaoctets, soit un nombre significatif de fichiers et autant de documents, revues, articles scientifiques et même bandes dessinées, présentant tous des résultats issus de la recherche. Ce trésor est celui du site LibGen, dont de nombreux éditeurs scientifiques reprochent la provenance. En effet, la plupart de ces contenus sont proposés en accès gratuit par la plateforme, sans considération pour les droits d'auteur.

Ces dernières années, LibGen et autres Sci-Hub ont gagné des utilisateurs dans les rangs des membres de la communauté des chercheurs : par commodité, par engagement contre le système derrière l'édition scientifique ou par manque de moyens, nombre d'entre eux se sont tournés vers des solutions d'accès illégales.

Si bien que l'existence de ces plateformes est contestée par les éditeurs historiques du secteur, qui ont multiplié les actions en justice et autres menaces de procès. De temps en temps, la décision d'un juge ferme les accès à telle ou telle plateforme, mais les données finissent par réapparaitre à un autre endroit.

« C'est la plus grande bibliothèque gratuite au monde, au service de dizaines de milliers de scientifiques et de professionnels de la santé à travers le monde, qui vivent dans des pays en développement et qui n'ont pas les moyens d'acheter des livres et des revues scientifiques. Il s'agit d'une initiative pratiquement unique au monde », explique shrine, pseudonyme d'un utilisateur de la plateforme Reddit.
 
Ce dénommé shrine et quelques autres volontaires se sont lancé pour défi d'archiver et de réunir les quelques 33 téraoctets de données accessibles sur LibGen sur une plateforme d'archives en ligne The Eye. « À l'heure actuelle, personne ne le fait, alors je pense que c'est un grand pas en avant pour assurer la sécurité de la collection et la rendre disponible pour davantage de développeurs qui souhaitent l'utiliser », souligne-t-on encore sur Reddit.

Cette perspective d'archivage pourrait un peu plus menacer les plans de l'édition pour faire fermer Sci-Hub et son site LibGen, alors que les éditeurs eux-mêmes imaginent des solutions pour détourner la communauté des chercheurs du piratage.

via Vice


Commentaires
Pas certaine que 33 téraoctets équivalent à "environ" 1024 gigaoctets... ou alors c'est une très grosse approximation !
Bonjour,

1To = 1000 Go, à peu près. En effet. 33 To donc, seraient mille fois plus nombreux. Et plus on est de fous, même chez les octets, plus on rit !

C'est modifié cela dit wink
Poster un commentaire

 

grin LOL cheese smile wink smirk rolleyes confused surprised big surprise tongue laugh tongue rolleye tongue wink raspberry blank stare long face ohh grrr gulp oh oh downer red face sick shut eye hmmm mad angry zipper kiss shock cool smile cool smirk cool grin cool hmm cool mad cool cheese vampire snake exclaim question

Vous répondez au commentaire de

Cliquez ici pour ne plus répondre à ce commentaire

* Laisser vide pour ne pas reçevoir de notification par email de nouveaux commentaires.