L'exploitation des Big Datas : l'avenir du livre, le cauchemar du lecteur

Nicolas Gary - 05.03.2014

Edition - Société - livre numérique - Big Datas - collecte de données


La décision de justice rendue dernièrement en faveur de Google Books, aux États-Unis, pose une question cruciale : celle de la fouille de données, ou plus spécifiquement, le Data Mining. Dans le cas de Google Books, le juge avait considéré que le service remplissait une fonction nouvelle, et utile aux internautes et chercheurs, en donnant « la possibilité, pour la première fois, d'effectuer des recherches en texte intégral pour des dizaines de millions de livres ». Datas mining et Big Datas sont pourtant très liées.

 

 

Big data is everywhere

onlinedialogue, CC BY SA 2.0

 

 

L'usage transformatif proposé par Google Books serait conforme aux règles du Fair Use, selon le droit américain. Le juge avait estimé que Google Books apporte un usage complètement nouveau avec son système de recherche. Loin de la substance même des textes, son outil permettant la recherche au sein des ouvrages offre un usage hautement transformatif, et comporte une très forte valeur ajoutée. C'est d'ailleurs l'un des grands reproches que l'on pourrait adresser à la constitution de la base de données du registre ReLIRE : l'absence de solution permettant de réaliser une recherche dans l'intégralité des textes qui seront numérisés au travers de ce projet. Mais passons.

 

Et revenons aux Big Datas. Ces données personnelles, liées aux clients, dans le cadre de l'édition, peuvent concerner plusieurs points : le temps de lecture, le nombre d'ouvrages achetés, le comportement du lecteur, ses choix, les méthodes de prescriptions, et ainsi de suite. Pour les éditeurs, comme pour les libraires, ces données sont primordiales, à l'ère numérique : grâce à la lecture en streaming, il est en effet possible, plus que jamais auparavant, de suivre le parcours du lecteur. Et de le ranger dans des cases précises, donc utilisables commercialement, pour faire des offres spécifiques. 

 

Dans un billet publié par la Harvard Business Review, Tom Davenport, spécialisé dans l'analyse et les processus d'innovation revient sur ces questions de recherches d'informations liées au lecteur. 

 

Les Big Datas sont plus exploitables dans le monde numérique que dans l'univers papier. Pourtant, les éditeurs seraient à la traîne en la matière. « Ce que les statistiques concernant l'industrie de l'édition suggèrent, c'est que si les éditeurs ont toujours eu des intermédiaires entre eux et leurs clients, ces intermédiaires se sont bien plus axés sur les données. Amazon et Google sont deux des entreprises les plus orientées sur les données, et Apple s'y penche de plus en plus, avec le temps ». 

 

Or, si les données deviennent des feuilles mortes, qui se récoltent à la pelle, c'est aussi la vie privée du lecteur que l'on piétine. Car, au travers de l'analyse de leurs lectures, ce sont les marchands qui collectent de précieuses informations, lesquelles seront transformées en matière commercialisable. Revers de la médaille, pour la lecture numérique, certes, mais mauvaise nouvelle avant tout. 

 

" Le principal objectif devrait non pas être de vendre du contenu, mais d'extraire les informations pour fidéliser les clients."

 

 

Car le livre numérique est devenu un mouchard de luxe. Les solutions de lecture en streaming, analysent selon différents niveaux de profondeurs les usages des lecteurs : quels styles fonctionnent le mieux, les livres sont-ils lus entièrement, quelle vitesse moyenne pour un chapitre parlant de la relaxation, etc. Ainsi, on sait que les romances sont plus rapidement lues que les romans religieux, et que les livres érotiques sont les plus rapidement lus de tous. Ça vous étonne ? 

 

Après tout, expliquait Mark Coker, fondateur de Smashwords, qui s'est récemment associé avec Scribd, solutions de publication et de lecture en streaming, « ce que veulent les auteurs, c'est trouver tout ce qui leur permettra d'avoir plus de lecteurs encore ».

 

 

Big Data: water wordscape

Vers des montagnes de nouvelles données et de graphiques

Marius B, CC BY 2.0

 

 

Or, poursuit Davenport, l'édition travaille encore trop peu sur l'exploration de données personnelles - et si c'est encore heureux pour le client, cela porte préjudice à l'industrie elle-même. Et donc aux ventes. Et, à plus long terme, aux lecteurs. Faut-il donc se réjouir de l'exploitation des Big Datas, pour que l'industrie du livre puisse continuer à vivre et produire des ouvrages, qui seront des best-sellers, pour que dans le même temps, il soit possible de financer des livres plus risqués ?

 

Ce qui fera sourire, c'est que les techniques déployées par Amazon ne lui ont toujours pas permis de sortir le livre ultime - alors que les filiales éditoriales de la société, outre-Atlantique, peinent encore à trouver un véritable succès. Recueillir des données n'est donc toujours pas la solution parfaite. « Le principal objectif devrait non pas être de vendre du contenu, mais d'extraire les informations pour fidéliser les clients. » Au moins pour les marchands : l'époque où tous les éditeurs feront de la vente de livres numériques en direct sur leur site, ou par l'impression à la demande, pour le papier, n'est pas encore arrivée.

 

« Cela signifie aussi que des changements sont nécessaires, au sein des équipes qui travaillent dans les maisons d'édition », poursuit Davenport. Avec pour conséquence que les prises de décisions concernant les lignes éditoriales seront pilotées par les données obtenues, malgré tout. Les médias sociaux devront être exploités pour mieux suivre les variations de marque, et il reviendra aux maisons de compiler les données et les avis, tout en combinant leurs propres expertises et connaissances. 

 

De quoi conforter le dessinateur Christian Darasse, qui nous expliquait les mutations connues déjà par l'édition.  « C'est vrai qu'aujourd'hui, les commerciaux ont pris le pouvoir. L'éditorial tente d'éditer, mais ce sont finalement les commerciaux qui donnent le ton. Or, le secteur ne va pas si mal, si l'on regarde l'excellent rapport de Gilles Ratier. Le véritable problème, c'est que les maisons ont toutes le besoin d'occuper le terrain des librairies. Dans les années 60, jusqu'en 80, on comptait moins d'albums, c'est vrai. Mais les problèmes étaient différents : il fallait publier dans un magazine, et ils n'étaient pas très nombreux. »

 

Maintenant, et désormais, en plus des commerciaux, il faudra compter sur les analystes.