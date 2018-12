thierry ehrman, CC BY 2.0



thierry ehrman, CC BY 2.0

L'ère de la Big data massivement collectée

Qui gardera les gardiens dématérialisés ?



— Emma Kraak



En partenariat avec Lettres Numériques

— Emma Kraak

Il était un temps où publier un livre revenait à jeter une bouteille à la mer. Si le travail d’un éditeur consistait à palper le zeitgeist pour déterminer le succès d’une publication, il n’en demeurait pas moins une prise de risque. Une fois publié, un livre se vendait — ou pas. Mais au-delà des recettes ou des pertes, des éloges et des diatribes, rien ne permettait de connaître le sort des livres une fois qu’ils étaient tombés entre les mains des lecteurs.Les données de lecture permettent de rendre compte des manières dont un ebook est lu. Combien de temps par session de lecture ? Quel pourcentage des lecteurs termine un livre ? S’ils décrochent, à quel moment ? Autrement dit, quels types de contenus sont susceptibles de retenir l’attention si prisée du lecteur ? Au-delà des classifications par genre et par auteur, les données de lecture permettent de témoigner de l’intensité de lecture, ce que les professionnels du métier appellent l’engagement : la conversion digitale d’une pratique hautement subjective.Ainsi, quelques considérations générales donnent une idée des usages : les livres divisés en chapitres courts sont plus susceptibles d’être achevés — bien que ceci n’arrive que dans 6 à 11 % des cas. Les lecteurs sont plus avides de biographies que d’ouvrages techniques et lisent les fictions érotiques avec plus d’entrain. Enfin, plus un livre est long, plus les lecteurs ont tendance à se rendre directement à la dernière page pour connaître la fin.Cela fait longtemps que les grandes entreprises comme Amazon collectionnent des données de lecture et des informations sur leurs clients. En accord avec leur fonctionnement général, ces données demeurent cependant exclusives. Une nouvelle vague de start-ups aspire à les rendre disponibles, dans une approche alliant profit et transparence. Ainsi, des entreprises comme Kobo utilisent des formules d’abonnement pour étudier les habitudes de leurs lecteurs. Pour quelques euros par mois, ces abonnements donnent accès à des centaines de milliers d’ebooks.La plateforme Scribd vante même un accès illimité. Ainsi, ils réalisent une sorte de vente en sursis : les données déterminent si un livre est effectivement lu — et donc si son auteur sera payé. Comment dès lors quantifier l’acte élusif de la lecture ? Le calcul varie en fonction des entreprises. Certaines considèrent un livre comme lu au-delà des 10 % ; pour d’autres, il faudra atteindre la moitié du volume.Ce n’est pas seulement le modèle économique qui évince la prise de risque. De nombreux auteurs, notamment ceux issus du milieu de l’autoédition, s’intéressent au potentiel des reading data. Les analyses permettent de voir quels passages d’un roman sont lus avec élan, ou au contraire, ceux qui peinent à être entamés. Un auteur peut comparer le succès de différents ouvrages et juger de la réception effective de son œuvre.Comme le note Alice Speranza dans son essai sur la question du goût en littératur e, les données de lecture sont plus efficaces que les questionnaires, car elles éliminent tout souci de légitimité culturelle.L’anonymat et l’immédiateté des données garantissent un regard franc sur les affinités réelles du lecteur, soudain mises à nu par les algorithmes. Au-delà de leur fonction commerciale, les données de lecture pourraient donc s’avérer utiles pour les chercheurs, notamment dans la lignée des travaux de Pierre Bourdieu en sociologie.Loin de se réduire à un exercice de communication, trouver son lecteur demeure un aspect fondamental de la littérature. Entre muse et interlocuteur idéal, le lecteur participe à la réalisation d’une œuvre, que ce soit par les voies mystérieuses de l’imaginaire ou par le caractère abrupt des chiffres. L’autocensure et l’émulation ont toujours existé, chez les éditeurs comme chez les écrivains.Mais plutôt que de s’inquiéter du sort d’une littérature asservie aux lois du marché, peut-être pouvons-nous porter notre regard sur les géants qui la pourvoient. La richesse des données de lecture ne pourrait-elle pas participer à la formation d’écosystèmes ouverts, où nos rayons de livres seraient revisités plutôt que consumés et nos contributions de lecteurs sublimées dans des formats de lecture inédits ?La malléabilité du numérique demeure trop souvent bridée au profit de l’exclusivité de livres marqués par des DRM, isolés des réseaux dans lesquels ils pourraient s’épanouir, dépourvus du phénomène d’attachement que procurent leurs équivalents papier. Les ressources potentielles de collaborations entre lecteurs, machines et créateurs, à défaut de constituer une mine d’or, restent des contrées à explorer.