Big Datas, cet enjeu révolutionnaire des facs de lettres

- 24.06.2013

Lecture numérique - Usages - meta-donnees - universite - analyse


Ouvert en 2010 comme espace d'étude expérimental, le Labo littéraire de l'université de Stanford propose analyse de la production selon les périodes ou encore des études stylistiques. Des champs de recherches aussi pointus que la presse en Swahili du siècle dernier à à la taxonomie des titres au XIXe siècle sur le marché littéraire. Mais pose aussi des enjeux on ne peut plus modernes.

 

 

Big Data: water wordscape

 

Marius B, CC BY 2.0

 

Jusque-là réservée aux domaines de l'archivage professionnel et des télécommunications, la problématique des Big Datas, données ultra-volumineuses et personnelles, investit le monde de la prose. Certes, les bibliothèques personnelles ou d'établissements privés n'ont pas l'envergure des réseaux de serveurs d'une entreprise nationale. Mais les questions restent les mêmes sur les limites de capacités de stockage, la sauvegarde de contenus dans le temps et de bons outils d'exploration. Et participe même au renouvellement de la recherche universitaire.

 

Aussi Franco Moretti, cofondateur du Literary Lab dresse un parallèle avec les derniers enjeux numériques par des cas concrets. « Remplissez de livres un programme informatique et réalisez des courbes, des cartes et des graphiques, c'est le meilleur moyen d'appréhender l'ampleur de la littérature », commente-t-il. Avec des bibliothèques toujours plus fournies se pose une autre difficulté que la capacité de stockage : le temps de lecture limité.

 

Aussi, plus encore que dans d'autres domaines, excepté l'archivage, les fonds littéraires demandent une bonne indexation, un accès facile, rapide et des fonctionnalités permettant de croiser les contenus autour de thématiques similaires. Au point qu'un bon outil d'analyse sémantique permet des études sans passer par des heures de lecture pour acquérir les données relatives. 

 

 

Convertir les textes en métadonnées à l'instar d'un génome à décoder

 

 

Puisqu'une vie d'homme ne suffirait pas à consulter tous les ouvrages, Moretti incite à la découverte de nouveaux outils de croisement pour que le défrichage numérique permette des synthèses plus exhaustives et tout aussi rapides. Ainsi, des recherches menées via Google Books par des chercheurs d'Harvard permettent d'établir que l'omniprésence de Freud dans nos productions contemporaines en font une figure « plus profondément implantée dans notre inconscient collectif que Darwin ou Einstein ».

 

D'autres rapports analytiques, de la même université américaine, ont permis de découvrir que la moitié seulement des mots utilisés en anglais étaient indexés dans les dictionnaires, sur une observation de 5 millions d'ouvrages environ. Une comparaison impossible sans support informatique. Toujours dans ce croisement de science dure -big datas, études analytiques – et matériel littéraire, des chercheurs avaient relevé une propension de l'anglais d'Amérique à devenir plus « émotionnel » que l'anglais britannique en l'espace de cinquante ans.

 

 Fin des Humanités ou renouvellement ?

 

 

On le comprendra, l'association d'outils scientifiques et de conclusions qui sortent largement des disciplines purement scientifiques pose question au monde universitaire. Ainsi dans le Chronicle of Higher-Education, on peut lire que : « Les agrégateurs de données prétendent abattre les vieilles déclarations basées sur des évidences ''anecdotiques'' et prétendent répondre à des questions autrefois impossibles sur l'évolution des idées, des langues, de la culture. Les critiques, pendant ce temps, s'inquiètent, que ces enthousiastes de l'analyse quantitative n'écartent l'homme des humanités ».

 

Mais aussi le point de vue du Labo de Stanford sur la lecture. Avec la prétention de moins en moins axer le travail sur l'assimilation d'écrits, mais le commentaire d'analyse via des outils techniques, le Labo porte sa propre révolution du savoir, contestée, comme les humanités de la renaissance en leur temps. Privilégiant toujours l'exhaustivité du volume, un des professeurs du Labo a ainsi prescrit des milliers de textes de l'ère victorienne dans un corpus, au motif qu'il n'était pas besoin de les lire pour dresser des tendances.




Commentaires

Pas de commentaires

Poster un commentaire

 

grin LOL cheese smile wink smirk rolleyes confused surprised big surprise tongue laugh tongue rolleye tongue wink raspberry blank stare long face ohh grrr gulp oh oh downer red face sick shut eye hmmm mad angry zipper kiss shock cool smile cool smirk cool grin cool hmm cool mad cool cheese vampire snake exclaim question

Vous répondez au commentaire de

Cliquez ici pour ne plus répondre à ce commentaire

* Laisser vide pour ne pas reçevoir de notification par email de nouveaux commentaires.