La dernière Intelligence artificielle de Google peut comprendre un livre

À moi les romans de Stephen King ! - pixabay licence

Comprendre. Autrement dit, lire en prenant conscience de ce qui est écrit, en assimilant les informations communiquées, avec un sens de la narration. La prochaine étape consistera à donner des capacités de jugement esthétique aux œuvres, certainement.

Or, le plus important défi pour une IA travaillant sur le langage, c’est de parvenir à saisir le contexte du livre qu’elle ingurgite. Pour résoudre ce problème, les techniciens de Google ont mis au point Reformer.

L'IA, quelle menace pour les créateurs ?

Ce dernier est l’héritier de Transformer, un réseau neuronal qui compare les mots à l’intérieur d’un paragraphe, pour établir les relations entre eux. Reformer va plus loin : si ses concurrents peuvent comprendre quelques lignes, voire des paragraphes, ils ont besoin d’importantes ressources numériques.

Des groupes de mots

Transformer, par exemple, use d’un grand espace de stockage, pour seulement traiter quelques milliers de mots. Pour un livre, la chose devient insoluble. Reformer, lui, repose sur un nouveau modèle : le locality-sensitive-hashing. Il s’agit d’une méthode mathématique « de recherche approximative dans des espaces de grande dimension », indique Wikipedia. On n’est guère plus avancé.

Reformer en pleine lecture...

Les scientifiques ont recours à cette approche pour la comparaison de séquences ADN, par exemple, ou dans la traque de similarités entre différents fichiers audio. Dans le traitement automatique du langage naturel, cette solution imite la compréhension des mots par les humains, tout en favorisant le traitement de grandes quantités de données.

Comment cela fonctionne pour Reformer ? Eh bien, au lieu de comparer les mots entre eux, il va hacher le texte, pour établir des listes de champs lexicaux. Une fois un groupe lexical établi, un premier traitement intervient, d’analyse des vocables retenus. Par la suite, les confrontations s’opèrent entre groupes de mots, réduisant considérablement les délais et les besoins de stockage.

Et la conclusion des ingénieurs de Google est que Reformer se trouve en mesure de traiter des livres entiers – un petit miracle pour le text and data mining, évidemment. Le code source a été mis en ligne, à cette adresse pour les joueurs. Et le détail de ce projet est ici.

Dossier —L’intelligence artificielle au service du livre et de la lecture

La dernière Intelligence artificielle de Google peut comprendre un livre

Des groupes de mots

Commenter cet article

Des livres neufs à prix réduit : une solution pour les collectivités

Pourquoi opposer droits d’auteur et transition écologique ?

Face à l'urgence climatique, faire bonne impression

Après une cyberattaque dévastatrice, le distributeur Socadis reprend ses activités

Le distributeur allemand Bookwire investit l'Italie avec Bookrepublic

Editis s'appuie sur AZAP pour optimiser la distribution Interforum

MDS Benelux en sursis : “Nous avons plongé dans le rouge”

Hachette annule le déménagement de sa distribution, pour l'instant

Les livres mettent-ils la planète en danger ?

En plein “désastre social”, y'a-t-il “un pilote chez Editis” ?

La Générale Librest s'allie à Nosoli (Furet du Nord / Decitre)

Marc Levy introuvable en librairie : son roman menacé de grève

Les éditions du Cerf quitteront Interforum

Monica Irimia, de la librairie à la surdiffusion

Anne Drouinaud est nommée Secrétaire Générale chez Hachette Livre

Auteurs, éditeurs : Amazon augmente ses coûts d'impression de livres

Le distributeur allemand Bookwire met ChatGPT au service des éditeurs

Recyclivre enrichit sa plateforme en ligne Superway

Label Emmaüs : repenser la loi Lang à l'aune des enjeux climatiques

Sipour Box propose désormais des livres grands formats

Papier : Christian Ribeyrolle nouveau Président de COPACEL

Fnac quitte la Suisse allemande et mise tout sur le marché français

“Harcèlement et comportements inappropriés” chez Interforum

Emme Promo Junior, nouveau service pour promouvoir l’édition jeunesse

Mr Tan & Co, nouvelle maison d'édition de Mortelle Adèle, signe avec Interforum

Pierre Coursières élu président du Syndicat des Distributeurs de Loisirs Culturels

Appel à une grève nationale dans les magasins Cultura ce 3 décembre

À Tigery, les salariés d'Interforum demandent l'équité des primes

Fédération de randonnée pédestre : la distribution, tout un cirque ?

France : Amazon se rêve désormais imprimeur de livres

Les éditions d'en bas arrivent en France et Belgique grâce à Serendip/Paon

L'Imaginaire se fait la malle : quatre éditeurs quittent Média Participations

Mort d'un ouvrier dans un entrepôt d'Amazon en Pologne : l'enquête interdite

Le développement de Feltrinelli, entre numérique et formation

Neutralité carbone en 2040 : Amazon n'en prend pas le chemin

Rachat dans le monde du podcast italien : Chora Media achète Will

Olivia Arthur, lauréate du Fonds de soutien au livre photo jeunesse

Lié à des escalvagistes, le Prix Booker doit-il changer de nom ?

2,5 millions € de butin en livres rares : un gang de voleurs démantelé

Italie : 60 éditeurs et 300 libraires indépendants unissent leurs forces

Le réalisateur d'Entre les murs, Laurent Cantet, est mort

“Une nouvelle démarche déloyale des éditions Oxymore” contre Delcourt

Frais de port du livre : un impact négatif pour 63 % des acheteurs

Lagardère : baisse des ventes livre en France au 1er trimestre 2024

Le philosophe américain Daniel Dennett est mort

L'Europe exclut le livre du règlement sur les retards de paiement

Une bibliothèque allemande théâtre d'une attaque à la machette

Editis : Laurine Mortha nouvelle directrice des fusions-acquisitions

Maupassant, une vie, par la Grande Librairie

À la BnF, pas de pudding, mais des livres à l'arsenic

Dix ans après sa dernière enquête, Sherlock Holmes de retour

Décès de l'illustrateur suisse Étienne Delessert

Détenteur de la licence Le Seigneur des Anneaux, Embracer se divise

Le plaisir de la lecture commence dans les crèches

Tétraplégique, l'auteur Hanif Kureishi “écrit bien plus qu'avant”

Bruxelles, une menace pour la vie privée des dirigeants de Vivendi

En Italie, Meloni et la Rai ont-ils menti pour mieux censurer ?

Livre d'occasion : le Conseil permanent des écrivains souhaite une “concertation”

L'acteur Chris Pine signe son premier livre jeunesse

Japon : une amende de 10 millions € pour un pirate de mangas

Un écrivain italien interdit de télé : le spectre de Meloni plane

Mort de Georges Forestier, spécialiste de Molière, Corneille et Racine

L'Autrichien qui avait fait plier Facebook s'attaque à Meta

L'immense collection de VHS de Scorsese entre à la bibliothèque

Chine, Occident et Liu Cixin : un Problème à trois corps

À Manhattan, une douce France dans la librairie de Cyril Dewavrin

Reconnue coupable de faute, l'Agessa condamnée à indemniser un auteur

Erri De Luca, Lola Lafon ou Javier Cercas rêvent l'Europe dans une revue

Académie des beaux-arts : Thierry Groensteen élu correspondant

Promotion de la transphobie : mode d'emploi d'une Transmania

Budget 2024-2025 du Canada : où sont passés les engagements ?

L'enfer pour le “paradis du manga” : quel avenir pour piccoma France ?