Comme le magazine Newsweek l’annonçait en janvier dernier, son algorithme d’intelligence artificielle a en effet battu l’être humain lors du Stanford Question Answering Dataset (SQuAD), un test de compréhension à la lecture globale comprenant plus de 100 000 questions. Une prouesse qui prouve que le développement de l’intelligence artificielle est bel et bien en marche.



Après les robots chirurgiens, une machine qui lit mieux qu’un être humain ? C’est désormais une réalité. En Chine, où l’intelligence artificielle est de plus en plus utilisée et développée depuis quelques années par des entreprises technologiques telles que Baidu et Tencent, l’intention du gouvernement est clairement d’arriver à la pointe dans ce domaine en pleine effervescence.



Et il est en passe d’y arriver : pour la première fois au mois de janvier dernier, le modèle d’apprentissage automatique (machine learning) d’Alibaba a réalisé un score de 82,44 % au SQuAD, contre un résultat humain de 82,30 %. Comme pour prouver sa suprématie, le logiciel IA de Microsoft battait ce record dès le lendemain, avec un résultat de 82,65 %.



Depuis, l’exploit a été renouvelé plusieurs fois, notamment par R-NET, un modèle développé par Microsoft Research Asia. Dernier lauréat en date, avec un score de 84,54 % réalisé le 12 juillet dernier : QANet, un système mis au point par Google, autre géant de la technologie, et les chercheurs de la Carnegie Mellon University.



Mais comment fonctionne ce test développé par les chercheurs de l’université de Stanford ? D’une manière somme toute assez simple : des questions sont posées à la machine, à partir d’un corpus de 500 articles puisés dans l’encyclopédie en ligne Wikipédia. Le robot analyse chacun des termes qui les composent pour fournir les réponses qui lui semblent le plus adéquates. À partir de celles-ci, les chercheurs déterminent ensuite à l’aide de critères bien précis la qualité de compréhension.



Quelques exemples des questions soumises : « D’où vient la pluie ? », « Quelle couleur a été utilisée pour fêter le 50e anniversaire du Super Bowl ? » ou encore « Qu’est-ce que le droit européen ? » L’algorithme IA est capable de donner des réponses d’une grande précision, grâce au stockage de milliers d’informations issues de très nombreuses sources.







Ces avancées pourraient avoir des répercussions importantes dans le monde du travail : un système de réponses automatisé pourrait en effet être utilisé pour perfectionner les chatbots existants, remplacer les services à la clientèle téléphoniques, accueillir des patients dans les services médicaux, ou encore servir comme guide de musée…



Dans le domaine des études scientifiques, cette capacité à traiter et à analyser de grandes quantités de textes peut également se révéler utile aux chercheurs. Quant à son usage commercial, Alibaba l’applique déjà depuis plusieurs années sur son site lors du Single Day, fête étudiante destinée aux célibataires qui connaît un immense succès en Chine et donne lieu à un flux impressionnant de transactions : lorsque des clients posent des questions sur la plateforme de vente, ils reçoivent parfois la réponse d’une machine.



Si cette performance pouvait révolutionner positivement les services de restitution des informations, plusieurs questions se poseraient cependant : est-elle synonyme d’une mise en péril potentielle de milliers d’emplois ? Peut-on se fier complètement aux réponses données à la machine, dans le secteur médical par exemple, où elles pourraient mettre des vies en danger ?



Dans les deux cas, le risque est encore très faible puisque, pour répondre aux questions, le réseau de neurones artificiels doit en effet en avoir eu connaissance au préalable : il se contente de rechercher les informations dans une immense base de données et ne peut donc répondre qu’à des questions factuelles et objectives. Pour l’instant, l’intelligence artificielle semble donc devoir se cantonner à des tâches d’exécution limitées, supervisées par des humains.