Je suis très heureux de pouvoir écrire cet article, et ce pour deux raisons.
La première raison est que la recherche scientifique est un des domaines où l’ Intelligence Artificielle peut révolutionner notre société, en stimulant la productivité scientifique, en augmentant les capacités cognitives humaines et en accélérant le rythme des découvertes. L’ IA appliquée à la science et à la recherche s’ est développée à un rythme important ces dernières années: si les tendances actuelles se maintiennent, la probabilité que les découvertes scientifiques futures soient principalement dues aux applications et aux outils de l’ IA va augmenter de manière significative.
La seconde raison est plus personnelle: depuis que j’ ai commencé la rédaction de ce blog à la mi-2023, j’ ai quasi-exclusivement parlé de l’ IA générative vu l’ engouement général à son sujet; je constate maintenant que de nombreuses personnes semblent résumer l’ IA à l’ IA générative et à ChatGPT. La fascination de ces dernières techniques est, je pense, lié en grande partie à leur facilité d’ utilisation et à la tentation de l’ anthropomorphisme. Mais elle ne doit pas éclipser les autres techniques dont le potentiel est tout aussi impressionnant.
Rappelons que les techniques génératives sont asssez récentes et l’ Intelligence Artificielle contient de nombreuses autres techniques, dont une grande partie dont orientées vers la prédiction et la discrimination de données. Ce sont principalement ces techniques qui seront à l’ honneur dans cet article.
Dans le texte qui suit, je décrirai les trois principales manières dont l’ IA impacte dès aujourd’hui le processus de recherche. Si les deux approches sont de nature prédictive et concernent la recherche scientifique, la troisième est générative et s’ applique également aux sciences humaines.
Ce bref aperçu n’ a pas vocation à être exhaustif : l’ IA aide aussi les chercheurs dans d’ autres domaines comme l’ analyse des données et dans l’ automatisation de certaines tâches répétitives de laboratoire par exemple…
1. Problèmes de prédiction complexes
L’ utilisation la plus courante de l’ IA dans le domaine scientifique consiste à résoudre des problèmes complexes de prédiction, c’ est-à-dire à mettre en correspondance des données d’ entrée connues avec des données de sortie à prédire. L’ IA intervient typiquement pour la résolution de problèmes physiques pour lesquels la modélisation directe des équations régissant les phénomènes est trop complexe.
Deux magnifiques examples de cette approche nous sont données par la société Google Deepmind à travers la prédiction de la structure tridimensionnelle des protéines à partir de la séquence d’ ARN codante (AlphaFold 3), et la prédiction de nouvelles structures cristallines (GnoME). Les applications possibles de ces deux applications sont énormes, et je vais les décrire succinctement.
Le modèle IA appelé Graph Networks for Materials Exploration (GNoME) est conçu pour prédire les structures cristallines inorganiques, qui sont des arrangements répétitifs d’ atomes conférant aux matériaux des propriétés particulières – par exemple, la symétrie hexgonale d’ un flocon de neige est le résultat de la structure cristalline de la glace.

Jusqu’ à présent, nous ne connaissions qu’ environ 48 000 cristaux inorganiques possibles. GNoME a fait passer ce chiffre à plus de 2 millions, et bien que certaines de ces nouvelles structures puissent se décomposer en formes plus stables ou être impossibles à créer, plus de 700 de ces prédictions ont déjà été réalisées indépendamment en laboratoire. Il s’ agit notamment d’ un cristal de lithium et de magnésium semblable à un diamant, qui pourrait être utilisé dans des lasers de grande puissance, et d’ un supraconducteur de molybdène à basse température.
Les chercheurs de Deepmind ont maintenant mis à la disposition de la communauté académique l’ ensemble des données relatives aux structures cristallines prédites. Cela va accélérer la découverte de nouveaux matériaux et c’ est là tout l’ intérêt : par rapport à ce que contenaient les bases de données auparavant, il est possible d’augmenter la taille des données d’ un ordre de grandeur.
Ces nouvelles structures cristallines pourraient contribuer à révolutionner la science des matériaux, en offrant de nouveaux moyens de fabriquer de meilleures batteries, de meilleurs panneaux solaires, de meilleures puces électroniques et bien d’ autres technologies vitales. « Chaque fois que quelqu’ un veut améliorer sa technologie, cela passe inévitablement par l’ amélioration des matériaux », explique Ekin Dogus Cubuk de DeepMind. « Nous voulions simplement qu’ ils aient plus d’ options. »
Alphafold 3, également fruit des recherches de Google Deepmind, est une prouesse comparable dans le domaine des structures organiques : il s’ agit cette fois de prédire la forme tridimensionnelle des protéines en fonction de leur structure codante encodée sur un gène de l’ ADN qui est transformé en message envoyé au ribosome (via un ARN messager). Le ribosome, qui fait partie de la machinerie cellulaire, construit ensuite la protéine en enfilant une série d’ acides aminés sur une longue chaîne, et c’ est l’ ARN messager qui décrit la séquence des acides aminés dans la chaîne. Le problème est que la protéine se replie ensuite en trois dimensions et c’ est cette forme qui détermine son rôle biologique. Or, le mécanisme de repliement fait intervenir des interactions trop complexes pour être modélisées directement. La résolution de ce problème de repliement des protéines faisait l’ objet de recherches acharnées depuis plus d’ un demi-siècle.

C’ est précisément ce que fait Alphafold 3, qui peut non seulement prédire la structure d’ une protéine à partir de la séquence codante d’ ARN messager, mais également l’ interaction de cette dernière avec d’ autres molécules, ce qui constitue un outil incroyablement précieux pour la recherche de nouveaux médicaments ou vaccins… et, ici encore, les chercheurs de Deepmind on choisi de publier une base de données de 200 millions de structures tridimensionnelles de protéines prédites par Alphafold 3.
Alphafold 3 est tellement fascinant que je pense bien y consacrer un prochain article…
2. la paramétrisation des systèmes complexes
Une seconde application est le paramétrage optimal de systèmes complexes. Dans ce cas, des techniques telles que l’ apprentissage par renforcement peuvent être utilisées pour rechercher l’ ensemble optimal de paramètres qui maximisent ou minimisent une fonction objective spécifique ou produisent un résultat souhaité.
Quelle est la différence avec le point précédent ? Eh bien dans le cas précédent on partait d’ une cause (un ARN messager) pour en prédire la conséquence (la structure d’ une protéine). Ici, nous faisons le contraire : nous partons d’ un résultat désiré pour essayer d’ identifier une configuration de paramètres d’ entrée qui pourrait mener à ce résultat. Comme les algorithmes d’ IA prédictive travaillent sur base de corrélation et non de causation, ils peuvent travailler indifféremment dans les deux sens, contrairement aux lois de la Physique qui sont de nature causale et donc unidirectionnelle. Le prix à payer pour un lien corrélatif est l’ absence d’ explication, mais dans certains cas c’ est le résultat qui importe et non sa justification.
Un exemple récent concerne les tokamaks, ces réacteurs prototypes pour la fusion nucléaire. L’ IA a permis aux scientifiques de modéliser et de maintenir un plasma à haute température à l’ intérieur de la cuve du tokamak, un problème qui s’ était avéré très difficile à résoudre jusqu’ à présent: le plasma est contrôlé à travers une série de bobines générant des champs magnétiques qui doivent être réglés avec grande précision à tout instant si l’ on veut maintenir la stabilité du plasma. Le problème est si complexe à résoudre que les physiciens comparent cela à maintenir la forme d’une boule de « slime » (le plasma) avec des élastiques (les champs magnétiques)…

Lors d’expériences menées au DIII-D National Fusion Facility de San Diego, des chercheurs américains ont récemment démontré que leur modèle, formé uniquement à partir de données expérimentales antérieures, pouvait prévoir jusqu’ à 300 millisecondes à l’ avance les instabilités potentielles du plasma. Ce délai s’ avère suffisant pour modifier certains paramètres de fonctionnement afin d’ éviter une déchirure dans les lignes de champ magnétique du plasma, perturbant son équilibre et ouvrant la porte à une fuite qui mettrait fin à la réaction.
Cette recherche ouvre la voie à un contrôle plus dynamique de la réaction de fusion que les approches actuelles et jette les bases de l’ utilisation de l’ intelligence artificielle pour résoudre un large éventail d’ instabilités du plasma, qui constituent depuis longtemps des obstacles à l’ obtention d’une réaction de fusion durable. L’ IA pourrait donc aider à lever un obstacle majeur dans le développement de la fusion nucléaire en tant que source d’ énergie non polluante et virtuellement illimitée…
3. L’ IA pour la recherche et la découverte bibliographiques
Une autre application essentielle de l’ IA est l’ automatisation du processus d’ examen de la littérature académique, qui peut être facilitée par des moteurs de recherche puissants basés sur les modèles de langage. Des plateformes telles qu’ Elicit et Perplexity fonctionnent grâce à une interface de type chatbot, permettant aux chercheurs d’ interagir dynamiquement avec la machine.
Le chercheur peut entamer une conversation pour rechercher des informations sur des recherches antérieures dans un certain domaine et recevoir un résumé des informations-clés sur ce domaine. Les outils les plus récents peuvent même se souvenir du contexte de la conversation, ce qui améliore la qualité de l’ échange entre l’ utilisateur et la machine.
Toujours dans le contexte de l’ analyse de la littérature universitaire, une application intéressante est la découverte basée sur la littérature, où l’ IA peut découvrir des associations implicites et cachées à partir d’ études existantes, ce qui donne lieu à des hypothèses intéressantes, surprenantes et non triviales qui valent la peine d’ être étudiées plus avant par les chercheurs.
Rappelons que les modèles de langage fonctionnent sur une base de création de la séquence linguistique la plus plausible. Ce mécanisme peut être source de créativité en combinant des concepts développés séparément dans la littérature, en identifiant des lacunes dans la littérature ou encore en proposant des variations originales dans les expériences existantes.
Afin d’illustrer ce propos, je voudrais reprendre une citation du Prof. Terence Tao, Professeur de Mathématiques à l’ UCLA et un des plus brillants mathématiciens vivant à ce jour :
L’ IA de niveau 2023 peut déjà donner des indications suggestives et des pistes prometteuses à un mathématicien en activité et participer activement au processus de prise de décision. Lorsqu’ elle sera intégrée à des outils tels que les vérificateurs de preuves formelles, la recherche sur Internet et les progiciels de mathématiques symboliques, je m’attends à ce que l’IA de niveau 2026, si elle est utilisée correctement, soit un co-auteur digne de confiance dans la recherche mathématique, et dans de nombreux autres domaines également.
Terence Tao, Professeur de Mathématiques à UCLA
Conclusion
Voilà. Je sais qu’ on entend souvent parler de l’ Intelligence Artificielle avec une connotation négative : pertes d’ emploi, risque de perte de contrôle, désinformation… mais cette perception pessimiste ne doit pas faire oublier l’ immense potentiel transformateur de cette technologie. Mon article précédent parlait d’ éducation, et cet article a parlé de recherche scientifique. Ces deux domaines sont notre plus grande promesse pour des lendemains meilleurs.
Il est parfois bon de rappeler que le verre à moitié vide est aussi à moitié plein.
Sources et références
- Trends in the use of AI in science : a bibliometric analysis, European Commission R&I Working Paper series : https://research-and-innovation.ec.europa.eu/knowledge-publications-tools-and-data/publications/all-publications/trends-use-ai-science_en
- Crystal-Hunting DeepMind AI could help discover new wonder materials, Alex Wilkins pour New Scientist le 29 Novembre 2023 : https://www.newscientist.com/article/2404929-crystal-hunting-deepmind-ai-could-help-discover-new-wonder-materials
- Engineers use AI to wrangle fusion power for the grid, Colton Poore, pour Princeton University, le 21 février 2024 https://engineering.princeton.edu/news/2024/02/21/engineers-use-ai-wrangle-fusion-power-grid
- AI will become mathematician’s copilot, par Christophe Drösser pour Scientific American, le 8 juin 2024 : https://www.scientificamerican.com/article/ai-will-become-mathematicians-co-pilot/