Rendre l' IA accessible à tous

Mois : juin 2024

L’ Intelligence Artificielle dans la recherche

Je suis très heureux de pouvoir écrire cet article, et ce pour deux raisons.

La première raison est que la recherche scientifique est un des domaines où l’ Intelligence Artificielle peut révolutionner notre société, en stimulant la productivité scientifique, en augmentant les capacités cognitives humaines et en accélérant le rythme des découvertes. L’ IA appliquée à la science et à la recherche s’ est développée à un rythme important ces dernières années: si les tendances actuelles se maintiennent, la probabilité que les découvertes scientifiques futures soient principalement dues aux applications et aux outils de l’ IA va augmenter de manière significative.

La seconde raison est plus personnelle: depuis que j’ ai commencé la rédaction de ce blog à la mi-2023, j’ ai quasi-exclusivement parlé de l’ IA générative vu l’ engouement général à son sujet; je constate maintenant que de nombreuses personnes semblent résumer l’ IA à l’ IA générative et à ChatGPT. La fascination de ces dernières techniques est, je pense, lié en grande partie à leur facilité d’ utilisation et à la tentation de l’ anthropomorphisme. Mais elle ne doit pas éclipser les autres techniques dont le potentiel est tout aussi impressionnant.

Rappelons que les techniques génératives sont asssez récentes et l’ Intelligence Artificielle contient de nombreuses autres techniques, dont une grande partie dont orientées vers la prédiction et la discrimination de données. Ce sont principalement ces techniques qui seront à l’ honneur dans cet article.

Dans le texte qui suit, je décrirai les trois principales manières dont l’ IA impacte dès aujourd’hui le processus de recherche. Si les deux approches sont de nature prédictive et concernent la recherche scientifique, la troisième est générative et s’ applique également aux sciences humaines.

Ce bref aperçu n’ a pas vocation à être exhaustif : l’ IA aide aussi les chercheurs dans d’ autres domaines comme l’ analyse des données et dans l’ automatisation de certaines tâches répétitives de laboratoire par exemple…

1. Problèmes de prédiction complexes

L’ utilisation la plus courante de l’ IA dans le domaine scientifique consiste à résoudre des problèmes complexes de prédiction, c’ est-à-dire à mettre en correspondance des données d’ entrée connues avec des données de sortie à prédire. L’ IA intervient typiquement pour la résolution de problèmes physiques pour lesquels la modélisation directe des équations régissant les phénomènes est trop complexe.

Deux magnifiques examples de cette approche nous sont données par la société Google Deepmind à travers la prédiction de la structure tridimensionnelle des protéines à partir de la séquence d’ ARN codante (AlphaFold 3), et la prédiction de nouvelles structures cristallines (GnoME). Les applications possibles de ces deux applications sont énormes, et je vais les décrire succinctement.

Le modèle IA appelé Graph Networks for Materials Exploration (GNoME) est conçu pour prédire les structures cristallines inorganiques, qui sont des arrangements répétitifs d’ atomes conférant aux matériaux des propriétés particulières – par exemple, la symétrie hexgonale d’ un flocon de neige est le résultat de la structure cristalline de la glace.

Illustration 1 : Prédiction de nouvelles structures cristallines

Jusqu’ à présent, nous ne connaissions qu’ environ 48 000 cristaux inorganiques possibles. GNoME a fait passer ce chiffre à plus de 2 millions, et bien que certaines de ces nouvelles structures puissent se décomposer en formes plus stables ou être impossibles à créer, plus de 700 de ces prédictions ont déjà été réalisées indépendamment en laboratoire. Il s’ agit notamment d’ un cristal de lithium et de magnésium semblable à un diamant, qui pourrait être utilisé dans des lasers de grande puissance, et d’ un supraconducteur de molybdène à basse température.

Les chercheurs de Deepmind ont maintenant mis à la disposition de la communauté académique l’ ensemble des données relatives aux structures cristallines prédites. Cela va accélérer la découverte de nouveaux matériaux et c’ est là tout l’ intérêt : par rapport à ce que contenaient les bases de données auparavant, il est possible d’augmenter la taille des données d’ un ordre de grandeur.

Ces nouvelles structures cristallines pourraient contribuer à révolutionner la science des matériaux, en offrant de nouveaux moyens de fabriquer de meilleures batteries, de meilleurs panneaux solaires, de meilleures puces électroniques et bien d’ autres technologies vitales. « Chaque fois que quelqu’ un veut améliorer sa technologie, cela passe inévitablement par l’ amélioration des matériaux », explique Ekin Dogus Cubuk de DeepMind. « Nous voulions simplement qu’ ils aient plus d’ options. »

Alphafold 3, également fruit des recherches de Google Deepmind, est une prouesse comparable dans le domaine des structures organiques : il s’ agit cette fois de prédire la forme tridimensionnelle des protéines en fonction de leur structure codante encodée sur un gène de l’ ADN qui est transformé en message envoyé au ribosome (via un ARN messager). Le ribosome, qui fait partie de la machinerie cellulaire, construit ensuite la protéine en enfilant une série d’ acides aminés sur une longue chaîne, et c’ est l’ ARN messager qui décrit la séquence des acides aminés dans la chaîne. Le problème est que la protéine se replie ensuite en trois dimensions et c’ est cette forme qui détermine son rôle biologique. Or, le mécanisme de repliement fait intervenir des interactions trop complexes pour être modélisées directement. La résolution de ce problème de repliement des protéines faisait l’ objet de recherches acharnées depuis plus d’ un demi-siècle.

Illustration 2 : Prédiction de la structure tridimensionnelle des protéines

C’ est précisément ce que fait Alphafold 3, qui peut non seulement prédire la structure d’ une protéine à partir de la séquence codante d’ ARN messager, mais également l’ interaction de cette dernière avec d’ autres molécules, ce qui constitue un outil incroyablement précieux pour la recherche de nouveaux médicaments ou vaccins… et, ici encore, les chercheurs de Deepmind on choisi de publier une base de données de 200 millions de structures tridimensionnelles de protéines prédites par Alphafold 3.

Alphafold 3 est tellement fascinant que je pense bien y consacrer un prochain article…

2. la paramétrisation des systèmes complexes

Une seconde application est le paramétrage optimal de systèmes complexes. Dans ce cas, des techniques telles que l’ apprentissage par renforcement peuvent être utilisées pour rechercher l’ ensemble optimal de paramètres qui maximisent ou minimisent une fonction objective spécifique ou produisent un résultat souhaité.

Quelle est la différence avec le point précédent ? Eh bien dans le cas précédent on partait d’ une cause (un ARN messager) pour en prédire la conséquence (la structure d’ une protéine). Ici, nous faisons le contraire : nous partons d’ un résultat désiré pour essayer d’ identifier une configuration de paramètres d’ entrée qui pourrait mener à ce résultat. Comme les algorithmes d’ IA prédictive travaillent sur base de corrélation et non de causation, ils peuvent travailler indifféremment dans les deux sens, contrairement aux lois de la Physique qui sont de nature causale et donc unidirectionnelle. Le prix à payer pour un lien corrélatif est l’ absence d’ explication, mais dans certains cas c’ est le résultat qui importe et non sa justification.

Un exemple récent concerne les tokamaks, ces réacteurs prototypes pour la fusion nucléaire. L’ IA a permis aux scientifiques de modéliser et de maintenir un plasma à haute température à l’ intérieur de la cuve du tokamak, un problème qui s’ était avéré très difficile à résoudre jusqu’ à présent: le plasma est contrôlé à travers une série de bobines générant des champs magnétiques qui doivent être réglés avec grande précision à tout instant si l’ on veut maintenir la stabilité du plasma. Le problème est si complexe à résoudre que les physiciens comparent cela à maintenir la forme d’une boule de « slime » (le plasma) avec des élastiques (les champs magnétiques)…

Illustration 3 : Contrôle du plasma de fusion dans un tokamak

Lors d’expériences menées au DIII-D National Fusion Facility de San Diego, des chercheurs américains ont récemment démontré que leur modèle, formé uniquement à partir de données expérimentales antérieures, pouvait prévoir jusqu’ à 300 millisecondes à l’ avance les instabilités potentielles du plasma. Ce délai s’ avère suffisant pour modifier certains paramètres de fonctionnement afin d’ éviter une déchirure dans les lignes de champ magnétique du plasma, perturbant son équilibre et ouvrant la porte à une fuite qui mettrait fin à la réaction.

Cette recherche ouvre la voie à un contrôle plus dynamique de la réaction de fusion que les approches actuelles et jette les bases de l’ utilisation de l’ intelligence artificielle pour résoudre un large éventail d’ instabilités du plasma, qui constituent depuis longtemps des obstacles à l’ obtention d’une réaction de fusion durable. L’ IA pourrait donc aider à lever un obstacle majeur dans le développement de la fusion nucléaire en tant que source d’ énergie non polluante et virtuellement illimitée…

3. L’ IA pour la recherche et la découverte bibliographiques

Une autre application essentielle de l’ IA est l’ automatisation du processus d’ examen de la littérature académique, qui peut être facilitée par des moteurs de recherche puissants basés sur les modèles de langage. Des plateformes telles qu’ Elicit et Perplexity fonctionnent grâce à une interface de type chatbot, permettant aux chercheurs d’ interagir dynamiquement avec la machine.

Le chercheur peut entamer une conversation pour rechercher des informations sur des recherches antérieures dans un certain domaine et recevoir un résumé des informations-clés sur ce domaine. Les outils les plus récents peuvent même se souvenir du contexte de la conversation, ce qui améliore la qualité de l’ échange entre l’ utilisateur et la machine.

Toujours dans le contexte de l’ analyse de la littérature universitaire, une application intéressante est la découverte basée sur la littérature, où l’ IA peut découvrir des associations implicites et cachées à partir d’ études existantes, ce qui donne lieu à des hypothèses intéressantes, surprenantes et non triviales qui valent la peine d’ être étudiées plus avant par les chercheurs.

Rappelons que les modèles de langage fonctionnent sur une base de création de la séquence linguistique la plus plausible. Ce mécanisme peut être source de créativité en combinant des concepts développés séparément dans la littérature, en identifiant des lacunes dans la littérature ou encore en proposant des variations originales dans les expériences existantes.

Afin d’illustrer ce propos, je voudrais reprendre une citation du Prof. Terence Tao, Professeur de Mathématiques à l’ UCLA et un des plus brillants mathématiciens vivant à ce jour :

L’ IA de niveau 2023 peut déjà donner des indications suggestives et des pistes prometteuses à un mathématicien en activité et participer activement au processus de prise de décision. Lorsqu’ elle sera intégrée à des outils tels que les vérificateurs de preuves formelles, la recherche sur Internet et les progiciels de mathématiques symboliques, je m’attends à ce que l’IA de niveau 2026, si elle est utilisée correctement, soit un co-auteur digne de confiance dans la recherche mathématique, et dans de nombreux autres domaines également.

Terence Tao, Professeur de Mathématiques à UCLA

Conclusion

Voilà. Je sais qu’ on entend souvent parler de l’ Intelligence Artificielle avec une connotation négative : pertes d’ emploi, risque de perte de contrôle, désinformation… mais cette perception pessimiste ne doit pas faire oublier l’ immense potentiel transformateur de cette technologie. Mon article précédent parlait d’ éducation, et cet article a parlé de recherche scientifique. Ces deux domaines sont notre plus grande promesse pour des lendemains meilleurs.

Il est parfois bon de rappeler que le verre à moitié vide est aussi à moitié plein.

Sources et références

Expériences éducatives avec les agents IA génératifs

Je suis convaincu que les agents IA présentent une magnifique opportunité éducative. J’ ai eu l’ occasion de m’ entretenir récemment avec plusieurs institutions de l’enseignement supérieur et d’ expérimenter en ce sens.

Cet article a pour but de présenter le résultat de mes expériences autour de tuteurs personnalisés pour des cours spécifiques. Cette idée est très intéressante car elle est aisée à mettre en oeuvre tout en ayant une grande valeur ajoutée.

Le résultat de mes expériences prend la forme d’ agents GPTs fonctionnant chez OpenAI auxquels vous pouvez accéder et que vous pouvez consulter. Les liens sont disponibles dans les paragraphes qui suivent. Et comme tout le monde a accès aux agent GPTs depuis quelques jours, ça veut dire que vous pourrez les tester même si vous ne payez pas l’abonnement ChatGPT+…

L’ intérêt de l’ enseignement personnalisé

Les experts savent depuis longtemps qu’ il est possible de rendre l’ enseignement plus efficace en le personnalisant. Les travaux de Benjamin Bloom publiés en 1984 dans l’article « The Two sigma Problem » en attestent : l’ étudiant moyen ayant bénéficié d’ un enseignement personnalisé obtient en moyenne des résultats qui dépassent de deux écarts-types ceux du groupe de contrôle (qui a lui reçu un enseignement traditionnel dans une classe). Cet écart est énorme, comme en atteste la figure ci-dessous : environ 90% des étudiants bénéficiant d’ un tuteur atteignent le niveau des 20% meilleurs élèves du groupe de contrôle.

Figure 1 : Distribution des évaluations pour diffférents mécanismes d’enseignement

L’ article est disponible en référence à la fin de l’ article.

Une partie du problème est que la transmission unidirectionnelle de connaissances de l’ enseignement traditionnel ne prend pas bien en compte les différences individuelles de capacité d’assimilation et de compétences, avec pour corollaire le « largage » de certains étudiants tandis que d’ autres se désintéressent de la matière par manque de stimulation intellectuelle.

Il serait donc intéressant de disposer, en plus de l’ enseignant traditionnel, de tuteurs qui pourraient permettre aux étudiants de rattraper leur retard éventuel en-dehors des cours.

La difficulté, bien sûr, est que dans un modèle entièrement basé sur des enseignants humains, le nombre d’ enseignants qu’ un enseignement personnalisé requiert est prohibitif vu le nombre d’ étudiants à former…et donc les mécanisme de remédiations existants sont très limités en termes de capacité et d’ accès.

Les agents IA génératifs à la rescousse

Et c’ est là que l’ IA générative peut changer radicalement la donne : comme l’ enseignement repose sur de nombreux supports écrits (syllabus etc..), il est possible d’ utiliser ces supports pour enrichir un modèle de langage et en faire un assistant conversationnel répondant aux questions des étudiants 24h/24.

Concrètement, la transformation du modèle de base en tuteur passe par un mécanisme de Récupération Augmentée de Génération (RAG) qui puise dans les supports du cours disponibles sous format digital (pdf..). Vous pouvez consulter mon article précédent parlant de la RAG ici.

C’est précisément ce que j’ai fait avec les trois agents GPTs suivants, qui agissent comme tuteurs en Physique se basant les célèbres cours de Physique universitaire du Prof. Richard Feynman (aussi en référence) :

  • Tuteur de Physique 1 : Mécanique, radiation et chaleur : lien;
  • Tuteur de Physique 2 : Electromagnétisme et matière : lien;
  • Tuteur de Physique 3 : Mécanique Quantique : lien.

Si vous avez des enfants qui bûchent (ou trébuchent) sur ces sujets en ce moment, n’hésitez pas à leur transmettre les liens ci-dessus ! Ces agents répondent dans toutes les langues…

Voici quelques idées pour tester les agents de physique :

  • Demandez au premier tuteur pourquoi le ciel est bleu, et/ou pourquoi le soleil du crépuscule est rouge ou encore pourquoi les nuages sont blancs…ou encore ce qu’ est la courbe du chien et son rôle dans la conception des bretelles d’ autoroute.
  • Demandez au second tuteur ce qu’est une cage de Faraday et pourquoi les voitures représentent un abri très efficace en cas d’ orage. Ou encore ce qu’est l’ effet de peau et pourquoi le courant continu est une meilleure solution pour le transport de l’ électricité à très longue distance…

Par ailleurs, Khan Academy a publié un tuteur à caractère généraliste, appelé Tutor Me. Il couvre les mathématiques et les sciences exactes et humaines pour des étudiants du secondaire. Vous pouvez accéder à ce tuteur ici.

Il est intéressant de noter que ces tuteurs ne sont pas nécessairement limités à un seul cours ou à un seul établissement. Par exemple, un tuteur IA consolidé « verticalement » pourrait exploiter l’ ensemble des cours de physique générale enseignés dans toutes les universités belges (il faudrait qu’il mentionne systématiquemnt les sources sur lesquelles il s’appuie). Un tuteur « horizontal » aura plutôt une vocation multidisciplinaire, comme c’est le cas de Tutor Me de Khan Academy.

Un conseil : Utilisez ces tuteurs sans ménagement. Obligez-les à répéter et réexpliquer ce que vous ne comprenez pas autant de fois que nécessaire. Pas besoin de mettre les formes, ce ne sont pas des humains et ils sont infatigables! Soyez précis et direct dans vos questions : ils sont là pour vous aider à comprendre…

Quelques Réflexions

Les agents qui sont décrits ci-dessus sont des modèles conceptuels qui ne sont pas destinés à une utilisation opérationnelle. Ils ont pour but de présenter le potentiel du concept mais se heurtent à toutes les limites du modèle cloud : dépendance complète à un changement des conditions d’ accès décrété par le fournisseur, envoi d’ informations à une tierce partie avec les risques de confidentialité que cela comporte, besoin de connectivité permanente…

Une utilisation opérationnelle dans l’ enseignement se fera plus logiquement sur base de modèles open-source installés localement au sein de l’institution ou de l’ administration, assurant par là la qualité et l’ uniformité de l’ accès aux élèves dans les meilleures conditions.

Mon idée en mettant au point ces prototypes est de susciter la réflexion auprès des autorités académiques : ces agents sont-ils intéressants ? Et si oui, comment les intégrer dans le processus éducatif actuel ? Et selon quelles modalités pratiques ?

Sources et références