{"id":1682,"date":"2024-11-03T17:35:39","date_gmt":"2024-11-03T16:35:39","guid":{"rendered":"https:\/\/artificiellementintelligent.wordpress.com\/?p=1682"},"modified":"2024-11-03T17:35:39","modified_gmt":"2024-11-03T16:35:39","slug":"un-prix-nobel-bien-merite-pour-alphafold-2","status":"publish","type":"post","link":"https:\/\/artificiellementintelligent.eu\/index.php\/2024\/11\/03\/un-prix-nobel-bien-merite-pour-alphafold-2\/","title":{"rendered":"Un prix Nobel bien m\u00e9rit\u00e9 pour AlphaFold 2"},"content":{"rendered":"\n<p class=\"wp-block-paragraph\">Le prix Nobel de chimie 2024 a \u00e9t\u00e9 attribu\u00e9 \u00e0 Demis Hassabis, PDG de Google Deepmind, conjointement avec le Dr. John Jumper \u00e9galement de Deepmind et le Professeur David Baker de l&rsquo;Universit\u00e9 de Washington.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Cette distinction a \u00e9t\u00e9 attribu\u00e9e pour leurs travaux sur le programme <em>AlphaFold 2<\/em> d\u00e9velopp\u00e9 par <em>Google Deepmind<\/em>, qui constitue une v\u00e9ritable r\u00e9volution dans le domaine des sciences du vivant. Il s&rsquo; agit probablement de l&rsquo; application la plus prometteuse de l&rsquo; Intelligence Artificielle \u00e0 ce jour. Le mod\u00e8le, qui permet de pr\u00e9dire la structure tridimensionnelle des prot\u00e9ines \u00e0 partir de leur s\u00e9quence d&rsquo; acides amin\u00e9s a r\u00e9solu un probl\u00e8me de biochimie vieux de plus de cinquante ans. Le prix Nobel ne r\u00e9compense pas seulement des ann\u00e9es de recherches, mais d\u00e9montre aussi comment l&rsquo; apprentissage machine et l&rsquo; IA influencent profond\u00e9ment notre compr\u00e9hension des m\u00e9canismes du vivant.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Ce qui rend Alphafold aussi int\u00e9ressant est sa capacit\u00e9 \u00e0 faire des pr\u00e9dictions structurales pr\u00e9cises de pratiquement n&rsquo; importe quelle prot\u00e9ine, une information exploitable par des milliers de chercheurs \u00e0 travers le monde pour d\u00e9velopper de nouveaux m\u00e9dicaments ou mieux comprendre des menaces sanitaires comme la r\u00e9sistance aux antibiotiques. De plus, l&rsquo; outil AlphaFold est librement accessible.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Les retomb\u00e9es potentielles d&rsquo; Alphafold sont certes nombreuses, mais comme il s&rsquo; agit d&rsquo; une application tr\u00e8s sp\u00e9cifique, il faut se plonger dans le monde de la biologie mol\u00e9culaire pour bien la comprendre&#8230;<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Cet article s&rsquo; inscrit dans la continuit\u00e9 de mon article pr\u00e9c\u00e9dent intitul\u00e9 \u00ab\u00a0Les Machines Gracieuses\u00a0\u00bb accessible <a href=\"https:\/\/artificiellementintelligent.wordpress.com\/2024\/10\/20\/les-machines-gracieuses-resume-d-un-essai-de-dario-amodei-pdg-d-anthropic\/\">ici<\/a>. L&rsquo; essai de Dario Amodei, qui est docteur en neurosciences, imagine les transformations de notre soci\u00e9t\u00e9 \u00e0 moyen terme (5-10 ans) en se concentrant largement sur les progr\u00e8s \u00e0 attendre de l&rsquo; IA dans ses sp\u00e9cialit\u00e9s: la biologie et les neurosciences.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Pr\u00e9senter Alphafold est aussi une opportunit\u00e9 de sortir de l&rsquo; omnipr\u00e9sence m\u00e9diatique des mod\u00e8les de langage. L&rsquo; accessibilit\u00e9 et la popularit\u00e9 de l&rsquo; IA g\u00e9n\u00e9rative aupr\u00e8s du grand public a quelque peu \u00e9clips\u00e9 les progr\u00e8s parall\u00e8les de l&rsquo; IA dite \u00ab\u00a0pr\u00e9dictive\u00a0\u00bb ces derniers temps. AlphaFold est une excellente occasion de rappeler que l&rsquo; IA pr\u00e9dictive, bien que plus sp\u00e9cialis\u00e9e, rec\u00e8le un potentiel \u00e9norme lui aussi.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">1. Quelques mots de biochimie<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Les prot\u00e9ines sont des mol\u00e9cules complexes qui sont responsables de la quasi-totalit\u00e9 des processus biologiques. Elles sont constitu\u00e9es de cha\u00eenes d&rsquo; acides amin\u00e9s qui s&rsquo; embo\u00eetent dans un ordre bien pr\u00e9cis.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Ces cha\u00eenes pouvant \u00eatre assez longues, le nombre de prot\u00e9ines th\u00e9oriquement possibles est astronomique. Mais le m\u00e9canisme d&rsquo; assemblage n&rsquo; est pas al\u00e9atoire, loin de l\u00e0 : l&rsquo; \u00eatre humain est constitu\u00e9 d&rsquo; environ 20.000 types de prot\u00e9ines, produites de mani\u00e8re calibr\u00e9e en fonction de la cellule et de l&rsquo; organe.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">L&rsquo; information d\u00e9crivant la s\u00e9quence de chaque prot\u00e9ine constituant nos prot\u00e9ines se trouve enregistr\u00e9e dans notre ADN, sur lequel on retrouve environ 20.000 g\u00e8nes, correspondant \u00e0 nos 20.000 prot\u00e9ines, chaque g\u00e8ne encodant une prot\u00e9ine. <\/p>\n\n\n\n<p class=\"wp-block-paragraph\">L&rsquo; ADN se compose d&rsquo; une longue suite de quatre bases diff\u00e9rentes (d\u00e9nomm\u00e9es en abr\u00e9g\u00e9 A,C, T et G). Un bloc de trois bases cons\u00e9cutives constitue un \u00ab\u00a0codon\u00a0\u00bb, par exemple TTA, ATG etc&#8230; Chaque codon encode un acide amin\u00e9 de la s\u00e9quence formant la prot\u00e9ine. Un g\u00e8ne est donc une suite de bases ADN cons\u00e9cutives formant des codons qui seront ensuite traduits en une cha\u00eene d&rsquo; acides amin\u00e9s qui se replieront enfin pour former une prot\u00e9ine.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Petite complication, l&rsquo; ADN est d&rsquo; abord transcrit en ARN messager avant d&rsquo; \u00eatre traduit en acides amin\u00e9s, et la base T(hymine) est transform\u00e9 en U(racile) au passsage. Par exemple, le codon TTA dans l&rsquo; ADN va devenir UUA dans l&rsquo; ARN messager qui encodera ensuite l&rsquo; acide amin\u00e9 Leu(cine) dans le ribosome. La figure 2 montre comment passer du codon de l&rsquo; ARN messager \u00e0 l&rsquo; acide amin\u00e9, en allant du centre vers l&rsquo; ext\u00e9rieur.<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img decoding=\"async\" src=\"https:\/\/artificiellementintelligent.wordpress.com\/wp-content\/uploads\/2024\/11\/image-20241103a.png\" alt=\"\" class=\"wp-image-1686\" \/><figcaption class=\"wp-element-caption\">Figure 1 : De l&rsquo; ADN \u00e0 la prot\u00e9ine, cr\u00e9dit : Nagwa<\/figcaption><\/figure>\n<\/div>\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-large\"><img decoding=\"async\" src=\"https:\/\/artificiellementintelligent.wordpress.com\/wp-content\/uploads\/2024\/11\/image-20241103b-1.png?w=2048\" alt=\"\" class=\"wp-image-1689\" \/><figcaption class=\"wp-element-caption\">Figure 2: Table de traduction des codons de l&rsquo; ARN messager aux acides amin\u00e9s, Credit : Mouagip<\/figcaption><\/figure>\n<\/div>\n\n\n<p class=\"wp-block-paragraph\">Il est fascinant de r\u00e9aliser que ce m\u00e9canisme de transcription\/traduction est identique -\u00e0 quelques variations mineures pr\u00e8s- pour l&rsquo; ensemble du vivant, depuis la bact\u00e9rie jusqu&rsquo;\u00e0 l&rsquo; humain. La principale (la seule ?) distinction entre deux esp\u00e8ces provient de la diff\u00e9rence entre les prot\u00e9ines produites et leur r\u00f4le.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Que ce m\u00e9canisme soit uniforme est un signe de l&rsquo; origine commune de l&rsquo; ensemble du vivant : si l&rsquo; on remonte suffisamment loin dans le temps, on aboutit \u00e0 l&rsquo; organisme appel\u00e9 <em>LUCA<\/em>, le dernier anc\u00eatre commun universel \u00e0 l&rsquo; ensemble de tous les \u00eatres vivants actuels. Il est tr\u00e8s probable que LUCA poss\u00e9dait d\u00e9j\u00e0 le m\u00e9canisme d\u00e9crit ci-dessus expliquant son universalit\u00e9. A noter que LUCA n&rsquo;est en rien le premier organisme vivant, il r\u00e9sulte lui-m\u00eame d&rsquo; un long processus \u00e9volutif sur la terre primitive. Mais tous les descendants des pr\u00e9d\u00e9cesseurs de LUCA hormis ce dernier ont disparu&#8230;<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-large\"><img decoding=\"async\" src=\"https:\/\/artificiellementintelligent.wordpress.com\/wp-content\/uploads\/2024\/11\/image-20241103c.png?w=1200\" alt=\"\" class=\"wp-image-1691\" \/><figcaption class=\"wp-element-caption\">Figure 3 : LUCA notre anc\u00eatre commun (Last Universal Common Ancestor)<\/figcaption><\/figure>\n<\/div>\n\n\n<p class=\"wp-block-paragraph\">Les acides amin\u00e9s \u00e9tant les m\u00eames pour tous les organismes, l&rsquo; algorithme de pr\u00e9diction de structure des prot\u00e9ines d&rsquo; Alphafold2 peut s&rsquo; appliquer \u00e0 l&rsquo; ensemble du r\u00e8gne animal et v\u00e9g\u00e9tal. Et l&rsquo; on retrouve d&rsquo; ailleurs d&rsquo; importantes similitudes entre les prot\u00e9ines \u00e0 travers les esp\u00e8ces. Au plus les esp\u00e8ces sont proches au sens de la taxonomie, au plus les prot\u00e9ines sont semblables. Et l&rsquo; analyse des diff\u00e9rences entre prot\u00e9ines jouant un r\u00f4le similaire \u00e0 travers les esp\u00e8ces est une des sources d&rsquo; information utilis\u00e9es par AlphaFold2 pour pr\u00e9dire la structure des prot\u00e9ines.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">2. Le probl\u00e8me du repliement des prot\u00e9ines<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Fort bien, nous savons maintenant comment sont stock\u00e9es dans l&rsquo; ADN les s\u00e9quences d&rsquo; acide amin\u00e9 constituant les prot\u00e9ines. La d\u00e9couverte de ce code remonte au d\u00e9but des ann\u00e9es 1960 et fait suite \u00e0 la d\u00e9couverte de la structure en double h\u00e9lice de l&rsquo; ADN en 1953.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Mais les chercheurs ont rapidement d\u00fb faire face \u00e0 un autre probl\u00e8me : le r\u00f4le d&rsquo;une prot\u00e9ine d\u00e9pend de sa forme dans l&rsquo; espace. En effet, une fois cr\u00e9\u00e9e dans le ribosome &#8211; la machine cellulaire qui transforme l&rsquo; ARN messager en s\u00e9quence d&rsquo; acides amin\u00e9s &#8211; la prot\u00e9ine va se replier selon un m\u00e9canisme extr\u00eamment complexe faisant intervenir non seulement les attractions et\/ou r\u00e9pulsions des atomes entre eux, mais aussi le r\u00f4le du milieu aqueux dans lequel plonge la cha\u00eene d&rsquo; acide amin\u00e9s, dont certaines parties sont hydrophiles et d&rsquo; autres hydrophobes. La prot\u00e9ine ne deviendra fonctionnelle qu&rsquo;une fois son repliage achev\u00e9. Complication finale, certaines prot\u00e9ines s&rsquo; assemblent ensuite entre elles pour former des structures plus complexes appel\u00e9es multim\u00e8res. La figure 4 donne une id\u00e9e des \u00e9tapes du processus :<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img decoding=\"async\" src=\"https:\/\/artificiellementintelligent.wordpress.com\/wp-content\/uploads\/2024\/11\/image-20241103d.webp\" alt=\"\" class=\"wp-image-1694\" \/><figcaption class=\"wp-element-caption\">Figure 4 : Les \u00e9tapes conceptuelles du pliage des prot\u00e9ines<\/figcaption><\/figure>\n<\/div>\n\n\n<p class=\"wp-block-paragraph\">Le probl\u00e8me du pliage des prot\u00e9ines est donc de savoir quelle forme g\u00e9om\u00e9trique finale adaptera une s\u00e9quence donn\u00e9e d&rsquo; acides amin\u00e9s. Cela fait environ cinquante ans (depuis le d\u00e9but des ann\u00e9es 1970) que les biochimistes butaient sur ce probl\u00e8me. Ce probl\u00e8me est tellement important qu &lsquo;il a \u00e9t\u00e9 appel\u00e9 \u00ab\u00a0la seconde moiti\u00e9 du code g\u00e9n\u00e9tique\u00a0\u00bb car sans cette information de structure, le r\u00f4le des prot\u00e9ines n&rsquo; est pas compr\u00e9hensible.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">En l&rsquo; absence d&rsquo;une solution au probl\u00e8me du pliage des prot\u00e9ines, la seule alternative constituait \u00e0 d\u00e9terminer exp\u00e9rimentalement la forme de chaque prot\u00e9ine, une par une, par des techniques de cristallographie d&rsquo; abord et plus r\u00e9cemment de microscopie \u00e9lectronique. Mais cela restait un effort majeur, demandant plusieurs ann\u00e9es de travail \u00e0 un ou plusieurs chercheurs pour une seule prot\u00e9ine.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Au cours des cinquante derni\u00e8res ann\u00e9es, les laboratoires ont r\u00e9ussi \u00e0 d\u00e9terminer la structure d&rsquo; environ 220.000 prot\u00e9ines, qui sont regroup\u00e9es dans la base de donn\u00e9es mondiales des prot\u00e9ines <em>PDB<\/em> (Protein Databank) dont l&rsquo; instance europ\u00e9enne est accessible <a href=\"https:\/\/www.ebi.ac.uk\/pdbe\/\">ici<\/a>. Ce volume de donn\u00e9es exp\u00e9rimentales laborieusement collect\u00e9 au cours des derni\u00e8res d\u00e9cennies a permis d&rsquo; entra\u00eener AlphaFold.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">3. Pr\u00e9sentation d&rsquo; Alphafold<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Alphafold utilise des techniques d&rsquo; intelligence artificielle pour pr\u00e9dire directement la structure finale (\u00ab\u00a0pli\u00e9e\u00a0\u00bb) de la prot\u00e9ine \u00e0 partir de la cha\u00eene d&rsquo; acide amin\u00e9s fournie en entr\u00e9e. En d&rsquo; autres termes, AlphaFold2 ne s&rsquo; int\u00e9resse pas ni ne cherche \u00e0 r\u00e9soudre le processus de pliage sur lequel butaient les chercheurs. Il va au contraire, selon une approche typique du <em>Machine Learning<\/em> , chercher \u00e0 pr\u00e9dire directement la forme finale de la prot\u00e9ine sur base de corr\u00e9lation avec les structures connues qui lui sont pr\u00e9sent\u00e9es lors de l&rsquo;entra\u00eenement du mod\u00e8le, d&rsquo; o\u00f9 l&rsquo; importance de la base de donn\u00e9es des 220.000 prot\u00e9ines existantes sans lequel rien n&rsquo; aurait \u00e9t\u00e9 possible.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Une clarification : j&rsquo; ai parl\u00e9 jusqu&rsquo; ici d&rsquo; Alphafold 2, publi\u00e9 en 2020, parce que c&rsquo; est ce mod\u00e8le qui a re\u00e7u le prix Nobel 2024 mais Google Deepmind a publi\u00e9 en 2023 un nouveau mod\u00e8le appel\u00e9 AlphaFold3 qui est encore plus puissant et c&rsquo; est celui dont je vais vous pr\u00e9senter succinctement l&rsquo; architecture.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Lorsque l&rsquo; on pr\u00e9sente une s\u00e9quence d&rsquo; acides amin\u00e9s \u00e0 AlphaFold3, ce dernier va fonctionner en trois \u00e9tapes. Il va tout d&rsquo; abord effectuer des recherches pr\u00e9paratoires pour localiser dans plusieurs bases de donn\u00e9es la forme des prot\u00e9ines connues les plus proches ainsi que les s\u00e9quences d&rsquo; acide amin\u00e9s semblables dans d&rsquo; autres esp\u00e8ces. Ces donn\u00e9es sont synth\u00e9tis\u00e9es sans deux ensembles distincts : la repr\u00e9sentation par paire, qui d\u00e9crit les positions et interactions relatives entre deux acides amin\u00e9s de la cha\u00eene, et la repr\u00e9sentation d&rsquo; alignement multi-s\u00e9quences (MSA) qui reprend un ensemble de s\u00e9quences d&rsquo; acides amin\u00e9s similaire \u00e0 ce qui est recherch\u00e9. Ces deux structures sont alors envoy\u00e9es au second module.<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img decoding=\"async\" src=\"https:\/\/artificiellementintelligent.wordpress.com\/wp-content\/uploads\/2024\/11\/image-20241103e.png\" alt=\"\" class=\"wp-image-1696\" \/><figcaption class=\"wp-element-caption\">Figure 5 : Architecture g\u00e9n\u00e9rale d&rsquo; Alphafold 3 (cr\u00e9dit : Eleana Simon &amp; Jake Silberg)<\/figcaption><\/figure>\n<\/div>\n\n\n<p class=\"wp-block-paragraph\">Le second module contitue le coeur du syst\u00e8me. Il s&rsquo; articule autour d&rsquo; un m\u00e9canisme d&rsquo; attention appel\u00e9 \u00ab\u00a0Pairformer\u00a0\u00bb semblable \u00e0 ce qui existe dans les mod\u00e8les de langage. Ce m\u00e9canisme va enrichir l&rsquo; information en combinant les donn\u00e9es contextuellement proches. Les deux structures (MSA et repr\u00e9sentation par paires) sont retravaill\u00e9es au cours de 48 \u00e9tapes successives pour \u00eatre finalement pr\u00e9sent\u00e9es \u00e0 l&rsquo; entr\u00e9e du module final.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Le module final va utiliser un algorithme de diffusion semblable aux g\u00e9n\u00e9rateurs d&rsquo; images pour it\u00e9rer vers la structure g\u00e9om\u00e9trique finale sur base des informations fournies par le <em>pairformer<\/em>, la diff\u00e9rence \u00e9tant qu&rsquo; au lieu de g\u00e9n\u00e9rer des pixels que base d&rsquo; un texte, le mod\u00e8le va g\u00e9n\u00e9rer une liste de positions tridimensionnelles pour chaque atome de la mol\u00e9cule sur base de la prepr\u00e9sentation par paires et de la MSA. Ce qui pr\u00e9c\u00e8de n&rsquo; est qu&rsquo; un tr\u00e8s bref survol du m\u00e9canisme, si cela vous int\u00e9resse une description beaucoup plus d\u00e9taill\u00e9e mais restant accessible est disponible <a href=\"https:\/\/elanapearl.github.io\/blog\/2024\/the-illustrated-alphafold\/\">ici<\/a>.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">4. Potentiel pharmaceutique et th\u00e9rapeutique<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">R\u00e9p\u00e9tons-le : le potentiel th\u00e9rapeutique d&rsquo; Alphafold est tr\u00e8s important. Google Deepmind ne s&rsquo;y est pas tromp\u00e9 puisqu&rsquo;il a lanc\u00e9 une spin-off appel\u00e9e <em>Isomorphic Labs<\/em> qui travaille avec le secteur pharmaceutique pour d\u00e9velopper de nouveaux m\u00e9dicaments.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">La grande nouveaut\u00e9 d&rsquo; AlphaFold3 par rapport \u00e0 Alphafold 2, c&rsquo; est qu&rsquo; il permet non seulement de pr\u00e9dire la structure des prot\u00e9ines, mais \u00e9galement leurs interactions avec d&rsquo; autres mol\u00e9cules comme l&rsquo; ADN ou de plus petites mol\u00e9cules appel\u00e9es <em>ligands<\/em>. Or de nombreux m\u00e9dicaments ne sont rien d&rsquo; autre que des ligands qui vont modifier l&rsquo; action de certaines prot\u00e9ines en se liant avec elles. La possibilit\u00e9 de mod\u00e9liser de telles interactions <em>in silico<\/em> devrait donc permettre d&rsquo; acc\u00e9l\u00e9rer l&rsquo; identification de nouveaux m\u00e9dicaments potentiels.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">M\u00eame logique pour les vaccins : pour cr\u00e9er un vaccin, il faut conna\u00eetre la structure en 3D de l&rsquo; agent pathog\u00e8ne pour identifier les r\u00e9gions susceptibles d&rsquo; \u00eatre reconnues par les anticorps de l&rsquo; organisme ce qui d\u00e9clenchera le m\u00e9canisme de r\u00e9ponse immunitaire. Vacciner signifie introduire dans l&rsquo; organisme des mol\u00e9cules inoffensives pr\u00e9sentant les m\u00eames structures mol\u00e9culaires afin d&rsquo; apprendre au syst\u00e8me immunitaire \u00e0 les reconna\u00eetre \u00e0 l&rsquo; avance. Or, avec Alphafold, il suffit de conna\u00eetre la s\u00e9quence g\u00e9n\u00e9tique du virus (son code ADN) pour conna\u00eetre sa forme tridimensionnelle, ce qui est nettement plus facile \u00e0 d\u00e9terminer.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Autre domaine d&rsquo; application: les maladies g\u00e9n\u00e9tiques et les cancers. Il s&rsquo; agit cette fois de d\u00e9terminer l&rsquo; impact d&rsquo; une variation dans la s\u00e9quence d&rsquo; acides amin\u00e9s sur la structure de la prot\u00e9ine et son fonctionnement. Cette prot\u00e9ine modifi\u00e9e peut soit \u00eatre h\u00e9rit\u00e9e (maladie g\u00e9n\u00e9tique) soit r\u00e9sulter de mutations (cancer) soit les deux. Il s&rsquo; agit d&rsquo; un domaine encore largement inexplor\u00e9 car la lourdeur des techniques traditionnelles rendait impossible l&rsquo; analyse du nombre \u00e9norme de variants possibles.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">L&rsquo; id\u00e9e est ici de pr\u00e9dire la dangerosit\u00e9 d&rsquo; un variant dont on conna\u00eet la s\u00e9quence ADN (qui peut ais\u00e9ment \u00eatre obtenue par s\u00e9quencage). Pour ce faire, Google Deepmind d\u00e9veloppe un autre programme appel\u00e9 <em>AlphaMissense<\/em>, une adaptation d&rsquo; Alphafold visant \u00e0 cat\u00e9goriser le risque introduit par un variant.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">5. Le probl\u00e8me inverse : le design de prot\u00e9ines<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Un point m\u00e9rite d&rsquo; \u00eatre soulev\u00e9 ici : si Alphafold a largement r\u00e9solu le probl\u00e8me \u00ab\u00a0direct\u00a0\u00bb de la pr\u00e9diction de la structure des prot\u00e9ines \u00e0 partir d&rsquo; une s\u00e9quence d&rsquo; acides amin\u00e9s, le probl\u00e8me inverse n&rsquo; est pas moins important. Le <em>design<\/em> de prot\u00e9ines consiste \u00e0 partir d&rsquo; une structure spatiale d\u00e9sir\u00e9e et \u00e0 chercher la s\u00e9quence d&rsquo; acides amin\u00e9s correspondante afin de pouvoir la faire fabriquer en s\u00e9rie par les cellules.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">R\u00e9soudre le probl\u00e8me direct nous aide \u00e0 comprendre le fonctionnement du vivant, mais r\u00e9soudre le probl\u00e8me inverse ouvrirait une bo\u00eete de Pandore : la construction de virus pathog\u00e8nes voire de cellules artificielles entrerait dans le champ du possible.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Le probl\u00e8me inverse n&rsquo; est pas r\u00e9solu mais il existe une voie de contournement: utiliser un mod\u00e8le direct comme Alphafold pour g\u00e9n\u00e9rer un tr\u00e8s grand nombre de structures, les stocker, puis utiliser un syst\u00e8me de recherche pour localiser la structure la plus proche de ce que l&rsquo; on cherche et en fournir la s\u00e9quence.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">C&rsquo;est ce qu&rsquo;a fait <em>Google Deepmind<\/em> en publiant les structures de 200 millions de prot\u00e9ines g\u00e9n\u00e9r\u00e9es par Alphafold. En effet, si la pr\u00e9diction de structure \u00e9tait difficile avant Aphafold, le probl\u00e8me du s\u00e9quen\u00e7age g\u00e9n\u00e9tique est r\u00e9solu depuis longtemps. Le nombre de s\u00e9quences ADN connues est donc bien plus important que celui des structures de prot\u00e9ines. Google Deepmind a simplement utilis\u00e9 son algorithme sur l&rsquo;ensemble des s\u00e9quences qui n&rsquo;avaient pas encore \u00e9t\u00e9 mod\u00e9lis\u00e9es en 3D (soit 99.9% du total)&#8230;.le r\u00e9sultat est accessible <a href=\"https:\/\/alphafold.ebi.ac.uk\/\">ici<\/a>.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">6. Risques<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Alphafold 3 est accessible au public <a href=\"https:\/\/golgi.sandbox.google.com\/\">ici<\/a>. Vous pouvez demander \u00e0 visualiser la structure d&rsquo; une prot\u00e9ine apr\u00e8s avoir fourni la s\u00e9quence d&rsquo; acides amin\u00e9s au format FASTA, et \u00e9ventuellement ajouter d&rsquo; autres \u00e9l\u00e9ments en interaction : ADN, ARN, ligands&#8230;<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Voici un exemple dans lequel j&rsquo; ai essay\u00e9 de voir l&rsquo; interaction entre deux prot\u00e9ines, un segment d&rsquo; ARN et deux ions Zinc. Les couleurs correspondent au niveau de confiance du mod\u00e8le comme indiqu\u00e9 sur la l\u00e9gende en haut de l&rsquo; image.<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img decoding=\"async\" src=\"https:\/\/artificiellementintelligent.wordpress.com\/wp-content\/uploads\/2024\/11\/image-20241103f.png\" alt=\"\" class=\"wp-image-1702\" \/><figcaption class=\"wp-element-caption\">Figure 6 : Exemple d&rsquo; utilisation d&rsquo; Alphafold 3<\/figcaption><\/figure>\n<\/div>\n\n\n<p class=\"wp-block-paragraph\">Le mod\u00e8le n&rsquo; est cependant pas open-source. Vous devez passer par les serveurs de Google Deepmind. Il y a une bonne raison \u00e0 cela en plus de l&rsquo; imp\u00e9ratif commercial : les virus sont eux aussi des assemblages de prot\u00e9ines. C&rsquo; est pourquoi le mod\u00e8le bloque la pr\u00e9diction structurales de certaines s\u00e9quences suspectes.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Il existe cependant d\u00e9j\u00e0 un programme concurrent \u00e0 Alphafold, appel\u00e9 RoseTTAFold, qui est librement t\u00e9l\u00e9chargeable sur Github <a href=\"https:\/\/github.com\/RosettaCommons\/RoseTTAFold\">ici<\/a>. Ses performance sont cependant inf\u00e9rieures \u00e0 Alphafold.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Tant que ces mod\u00e8les restent limit\u00e9s \u00e0 la pr\u00e9diction directe, le danger reste limit\u00e9. Mais si le probl\u00e8me inverse venait \u00e0 \u00eatre r\u00e9solu, le risque augmenterait consid\u00e9rablement&#8230;<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">7. Sources et r\u00e9f\u00e9rences<\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n<li><em>The Nobel prize in Chemistry 2024 : They cracked the code for proteins&rsquo; amazing structures<\/em>, communiqu\u00e9 de presse de l&rsquo; Acad\u00e9mie Royale Su\u00e9doise des Sciences, le 9 Octobre 2024 : <a href=\"https:\/\/www.nobelprize.org\/prizes\/chemistry\/2024\/press-release\/\">https:\/\/www.nobelprize.org\/prizes\/chemistry\/2024\/press-release\/<\/a><br><\/li>\n\n\n\n<li><em>Alphafold 3 predicts the structure and interactions of all of life&rsquo;s molecules<\/em>, par Isomorphic Labs le 5 ao\u00fbt 2024 : <a href=\"https:\/\/www.isomorphiclabs.com\/articles\/alphafold-3-predicts-the-structure-and-interactions-of-all-of-lifes-molecules\">https:\/\/www.isomorphiclabs.com\/articles\/alphafold-3-predicts-the-structure-and-interactions-of-all-of-lifes-molecules<\/a><br><\/li>\n\n\n\n<li> <em>The Royal Institute on AI : Understanding Alphafold<\/em>, interview avec Dame Janet Thornton : <a href=\"https:\/\/youtu.be\/lxgaILSZEbU?si=zugFYLwzXLHf8jF8\">https:\/\/youtu.be\/lxgaILSZEbU?si=zugFYLwzXLHf8jF8<\/a><br><\/li>\n\n\n\n<li><em>The Illustrated Alphafold: a visual walkthrough of the Alphafold3 architecture<\/em>, par Elana Simon &amp; Jake Goldber, le 10 juillet 2024 : <a href=\"https:\/\/elanapearl.github.io\/blog\/2024\/the-illustrated-alphafold\/\">https:\/\/elanapearl.github.io\/blog\/2024\/the-illustrated-alphafold\/<\/a><\/li>\n<\/ul>\n\n\n\n<p class=\"wp-block-paragraph\"><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Le prix Nobel de chimie 2024 a \u00e9t\u00e9 d\u00e9cern\u00e9 \u00e0 Demis Hassabis, John Jumper et David Baker pour leurs travaux sur AlphaFold 2. Ce programme r\u00e9volutionne la biologie en pr\u00e9disant la structure des prot\u00e9ines, un d\u00e9fi vieux de cinquante ans, avec des applications prometteuses dans la d\u00e9couverte de m\u00e9dicaments et la compr\u00e9hension des maladies.<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[3,5],"tags":[],"class_list":["post-1682","post","type-post","status-publish","format-standard","hentry","category-applications","category-conceptuel","post-preview"],"_links":{"self":[{"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/posts\/1682","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/comments?post=1682"}],"version-history":[{"count":0,"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/posts\/1682\/revisions"}],"wp:attachment":[{"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/media?parent=1682"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/categories?post=1682"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/tags?post=1682"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}