{"id":826,"date":"2023-10-11T15:46:33","date_gmt":"2023-10-11T13:46:33","guid":{"rendered":"https:\/\/artificiellementintelligent.wordpress.com\/?p=826"},"modified":"2023-10-11T15:46:33","modified_gmt":"2023-10-11T13:46:33","slug":"l-ecosysteme-de-l-ia-generative","status":"publish","type":"post","link":"https:\/\/artificiellementintelligent.eu\/index.php\/2023\/10\/11\/l-ecosysteme-de-l-ia-generative\/","title":{"rendered":"L&rsquo; \u00e9cosyst\u00e8me de l&rsquo; IA g\u00e9n\u00e9rative"},"content":{"rendered":"\n<p class=\"wp-block-paragraph\">Apr\u00e8s avoir fait le tour d&rsquo; horizon des acteurs dans le pr\u00e9c\u00e9dent article, j&rsquo; ai pens\u00e9 qu&rsquo; il serait int\u00e9ressant d&rsquo; expliquer un peu plus en d\u00e9tail la cha\u00eene de valeur du secteur et de positionner chacun des acteurs \u00e0 sa juste place. Ceci est \u00e9galement une occasion de parler d&rsquo; autres intervenants dont le nom est moins souvent \u00e9voqu\u00e9 tout simplement parce qu&rsquo; ils ne s&rsquo; adressent pas aux utilisateurs finaux.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Le secteur de l&rsquo; IA faisant partie du secteur de l&rsquo; industrie logicielle et on peut prendre pour point de d\u00e9part une cha\u00eene de valeur logicielle assez g\u00e9n\u00e9rique :<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">1. <em><strong>Applications orient\u00e9es utilisateur <\/strong><\/em>: ce sont les produits qui sont accessibles aux utilisateurs finaux, comme le site web de chatGPT. Ceux-ci peuvent \u00eatre accessibles sur le web ou via une interface utilisateur plus traditionnelle.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">2. <em><strong>Mod\u00e8les<\/strong><\/em> : Les mod\u00e8les contiennent la logique et les algorithmes essentiels au coeur de l&rsquo; application. Ils sont souvent s\u00e9par\u00e9s des applications utilisateur et \u00e9changent des informations avec ces derni\u00e8res via des interfaces de programmation (API). Les mod\u00e8les re\u00e7oivent des demandes de traitement des applications utilisateur et renvoient le r\u00e9sultat du traitement. Dans une application de <em>chat<\/em>, c&rsquo; est assez simple \u00e0 imaginer: l&rsquo; applicatif envoie votre prompt au mod\u00e8le qui renvoie sa r\u00e9ponse \u00e0 l&rsquo; applicatif.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">3. <em><strong>Infrastructure<\/strong><\/em> : il s&rsquo; agit ici des soci\u00e9t\u00e9s qui mettent \u00e0 disposition l&rsquo; infrastructure d\u00e9mat\u00e9rialis\u00e9e (cloud) pour faire fonctionner les deux couches sup\u00e9rieures. Cette infrastructure se comporte d&rsquo; \u00e9l\u00e9ments de connectivit\u00e9 r\u00e9seau, de serveurs, de puissance de calcul, de m\u00e9moire et d&rsquo; \u00e9quipements de stockage. Pour une soci\u00e9t\u00e9, le grand avantage du cloud est que l&rsquo; exploitation est pay\u00e9e \u00e0 l&rsquo; utilisation au lieu de n\u00e9cessiter un gros investissement initial. Ce m\u00e9canisme est aussi tr\u00e8s flexible car la capacit\u00e9 de l&rsquo; infrastructure peut grandir en phase avec le succ\u00e8s de l&rsquo; application, et donc les co\u00fbts \u00e9volueront avec les revenus.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">1. La cha\u00eene de valeur de l&rsquo;IA g\u00e9n\u00e9rative<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Voyons maintenant comment cette cha\u00eene de valeur s&rsquo; articule plus sp\u00e9cifiquement dans le cas de l&rsquo; IA g\u00e9n\u00e9rative :<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img decoding=\"async\" src=\"https:\/\/artificiellementintelligent.wordpress.com\/wp-content\/uploads\/2023\/10\/image-20231008a.png\" alt=\"\" class=\"wp-image-829\" \/><figcaption class=\"wp-element-caption\">Figure 1 : Cha\u00eene de valeur de l&rsquo;IA g\u00e9n\u00e9rative<\/figcaption><\/figure>\n<\/div>\n\n\n<p class=\"wp-block-paragraph\">Analysons maintenant les couches une \u00e0 une.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">2. La couche infrastructure<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Commen\u00e7ons par la base. L&rsquo; ex\u00e9cution des mod\u00e8les g\u00e9n\u00e9ratifs fait appel \u00e0 beaucoup de puissance de calcul. Les fonderies de silicium produisent des circuits int\u00e9gr\u00e9s sp\u00e9cialis\u00e9s dans les calculs vectoriels qui sont \u00e0 la base des mod\u00e8les g\u00e9n\u00e9ratifs. Une soci\u00e9t\u00e9 domine le march\u00e9 : <em>Nvidia<\/em>, qui fournit toute une famille de coprocesseurs graphiques dont les mod\u00e8les les plus puissants (A100, H100) se vendent comme des petits pains et co\u00fbtent entre 10.000 et 30.000$ pi\u00e8ce ! Les diff\u00e9rents acteurs de l&rsquo; IA g\u00e9n\u00e9rative se battent pour mettre la main sur ces processeurs dont la demande d\u00e9passe de loin l&rsquo; offre, d&rsquo; autant plus que le secteur des supercalculateurs en est \u00e9galement gros consommateur.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Le grand avantage de Nvidia est d&rsquo; avoir mis au point depuis de nombreuses ann\u00e9es (et donc bien avant l&rsquo; engouement actuel pour l&rsquo; IA) un environnement de programmation de ses coprocesseurs, qui est parfaitement int\u00e9gr\u00e9 dans les grandes biblioth\u00e8ques de programmation d&rsquo; IA g\u00e9n\u00e9rative : <em>JAX<\/em>, <em>Tensorflow<\/em> ou encore <em>Pytorch<\/em>. Tout mod\u00e8le d\u00e9fini au moyen de ces biblioth\u00e8ques pourra \u00eatre ex\u00e9cut\u00e9 sur les coprocesseurs graphiques disponibles de mani\u00e8re quasi-transparente.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Si Nvidia est clairement l&rsquo; acteur dominant, il faut aussi citer son \u00e9ternel rival <em>AMD<\/em>. Quant \u00e0 <em>Google<\/em>, il a d\u00e9velopp\u00e9 ses propres processeurs pour l&rsquo; IA (appel\u00e9s <em>TPU<\/em>);  Apple en fait de m\u00eame avec sa gamme de processeurs <em>Mx<\/em> qui contiennent un coprocesseur neuronal int\u00e9gr\u00e9 applel\u00e9 <em>neural engine<\/em>; des rumeurs indiquent que <em>Microsoft<\/em> d\u00e9veloppe en secret son propre coprocesseur actuellement d\u00e9nomm\u00e9 <em>Athena<\/em>. Ceci dans le but de s&rsquo; affranchir de la d\u00e9pendance \u00e0 Nvidia.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Parlons ensuite des fournisseurs de service d\u00e9mat\u00e9rialis\u00e9s (<em>cloud<\/em>). On y retrouve la plupart des g\u00e9ants de la tech avec des activit\u00e9s comme <em>Amazon Web Services<\/em>, <em>Microsoft Azure<\/em>, <em>IBM Cloud<\/em> ou encore <em>Google Cloud Platform<\/em> (GCP). Comme je l&rsquo; ai expliqu\u00e9 dans l&rsquo; introduction, ces derniers proposent aux entreprises informatiques une infrastructure d\u00e9mat\u00e9rialis\u00e9e, disponible et payable \u00e0 la demande. Et cette infrastructure contient naturellement des serveurs munis des fameux coprocesseurs graphiques que les fournisseurs de mod\u00e8les et d&rsquo; applications peuvent louer en fonction de leurs besoins. Et ceci explique pourquoi Google et Microsoft d\u00e9veloppent leurs propres coprocesseurs : pour les installer dans leurs propres <em>datacenters<\/em> et les proposer en location \u00e0 leurs clients sans \u00eate tributaire des livraisons de Nvidia.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">3. Les mod\u00e8les IA<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Nous arrivons maintenant \u00e0 la partie IA proprement dite : les mod\u00e8les. Et ici, nous avons deux cas \u00e0 distinguer : les mod\u00e8les propri\u00e9taires et les mod\u00e8les <em>open-source<\/em>.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Un mod\u00e8le propri\u00e9taire est un mod\u00e8le qui fonctionne en tant que bo\u00eete noire. Il est accessible de l&rsquo; ext\u00e9rieur mais vous n&rsquo; en connaissez pas le fonctionnement ou les param\u00e8tres et donc impossible de le dupliquer. La plupart des grands mod\u00e8les g\u00e9n\u00e9ralistes actuels (chatGPT, Claude, Bard) sont de ce type. Ceci est avantageux pour les soci\u00e9t\u00e9s qui ont d\u00e9velopp\u00e9 ces mod\u00e8les puisqu&rsquo; il permet une mon\u00e9tisation facile en rendant l&rsquo; acc\u00e8s payant, ce qui leur permet d&rsquo; amortir leurs frais d&rsquo; entra\u00eenement et d&rsquo; exploitation du mod\u00e8le dans le cloud.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">L&rsquo; autre grand cas de figure est l&rsquo; approche <em>open-source<\/em>. Dans ce cas, la soci\u00e9t\u00e9 qui d\u00e9veloppe le mod\u00e8le publie les donn\u00e9es n\u00e9cessaires \u00e0 son exploitation, soient son architecture et les param\u00e8tres du mod\u00e8le. N&rsquo; importe qui peut alors louer une infrastructure cloud (voire acheter des serveurs) et faire tourner le mod\u00e8le de mani\u00e8re autonome. <\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Ce sont les d\u00e9tails de la license open-source sous lequel est publi\u00e9 le mod\u00e8le qui vont d\u00e9terminer les limites permissibles de l&rsquo; exploitation de ce dernier. Est-ce que l&rsquo;utilisation commerciale est autoris\u00e9e ? Est-ce ce que la mise \u00e0 disposition \u00e0 des tiers est autoris\u00e9e&#8230; ? En th\u00e9orie, une licence purement open-source autorise toutes les utilisations l\u00e9gales du mod\u00e8le mais la pratique montre que les cr\u00e9ateurs de mod\u00e8les IA open-source ont tendance \u00e0 introduire des restrictions suppl\u00e9mentaires  pour ne pas se retrouver en concurrence avec leur propre mod\u00e8le&#8230;<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">La mon\u00e9tisation du mod\u00e8le open-source par son cr\u00e9ateur peut se faire par une exploitation directe, mais aussi indirectement gr\u00e2ce \u00e0 la notori\u00e9t\u00e9 que lui conf\u00e8re la publication du mod\u00e8le (surtout s&rsquo; il est performant) ainsi que des d\u00e9veloppements compl\u00e9mentaires qui seront r\u00e9alis\u00e9s gratuitement par la communaut\u00e9 sur le mod\u00e8le (milieu acad\u00e9mique, programmeurs open-source, autres soci\u00e9t\u00e9s&#8230;).<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Au rang des principaux mod\u00e8les open-source, on compte aujourd&rsquo; hui <a href=\"https:\/\/bigscience.huggingface.co\/blog\/bloom\">BLOOM<\/a>, <a href=\"https:\/\/ai.meta.com\/llama\/\">Llama <\/a> (Meta), <a href=\"https:\/\/www.mosaicml.com\/blog\/long-context-mpt-7b-8k\">MPT<\/a> (MosaicML), <a href=\"https:\/\/mistral.ai\/product\/\">Mistral<\/a>, <a href=\"https:\/\/falconllm.tii.ae\/\">Falcon<\/a> et <a href=\"https:\/\/stability.ai\/blog\/stability-ai-launches-the-first-of-its-stablelm-suite-of-language-models\">StableLM<\/a> (StabilityAI).<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Si les mod\u00e8les les plus puissants sont aujourd&rsquo; hui propri\u00e9taires, le dynamique qui accompagne le d\u00e9veloppement des mod\u00e8les open-source laisse \u00e0 penser que la situation pourrait s&rsquo; inverser \u00e0 l&rsquo; avenir.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">4. Les applications utilisateur<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Cette couche est relativement simple \u00e0 expliquer. Il s&rsquo; agit des applications avec lesquelles vous interagissez, via un site web ou une app sur un smartphones. Il peut s&rsquo; agir d&rsquo; applications assez complexes m\u00eame si, dans le cas des applications g\u00e9n\u00e9ratives, le traitement apport\u00e9 par ces applications utilisateur est souvent assez faible et se limite \u00e0 contextualiser le dialogue et le pr\u00e9senter dans une interface utilisateur conviviale. Notons que le site d&rsquo; OpenAI que vous utilisez pour acc\u00e9der \u00e0 chatGPT entre dans cette cat\u00e9gorie : il s&rsquo; agit d&rsquo; une interface assez simple qui va appeler le mod\u00e8le chatGPT, la seule particularit\u00e9 \u00e9tant ici que c&rsquo; est la m\u00eame soci\u00e9t\u00e9 qui d\u00e9ploie le mod\u00e8le et l&rsquo; application utilisateur.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">N\u00e9anmoins il est utile de bien identifier cette couche car m\u00eame si elle peut para\u00eetre \u00ab\u00a0l\u00e9g\u00e8re\u00a0\u00bb en terme de valeur ajout\u00e9e conceptuelle, elle poss\u00e8de une grande importance \u00e9conomique. De nombreuses start-ups n&rsquo; existent qu&rsquo; \u00e0 travers un site ou une app de ce type, judicieusement positionn\u00e9e vers un public sp\u00e9cifique, qui appellent des mod\u00e8les d\u00e9velopp\u00e9s par des tiers (comme openAI) via l&rsquo; interface de programmation.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Un dernier mot pour parler des applications int\u00e9gr\u00e9es. Il s&rsquo; agit de soci\u00e9t\u00e9s qui ont construit un ensemble monolithique reprenant \u00e0 la fois l&rsquo; interface utilisateur et le mod\u00e8le, mais sans que ce dernier soit accessible ind\u00e9pendamment via une API. C&rsquo; est le cas de <a href=\"https:\/\/www.midjourney.com\/home\/?callbackUrl=%2Fapp%2F\">Midjourney<\/a> (images IA) ou de <a href=\"https:\/\/runwayml.com\/\">RunwayML<\/a> (g\u00e9n\u00e9ration de vid\u00e9os).<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">5. Evolution<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Cette description de la cha\u00eene est appel\u00e9e \u00e0 \u00e9voluer, et on voit d\u00e9j\u00e0 plusieurs tendances s&rsquo; amorcer : si les grands mod\u00e8les g\u00e9n\u00e9ralistes (Claude, GPT&#8230;) occupent aujourd&rsquo; hui le devant de la sc\u00e8ne, ils risquent de se voir progressivement marginalis\u00e9s au profit de mod\u00e8les plus petits et plus sp\u00e9cialis\u00e9s, mais capables de fonctionner localement sur l&rsquo; ordinateur ou le t\u00e9l\u00e9phone de l&rsquo; utilisateur ce qui est tr\u00e8s avantageux en termes de confidentialit\u00e9 et de robustesse (pas besoin de r\u00e9seau).<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">La disponibilit\u00e9 de mod\u00e8les \u00ab\u00a0fondationnels\u00a0\u00bb en open-source facilite cette \u00e9volution puisque n&rsquo; importe qui peut partir d&rsquo; un de ces mod\u00e8les et le sp\u00e9cialiser via un entra\u00eenement compl\u00e9mentaire du mod\u00e8le appel\u00e9 affinage.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Une autre inconnue est le passage \u00e0 la multimodalit\u00e9. Si le traitement d&rsquo; images et de s\u00e9quences vid\u00e9o devient possible en temps r\u00e9el, le champ applicatif explose avec une pl\u00e9thore de nouvelles applications en conduite autonome, robotique, pilotage de drones, jeux vid\u00e9o, d\u00e9fense&#8230;<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">6. Notes et r\u00e9f\u00e9rences<\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n<li><em>Who owns the generative platform ?<\/em> , A16z : <a href=\"https:\/\/a16z.com\/who-owns-the-generative-ai-platform\/\">https:\/\/a16z.com\/who-owns-the-generative-ai-platform\/<\/a><br><\/li>\n\n\n\n<li><em>What&rsquo; s the big deal with Generative AI ? Is it the future or the present ?<\/em> , Jay Alammar : <a href=\"https:\/\/txt.cohere.com\/generative-ai-future-or-present\/\">https:\/\/txt.cohere.com\/generative-ai-future-or-present\/<\/a><br><\/li>\n\n\n\n<li><em>AI is Eating the World<\/em>, Jay Alammar : <a href=\"https:\/\/txt.cohere.com\/ai-is-eating-the-world\/\">https:\/\/txt.cohere.com\/ai-is-eating-the-world\/<\/a><br><\/li>\n\n\n\n<li><em>Meet the $10.000 Nvidia chip powering the race for A.I.<\/em>, CNBC : <a href=\"https:\/\/www.cnbc.com\/2023\/02\/23\/nvidias-a100-is-the-10000-chip-powering-the-race-for-ai-.html\">https:\/\/www.cnbc.com\/2023\/02\/23\/nvidias-a100-is-the-10000-chip-powering-the-race-for-ai-.html<\/a><br><\/li>\n\n\n\n<li><em>Nvidia H100 : are 550.000 GPU enough for this year ?<\/em>, HPCWire : <a href=\"https:\/\/www.hpcwire.com\/2023\/08\/17\/nvidia-h100-are-550000-gpus-enough-for-this-year\/\">https:\/\/www.hpcwire.com\/2023\/08\/17\/nvidia-h100-are-550000-gpus-enough-for-this-year\/<\/a><br><\/li>\n\n\n\n<li><em>Microsoft set to reveal own AI chip<\/em>, EENews Europe : <a href=\"https:\/\/www.eenewseurope.com\/en\/report-microsoft-set-to-reveal-own-ai-chip\/\">https:\/\/www.eenewseurope.com\/en\/report-microsoft-set-to-reveal-own-ai-chip\/<\/a><br><\/li>\n\n\n\n<li><em>Google Gemini Eats the world<\/em>, Dylan Patel &amp; Daniel Nishball : <a href=\"https:\/\/www.semianalysis.com\/p\/google-gemini-eats-the-world-gemini\">https:\/\/www.semianalysis.com\/p\/google-gemini-eats-the-world-gemini<\/a><\/li>\n<\/ul>\n\n\n\n<p class=\"wp-block-paragraph\"><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Apr\u00e8s un tour d&rsquo;horizon des acteurs du secteur de l&rsquo;IA, expliquons en d\u00e9tail la cha\u00eene de valeur. Des acteurs sp\u00e9cifiques sont positionn\u00e9s \u00e0 leur juste place, r\u00e9v\u00e9lant une comp\u00e9tition intense. La puissance de calcul n\u00e9cessaire est notamment fournie par certaines entreprises telles que Nvidia. Les mod\u00e8les sont diff\u00e9renci\u00e9s entre propri\u00e9taires et open-source, avec des acteurs de premier plan tels que BLOOM et Llama. Les applications utilisateur, qu&rsquo;elles soient en ligne ou int\u00e9gr\u00e9es, jouent un r\u00f4le \u00e9conomique crucial. Enfin, l&rsquo;\u00e9volution du secteur se dessine avec une tendance vers des mod\u00e8les plus petits et sp\u00e9cialis\u00e9s ainsi que vers la multimodalit\u00e9.<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[6],"tags":[],"class_list":["post-826","post","type-post","status-publish","format-standard","hentry","category-ecosysteme","post-preview"],"_links":{"self":[{"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/posts\/826","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/comments?post=826"}],"version-history":[{"count":0,"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/posts\/826\/revisions"}],"wp:attachment":[{"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/media?parent=826"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/categories?post=826"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/tags?post=826"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}