{"id":1042,"date":"2023-12-25T17:32:22","date_gmt":"2023-12-25T16:32:22","guid":{"rendered":"https:\/\/artificiellementintelligent.wordpress.com\/?p=1042"},"modified":"2023-12-25T17:32:22","modified_gmt":"2023-12-25T16:32:22","slug":"mistral-la-start-up-francaise-qui-fait-du-bruit","status":"publish","type":"post","link":"https:\/\/artificiellementintelligent.eu\/index.php\/2023\/12\/25\/mistral-la-start-up-francaise-qui-fait-du-bruit\/","title":{"rendered":"Mistral : la start-up fran\u00e7aise qui fait du bruit"},"content":{"rendered":"\n<p class=\"wp-block-paragraph\">Voici quelques semaines que la start-up fran\u00e7aise <em>Mistral<\/em> fait beaucoup parler d&rsquo; elle dans le monde de l&rsquo; IA g\u00e9n\u00e9rative.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Fond\u00e9e en mai 2023 par trois ing\u00e9nieurs venant de <em>Google Deepmind<\/em>, Mistral a d\u00e9j\u00e0 lev\u00e9 385 millions d&rsquo; euros de capitaux en six mois et est actuellement valoris\u00e9e \u00e0 environ 2 milliards d&rsquo; euros!<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Cette croissace effr\u00e9n\u00e9e positionne d&rsquo; ores et d\u00e9j\u00e0 Mistral comme un des acteurs majeurs du secteur et un concurrent s\u00e9rieux d&rsquo; OpenAI.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Mistral continue \u00e0 d\u00e9velopper ses mod\u00e8les et capacit\u00e9s, et pourrait bien jouer un r\u00f4le-cl\u00e9 dans le futur d\u00e9veloppement de l&rsquo; IA europ\u00e9enne. L&rsquo; approche <em>open-source<\/em> de l&rsquo; entreprise et son engagement \u00e9thique s&rsquo; alignent avec les pr\u00e9f\u00e9rences de nombreuses entreprises europ\u00e9ennes.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Le succ\u00e8s de Mistral est support\u00e9 par l&rsquo; existence d&rsquo; un \u00e9cosyst\u00e8me IA fran\u00e7ais qui ne cesse de se renforcer. La <em>French Tech<\/em> b\u00e9n\u00e9ficie en effet d&rsquo;un climat favorable : Xavier Niel a annonc\u00e9 en septembre des investissements strat\u00e9giques dans l&rsquo; IA estim\u00e9s \u00e0 environ 200 millions d&rsquo;euros. Ces investissements sont pour partie destin\u00e9s \u00e0 acheter des coprocesseurs graphiques (<em>GPU<\/em>) chez Nvidia afin de doter la soci\u00e9t\u00e9 de services <em>cloud<\/em> Scaleway de la puissance de calcul n\u00e9cessaire \u00e0 l&rsquo; IA et la mettre \u00e0 la disposition des <em>start-ups<\/em> europ\u00e9ennes.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Mais l&rsquo; argent et la puissance de calcul ne sont pas tout, il faut \u00e9galement une concentration de talents. En novembre, la cr\u00e9ation de <em>Kyutai<\/em> a \u00e9t\u00e9 annonc\u00e9e, un nouveau laboratoire de recherche IA bas\u00e9 \u00e0 Paris et b\u00e9n\u00e9ficiant de 300 millions d&rsquo; euros d&rsquo; investissement, \u00e0 la t\u00eate duquel se trouvent des pointures de l&rsquo; IA venant de Google et Meta. De fait, les laboratoires de recherche de Google Deepmind et de Meta, pr\u00e9sents dans la r\u00e9gion, constituent un r\u00e9servoir de talents qui va pouvoir irriguer les nouvelles entreprises.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">De son c\u00f4t\u00e9, <em>Station F<\/em>, un des plus grands incubateurs de start-ups technologiques au monde, se trouve \u00e9galement \u00e0 Paris, accompagne les premiers pas des jeunes pousses et joue un r\u00f4le f\u00e9d\u00e9rateur, \u00e0 travers notamment des \u00e9v\u00e9nements comme <em>AI-Pulse<\/em>.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Tout ceci signifie que la France commence \u00e0 s\u00e9rieusement concurrencer la Grande-Bretagne, jusqu&rsquo; ici acteur dominant de l&rsquo; IA europ\u00e9enne.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Il faut mentionner ce d\u00e9veloppement positif : on entend souvent parler de <em>start-ups<\/em> europ\u00e9ennes qui partent se d\u00e9velopper aux USA lorsque leurs besoins en capitaux augmentent, mais l&rsquo; inverse commence aussi \u00e0 se produire : la soci\u00e9t\u00e9 am\u00e9ricaine <em>Poolside AI<\/em> a d\u00e9cid\u00e9 de d\u00e9m\u00e9nager \u00e0 Paris, attir\u00e9e notamment par des co\u00fbts salariaux moins exorbitants qu&rsquo; aux Etats-Unis&#8230;<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Mod\u00e8les Mistral disponibles<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Voyons maintenant un peu plus en d\u00e9tail les mod\u00e8les publi\u00e9s par Mistral. Il y en a trois, appel\u00e9s <em>Mistral-7B<\/em>, <em>Mixtral-8x7B<\/em> et <em>Mistral-Medium<\/em>, par ordre de puissance croissante.<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><em>Mistral-7B<\/em> ne converse qu&rsquo; en Anglais et comporte 7 milliards de param\u00e8tres, ce qui le rend ex\u00e9cutable localement sur la plupart des ordinateurs actuels. Ce mod\u00e8le est disponible librement en <em>open-source<\/em>.<br><\/li>\n\n\n\n<li><em>Mixtral-8x7B<\/em> comprend l&rsquo;Anglais, le Fran\u00e7ais, l&rsquo;Allemand, l&rsquo;Italien et l&rsquo;Espagnol. Son architecture est appel\u00e9e \u00ab\u00a0mixture d&rsquo; experts\u00a0\u00bb. Ce mod\u00e8le est aussi disponible en <em>open-source<\/em>. mais vu sa taille, seules des machines sp\u00e9cialis\u00e9es peuvent le faire fonctionner.<br><\/li>\n\n\n\n<li><em>Mistral-medium<\/em> : il s&rsquo;agit d&rsquo;une version am\u00e9lior\u00e9e de <em>Mixtral-8x7B<\/em> avec la m\u00eame architecture de base. Mistral d\u00e9clare que ses performances sont proches de GPT-4 et qu&rsquo;il excelle dans les t\u00e2ches de programmation. Ce mod\u00e8le n&rsquo;est pas disponible en open-source, il faut demander acc\u00e8s (payant) via l&rsquo;interface de programmation Mistral.<\/li>\n<\/ul>\n\n\n\n<p class=\"wp-block-paragraph\">L&rsquo; architecture de type <em>Mixture of Experts<\/em> utilis\u00e9e par <em>Mixtral-8x7B<\/em> comprend 8 groupes distincts de param\u00e8tres, plus un bloc de supervision qui n&rsquo; active que les deux groupes les plus pertinents lors du passage \u00e0 travers chaque couche du mod\u00e8le, puis les recombine ensuite. Cette approche innovante permet au mod\u00e8le, qui compte 46,7 milliards de param\u00e8tres, de n&rsquo; exiger \u00ab\u00a0que\u00a0\u00bb la puissance de calcul d&rsquo; un mod\u00e8le de 13 milliards de param\u00e8tres. La g\u00e9n\u00e9ration est donc acc\u00e9l\u00e9r\u00e9e d&rsquo; un facteur 3,5 environ. On soup\u00e7onne d&rsquo; ailleurs que GPT-4 -dont l&rsquo;architecture n&rsquo; a pas \u00e9t\u00e9 publi\u00e9e- utilise lui aussi un mod\u00e8le de ce type, les rumeurs faisant \u00e9tat de 8 experts de 220 milliards de param\u00e8tres chacun (soit 1,7 trillions de param\u00e8tres au total).<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Une grande partie de l&rsquo; engouement pour Mistral provient de la performance de ces mod\u00e8les par rapport \u00e0 leur taille. Vous pouvez voir que <em>Mixtral-8x7B<\/em> est tr\u00e8s bien positionn\u00e9 dans le classement r\u00e9alis\u00e9 par <em>HuggingFace<\/em> :<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img decoding=\"async\" src=\"https:\/\/artificiellementintelligent.wordpress.com\/wp-content\/uploads\/2023\/12\/image-20231224a.png\" alt=\"\" class=\"wp-image-1045\" \/><figcaption class=\"wp-element-caption\">Figure 1 : Classement des LLM selon HuggingFace Chatbot Arena Leaderboard<\/figcaption><\/figure>\n<\/div>\n\n\n<p class=\"wp-block-paragraph\">J&rsquo;expliquerai dans un prochain article comment faire fonctionner des mod\u00e8les localement, mais en attendant, vous pouvez essayer les trois mod\u00e8les de Mistral sur l&rsquo; interface web de <em>Perplexity.ai<\/em> accessible <a href=\"https:\/\/labs.perplexity.ai\/\">ici<\/a>.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Il vous suffit de choisir le mod\u00e8le d\u00e9sir\u00e9 via le menu d\u00e9roulant dans le coin inf\u00e9rieur droit (qui permet aussi de choisir d&rsquo; autres mod\u00e8les, les noms d\u00e9butant par <em>pplx<\/em> correspondent \u00e0 ceux d\u00e9velopp\u00e9s par <em>Perplexity.ai<\/em>).<\/p>\n","protected":false},"excerpt":{"rendered":"<p>La start-up fran\u00e7aise Mistral, fond\u00e9e en mai 2023 par trois anciens ing\u00e9nieurs de Google Deepmind, a d\u00e9j\u00e0 lev\u00e9 385 millions d&rsquo;euros, valoris\u00e9e \u00e0 environ 2 milliards d&rsquo;euros. Elle est en concurrence avec OpenAI et contribue au d\u00e9veloppement de l&rsquo;IA europ\u00e9enne. Mistral propose trois mod\u00e8les, dont Mixtral-8x7B, bien positionn\u00e9 dans le classement r\u00e9alis\u00e9 par HuggingFace Chatbot Arena Leaderboard.<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[6],"tags":[],"class_list":["post-1042","post","type-post","status-publish","format-standard","hentry","category-ecosysteme","post-preview"],"_links":{"self":[{"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/posts\/1042","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/comments?post=1042"}],"version-history":[{"count":0,"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/posts\/1042\/revisions"}],"wp:attachment":[{"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/media?parent=1042"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/categories?post=1042"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/tags?post=1042"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}