{"id":1809,"date":"2024-12-22T16:28:16","date_gmt":"2024-12-22T15:28:16","guid":{"rendered":"https:\/\/artificiellementintelligent.wordpress.com\/?p=1809"},"modified":"2024-12-22T16:28:16","modified_gmt":"2024-12-22T15:28:16","slug":"les-modeles-raisonneurs","status":"publish","type":"post","link":"https:\/\/artificiellementintelligent.eu\/index.php\/2024\/12\/22\/les-modeles-raisonneurs\/","title":{"rendered":"Les mod\u00e8les raisonneurs"},"content":{"rendered":"\n<p class=\"wp-block-paragraph\">Le mod\u00e8le o1 d&rsquo; <em>OpenAI<\/em> est maintenant disponible et il repr\u00e9sente un changement important dans le fonctionnement et les capacit\u00e9s des mod\u00e8les de langage.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">La mise \u00e0 disposition de ce mod\u00e8le fait suite \u00e0 des rumeurs persistantes autour d&rsquo; un mod\u00e8le \u00ab\u00a0disruptif\u00a0\u00bb d\u00e9velopp\u00e9 en secret par OpenAI d&rsquo; abord appel\u00e9 <em>Q-star<\/em> puis <em>Strawberry<\/em>. Ces mod\u00e8les sont importants parce qu&rsquo; ils constituent une tentative de transition de la r\u00e9flexion imm\u00e9diate et intuitive vers un raisonnement plus lent et plus d\u00e9lib\u00e9r\u00e9.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Cette dualit\u00e9 se retrouve dans les modes de fonctionnement de notre cerveau. Comme l&rsquo; a indiqu\u00e9 le psychologue Daniel Kahnemann dans son livre <em>Thinking, Fast and Slow<\/em>, nos pens\u00e9es proc\u00e8dent selon deux sch\u00e9mas diff\u00e9rents :<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Le <strong>Syst\u00e8me 1 <\/strong>est une r\u00e9ponse rapide, automatique, inconsciente et \u00e9motionnelle de notre cerveau \u00e0 des situations et \u00e0 des stimuli. Il peut s&rsquo; agir de lire distraitement un texte sur un panneau d&rsquo; affichage, de savoir nouer ses lacets sans r\u00e9fl\u00e9chir ou de sauter instinctivement par-dessus une flaque d&rsquo; eau sur le trottoir. Nous fonctionnons 95% du temps dans ce mode, qui correspond au mode par d\u00e9faut et automatique de notre cerveau.<br><\/li>\n\n\n\n<li>Le<strong> Syst\u00e8me 2 <\/strong>est un mode lent, laborieux et logique dans lequel notre cerveau op\u00e8re pour r\u00e9soudre des probl\u00e8mes plus compliqu\u00e9s. Par exemple, la pens\u00e9e du syst\u00e8me 2 est utilis\u00e9e pour chercher un ami dans une foule, garer son v\u00e9hicule dans un espace restreint ou d\u00e9terminer le rapport qualit\u00e9\/prix de son repas \u00e0 emporter. Il s&rsquo; agit d&rsquo;un m\u00e9canisme de raisonnement logique activ\u00e9 d\u00e9lib\u00e9r\u00e9ment et consciemment.<\/li>\n<\/ul>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img decoding=\"async\" src=\"https:\/\/artificiellementintelligent.wordpress.com\/wp-content\/uploads\/2024\/12\/image-20241220a.png\" alt=\"\" class=\"wp-image-1812\" \/><figcaption class=\"wp-element-caption\">Figure 1 : Les deux mod\u00e8les de fonctionnement du cerveau (source : Daniel Kahnemann)<\/figcaption><\/figure>\n<\/div>\n\n\n<p class=\"wp-block-paragraph\">Or, disposer de mod\u00e8les capables de fonctionner selon le syst\u00e8me 2 est essentiel pour pouvoir \u00e9voluer vers des agents IA plus fiables et plus autonomes, comme je l&rsquo; avais expliqu\u00e9 dans un article pr\u00e9c\u00e9dent accessible <a href=\"https:\/\/artificiellementintelligent.wordpress.com\/2024\/12\/01\/cinq-etapes-vers-l-intelligence-artificielle-generale\/\">ici<\/a>: les mod\u00e8les \u00ab\u00a0raisonneurs\u00a0\u00bb sont une \u00e9tape importante vers l&rsquo; Intelligence Artificielle G\u00e9n\u00e9rale.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Pour faire simple, OpenAI a appris \u00e0 un mod\u00e8le de langage \u00e0 r\u00e9fl\u00e9chir avant de parler. Voyons comment.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">1. M\u00e9canismes de raisonnement<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Nous ne savons pas pr\u00e9cis\u00e9ment comment OpenAI a entra\u00een\u00e9 le mod\u00e8le o1. N\u00e9amnoins, les grands principes de l&rsquo; approche sont connus. Trois phases successives vont transformer un mod\u00e8le de langage classique comme GPT-4o vers un mod\u00e8le de raisonnement comme o1.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Lors de la <strong>premi\u00e8re phase<\/strong>, le mod\u00e8le \u00ab\u00a0classique\u00a0\u00bb est confront\u00e9 \u00e0 une s\u00e9rie de probl\u00e8mes logiques et il lui est demand\u00e9 de d\u00e9velopper son raisonnement \u00e9tape par \u00e9tape avant d&rsquo; arriver \u00e0 la solution. Il s&rsquo; agit d&rsquo; une m\u00e9thode de <em>prompt engineering<\/em> appel\u00e9e <em>Chain of Thought prompting (CoT)<\/em> et d\u00e9crit <a href=\"https:\/\/www.prompthub.us\/blog\/chain-of-thought-prompting-guide\">ici<\/a>. En transformant la question en un ensemble d&rsquo; \u00e9tapes de raisonnement de plus faible complexit\u00e9, on augmente la probabilit\u00e9 que le mod\u00e8le ait \u00e9t\u00e9 confront\u00e9 lors de son entra\u00eenement \u00e0 des d\u00e9ductions \u00e9lementaires analogues et qu&rsquo; il puisse donc effectuer les sauts logiques correspondants par corr\u00e9lation.<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img decoding=\"async\" src=\"https:\/\/artificiellementintelligent.wordpress.com\/wp-content\/uploads\/2024\/12\/image-20241220b.webp\" alt=\"\" class=\"wp-image-1818\" \/><figcaption class=\"wp-element-caption\">Figure 2 : Chain of Thought Prompting (source : Wei et al., 2022)<\/figcaption><\/figure>\n<\/div>\n\n\n<p class=\"wp-block-paragraph\">Une fois ces cha\u00eenes g\u00e9n\u00e9r\u00e9es, elles sont \u00e9valu\u00e9es en fonction de leur pertinence tant au niveau de la r\u00e9ponse finale que du chemin logique suivi pour y parvenir. L&rsquo; \u00e9valuation peut \u00eatre faite \u00e0 la main (fastidieux) ou de mani\u00e8re automatis\u00e9e. En pratique, on va d\u00e9buter par une s\u00e9rie d&rsquo; \u00e9valuations faites \u00e0 la main pour entra\u00eener un mod\u00e8le d&rsquo; \u00e9valuation automatique, s\u00e9par\u00e9 du mod\u00e8le de langage, qui prendra ensuite le relais et rendra le processus beaucoup plus efficace.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Lors de la <strong>seconde phase<\/strong>, les cha\u00eenes logiques g\u00e9n\u00e9r\u00e9es lors de la premi\u00e8re phase ainsi que leurs scores de pertinence sont utilis\u00e9s pour entra\u00eener le mod\u00e8le (affinage) afin de privil\u00e9gier les cha\u00eenes qui obtiennent la bonne r\u00e9ponse et d\u00e9favoriser celles qui \u00e9chouent. A l&rsquo; issue de cet affinage, nous disposons d&rsquo;un mod\u00e8le am\u00e9lior\u00e9 qui cherchera \u00e0 r\u00e9pondre par \u00e9tapes logiques \u00e0 toute question de l&rsquo;utilisateur, ce qui constitue d\u00e9j\u00e0 un grand pas dans la bonne direction.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Cependant, \u00e0 ce stade, le mod\u00e8le reste un mod\u00e8le de langage \u00ab\u00a0classique\u00a0\u00bb: il g\u00e9n\u00e8re une cha\u00eene de raisonnement unique -certes am\u00e9lior\u00e9e- au fil de sa g\u00e9n\u00e9ration textuelle et pr\u00e9sente ensuite le r\u00e9sultat \u00e0 l&rsquo; utilisateur quelle qu&rsquo; en soit la pertinence. L&rsquo; effort d\u00e9ploy\u00e9 par le mod\u00e8le reste aussi le m\u00eame quelle que soit la complexit\u00e9 de la question, ce qui n&rsquo; est pas id\u00e9al&#8230;<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">C&rsquo; est ici qu&rsquo; intervient la <strong>troisi\u00e8me phase<\/strong>. Cette derni\u00e8re a lieu non pas lors de l&rsquo; entra\u00eenement mais lors de l&rsquo; inf\u00e9rence, c&rsquo; est \u00e0 dire quand l&rsquo; utilisateur pose une question au mod\u00e8le.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Et l&rsquo;id\u00e9e de base est simple: comme les mod\u00e8les de langage sont par nature al\u00e9atoires, rien n&rsquo; emp\u00eache de leur demander de g\u00e9n\u00e9rer plusieurs cha\u00eenes de raisonnement compl\u00e8tes en r\u00e9ponse \u00e0 chaque question et de ne pr\u00e9senter que la plus pertinente (et nous disposons pour cela du mod\u00e8le d&rsquo; \u00e9valuation). Au plus le nombre de g\u00e9n\u00e9rations est \u00e9lev\u00e9, au plus la r\u00e9ponse choisie a de chances d&rsquo; \u00eatre de qualit\u00e9, au prix d&rsquo; une plus grande consommation en ressources.<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img decoding=\"async\" src=\"https:\/\/artificiellementintelligent.wordpress.com\/wp-content\/uploads\/2024\/12\/image-20241220c.png\" alt=\"\" class=\"wp-image-1821\" \/><figcaption class=\"wp-element-caption\">Figure 3 : Cha\u00eenes de raisonnement multiples (source : Besta et al., 2023)<\/figcaption><\/figure>\n<\/div>\n\n\n<p class=\"wp-block-paragraph\">Il est imaginable de faire mieux encore et d&rsquo; utiliser des algorithmes de recherche dans l&rsquo; arbre des raisonnements possibles pour \u00ab\u00a0orienter\u00a0\u00bb la recherche de la r\u00e9ponse vers la voie la plus prometteuse en cours de raisonnement, mais en restant exhaustif dans l&rsquo; \u00e9valuation des diff\u00e9rentes branches. Des algorithmes d&rsquo; apprentissage par renforcement comme <em>Monte Carlo Tree Search<\/em> peuvent \u00eatre utilis\u00e9s \u00e0 cet effet. L&rsquo; id\u00e9e est fascinante et on ne sait pas si de telles techniques sont d\u00e9j\u00e0 exploit\u00e9es par OpenAI pour le mod\u00e8le o1&#8230;<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img decoding=\"async\" src=\"https:\/\/artificiellementintelligent.wordpress.com\/wp-content\/uploads\/2024\/12\/image-20241220d-1.png\" alt=\"\" class=\"wp-image-1824\" \/><figcaption class=\"wp-element-caption\">Figure 4 : L&rsquo;algorithme Monte Carlo Tree Search (source : Jokub Kowalski et al., 2024)<\/figcaption><\/figure>\n<\/div>\n\n\n<p class=\"wp-block-paragraph\">Malheureusement, OpenAI ne permet pas \u00e0 l&rsquo; utilisateur de voir les multiples traces de raisonnement du mod\u00e8le, et avance pour cela des raisons d&rsquo; avantage comp\u00e9titif. On ne sait donc pas exactement jusqu&rsquo;o\u00f9 OpenAI est all\u00e9 dans cette approche, mais chercher de mani\u00e8re plus ou moins exhaustive le meilleur raisonnement pendant la phase d&rsquo; ex\u00e9cution permet de s&rsquo; affranchir de la limite de l&rsquo; entra\u00eenement : il suffit de chercher plus longtemps, plus profond\u00e9ment dans l&rsquo; arbre des raisonnements possibles pour obtenir une meilleure r\u00e9ponse.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">C&rsquo; est d&rsquo; ailleurs comme cela que o1-pro semble fonctionner : le mod\u00e8le est le m\u00eame qu&rsquo; o1 mais il va fouiller plus profond\u00e9ment dans l&rsquo;arbre des raisonnements, ce qui consomme bien s\u00fbr de la puissance de calcul et justifie le prix plus \u00e9lev\u00e9&#8230;<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">2. Evaluation<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">L&rsquo; explication ci-dessus laisse quelques points en suspens; il faut notamment disposer d&rsquo; un m\u00e9canisme d&rsquo; \u00e9valuation automatique pour d\u00e9terminer si une cha\u00eene de raisonnement est pertinente ou non. Le probl\u00e8me est que dans beaucoup de domaines, la pertinence ou non d&rsquo; un raisonnement est subjective et donc difficilement automatisable.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">C&rsquo; est pourquoi il est fort probable que l&rsquo; entra\u00eenement au raisonnement ait \u00e9t\u00e9 effectu\u00e9 sur des domaines o\u00f9 les raisonnements peuvent \u00eatre \u00e9valu\u00e9s de mani\u00e8re objective, \u00e0 savoir les sciences exactes, et en particulier les math\u00e9matiques et l&rsquo; informatique.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">C&rsquo; est d&rsquo; ailleurs ce qui ressort des \u00ab\u00a0benchmarks\u00a0\u00bb de performance publi\u00e9s par OpenAI qui indiquent que les performances du mod\u00e8le o1 sont tr\u00e8s sup\u00e9rieures \u00e0 celles de GPT-4o dans les t\u00e2ches math\u00e9matiques, dans la programmation et dans les questions de sciences exactes :<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img decoding=\"async\" src=\"https:\/\/artificiellementintelligent.wordpress.com\/wp-content\/uploads\/2024\/12\/image-20241220e.png\" alt=\"\" class=\"wp-image-1826\" \/><figcaption class=\"wp-element-caption\">Figure 5 : Performance de gpt4o et o1 dans les domaines formels (source : OpenAI)<\/figcaption><\/figure>\n<\/div>\n\n\n<p class=\"wp-block-paragraph\">Par contre, dans les domaines plus subjectifs comme la r\u00e9daction de texte, les mod\u00e8les de la famille o1 ne sont pas meilleurs que gpt-4o. Il n&rsquo; y a donc pas lieu de recourir \u00e0 o1 pour ce genre de t\u00e2ches.<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img decoding=\"async\" src=\"https:\/\/artificiellementintelligent.wordpress.com\/wp-content\/uploads\/2024\/12\/image-20241220f.png\" alt=\"\" class=\"wp-image-1828\" \/><figcaption class=\"wp-element-caption\">Figure 6 : Performance compar\u00e9e de gpt4o et o1 (source : OpenAI)<\/figcaption><\/figure>\n<\/div>\n\n\n<h2 class=\"wp-block-heading\">3. Accessibilit\u00e9 des mod\u00e8les o1<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Passons maintenant \u00e0 la partie pratique : OpenAI a mis \u00e0 disposition une premi\u00e8re version appel\u00e9e \u00ab\u00a0o1-preview\u00a0\u00bb \u00e0 la mi-septembre, qui a \u00e9t\u00e9 remplac\u00e9e d\u00e9but d\u00e9cembre par le mod\u00e8le d\u00e9finitif \u00ab\u00a0o1\u00a0\u00bb. Celui-ci est accessible en trois versions:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>la version de base \u00ab\u00a0<strong>o1<\/strong>\u00ab\u00a0;<\/li>\n\n\n\n<li>une version all\u00e9g\u00e9e appel\u00e9e \u00ab\u00a0<strong>o1-mini<\/strong>\u00ab\u00a0;<\/li>\n\n\n\n<li>et enfin une version plus puissante appel\u00e9e \u00ab\u00a0<strong>o1-pro<\/strong>\u00ab\u00a0.<\/li>\n<\/ul>\n\n\n\n<p class=\"wp-block-paragraph\">Cependant, l&rsquo; accessibilit\u00e9 aux mod\u00e8les de la famille o1 est fortement d\u00e9pendante de l&rsquo; abonnement auquel l&rsquo; utilisateur a souscrit : tout d&rsquo;abord, les utilisateurs gratuits n&rsquo; ont pas acc\u00e8s aux mod\u00e8les de la famille o1.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Les utilisateurs payant l&rsquo; abonnement ChatGPT+ peuvent acc\u00e9der \u00e0 o1-mini et o1 mais avec des volumes d&rsquo; utilisation limit\u00e9s \u00e0 50 messages par semaine pour o1 et 50 messages par jour pour o1-mini (d&rsquo; o\u00f9 l&rsquo; int\u00e9r\u00eat d&rsquo; o1-mini).<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Par ailleurs, OpenAI vient d&rsquo; introduire un nouvel abonnement appel\u00e9 <em>ChatGPT Pro<\/em> \u00e0 200 USD\/mois! Ce plan haut de gamme est le seul qui donne acc\u00e8s au mod\u00e8le o1-Pro et offre aussi un acc\u00e8s illimit\u00e9 aux mod\u00e8les o1 et o1-mini.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Ce qui pr\u00e9c\u00e8de concerne l&rsquo; interface utilisateur via le site web, mais les mod\u00e8les o1-preview et o1-mini sont \u00e9galement accessibles via l&rsquo; interface de programmation (API) d&rsquo; openAI, mais pas o1-pro. Le prix de l&rsquo; utilisation est alors d\u00e9pendant du nombre de <em>tokens<\/em> \u00e9chang\u00e9s. Mais comme OpenAI ne permet pas de voir la cha\u00eene de raisonnemet compl\u00e8te, l&rsquo; utilisateur de l&rsquo; API se retrouve contraint de payer \u00e0 l&rsquo; aveuglette&#8230;<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">4. Conclusion<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">C&rsquo;est au moment d&rsquo; \u00e9crire ces lignes que <em>Google<\/em> vient de sortir son propre mod\u00e8le de raisonnement appel\u00e9 <em>Gemini 2.0 Flash Thinking Experimental<\/em>. Deux \u00e9quipes chinoises ont aussi publi\u00e9 des mod\u00e8les de raisonnement, <em>DeepSeek<\/em> avec <em>DeepSeek-R1-lite-preview<\/em>, et <em>Alibaba<\/em> Qwen <em>QwQ-32B-Preview<\/em>.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Les mod\u00e8les capables de raisonner sont en passe de devenir un nouveau terrain de comp\u00e9tition, et ce parce qu&rsquo; ils ouvrent la voie vers des syst\u00e8mes plus fiables auxquels il est possible de d\u00e9l\u00e9guer plus facilement des t\u00e2ches rendant possibles des agents IA plus autonomes&#8230;<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Et enfin, gardons en m\u00e9moire que les mod\u00e8les auxquels nous avons acc\u00e8s vont continuer \u00e0 progresser. Si OpenAI a d\u00e9cid\u00e9 de d\u00e9marrer une nouvelle \u00ab\u00a0lign\u00e9e\u00a0\u00bb de mod\u00e8les comme sa d\u00e9nomination l&rsquo; indique, ce n&rsquo; est pas innocent et sugg\u00e8re que des mod\u00e8les raisonneurs plus puissants appara\u00eetront \u00e0 l&rsquo; avenir, peut-\u00eatre en ayant recours \u00e0 des techniques d&rsquo; apprentissage par renforcement comme <em>Monte Carlo Tree Search<\/em>.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Il y a donc lieu de rester curieux et optimistes. Une nouvelle voie de progr\u00e8s est ouverte. Nous verrone bien o\u00f9 elle m\u00e8nera.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">5. Sources et r\u00e9f\u00e9rences<\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n<li><em>Open o1 System Card<\/em>, publi\u00e9 par OpenAI le 5 d\u00e9cembre 2024 : <a href=\"https:\/\/cdn.openai.com\/o1-system-card-20241205.pdf\">https:\/\/cdn.openai.com\/o1-system-card-20241205.pdf<\/a><br><\/li>\n\n\n\n<li><em>Learning to Reason with LLMs<\/em>, article publi\u00e9 par OpenAI le 12 septembre 2024 : <a href=\"https:\/\/openai.com\/index\/learning-to-reason-with-llms\/\">https:\/\/openai.com\/index\/learning-to-reason-with-llms\/<\/a><br><\/li>\n\n\n\n<li><em>Explaining OpenAI&rsquo;s o1 reasoning models<\/em>, vid\u00e9o Youtube par Sam Witteveen : <a href=\"https:\/\/youtu.be\/jrA47yocyV0?si=ZJZSGpkB9Ewej4lh\">https:\/\/youtu.be\/jrA47yocyV0?si=ZJZSGpkB9Ewej4lh<\/a><br><\/li>\n\n\n\n<li><em>ChatGPT o1 &#8211; In-depth analysis and reaction<\/em>, vid\u00e9o Youtube par AI Explained : <a href=\"https:\/\/youtu.be\/7J44j6Fw8NM?si=KT9kzLJDK3gWOlBR\">https:\/\/youtu.be\/7J44j6Fw8NM?si=KT9kzLJDK3gWOlBR<\/a><br><\/li>\n\n\n\n<li><em>O1, a new paradigm for ai<\/em>, article paru sur le blog The Algorithmic Bridge, par Alberto Romero le 13 septembre 2024 : <a href=\"https:\/\/www.thealgorithmicbridge.com\/p\/openai-o1-a-new-paradigm-for-ai\">https:\/\/www.thealgorithmicbridge.com\/p\/openai-o1-a-new-paradigm-for-ai<\/a><br><\/li>\n\n\n\n<li><em>Google releases its own reasoning model<\/em>, par Kyle Wiggers pour TechCrunch le 19 d\u00e9cembre 2024 : <a href=\"https:\/\/techcrunch.com\/2024\/12\/19\/google-releases-its-own-reasoning-ai-model\/\">https:\/\/techcrunch.com\/2024\/12\/19\/google-releases-its-own-reasoning-ai-model\/<\/a><br><\/li>\n\n\n\n<li><em>Graph of Thoughts: Solving Elaborate Problems with Large Language Models<\/em>, Maciej Besta &amp; autres, publi\u00e9 le 18 ao\u00fbt 2023, sur Arxiv : <a href=\"https:\/\/arxiv.org\/abs\/2308.09687\">https:\/\/arxiv.org\/abs\/2308.09687<\/a><\/li>\n<\/ul>\n\n\n\n<p class=\"wp-block-paragraph\"><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Le mod\u00e8le o1 d&rsquo;OpenAI marque une avanc\u00e9e en mati\u00e8re de raisonnement pour les IA en int\u00e9grant des phases d&rsquo;entra\u00eenement distinctes pour am\u00e9liorer leurs r\u00e9ponses logiques. OpenAI propose plusieurs versions accessibles \u00e0 des abonnements sp\u00e9cifiques.<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[5,7,12],"tags":[18,22,23,24,26],"class_list":["post-1809","post","type-post","status-publish","format-standard","hentry","category-conceptuel","category-generalites","category-modeles-de-langage","tag-chatgpt","tag-formation-ia","tag-ia","tag-intelligence-artificielle","tag-llm","post-preview"],"_links":{"self":[{"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/posts\/1809","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/comments?post=1809"}],"version-history":[{"count":0,"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/posts\/1809\/revisions"}],"wp:attachment":[{"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/media?parent=1809"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/categories?post=1809"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/tags?post=1809"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}