{"id":1192,"date":"2024-03-30T18:47:42","date_gmt":"2024-03-30T17:47:42","guid":{"rendered":"https:\/\/artificiellementintelligent.wordpress.com\/?p=1192"},"modified":"2024-03-30T18:47:42","modified_gmt":"2024-03-30T17:47:42","slug":"modeles-de-langage-et-robotique","status":"publish","type":"post","link":"https:\/\/artificiellementintelligent.eu\/index.php\/2024\/03\/30\/modeles-de-langage-et-robotique\/","title":{"rendered":"Mod\u00e8les de langage et robotique"},"content":{"rendered":"\n<p class=\"wp-block-paragraph\">Depuis les ann\u00e9es 70, les films de science-fiction mettent en sc\u00e8ne des IA humano\u00efdes et des dro\u00efdes qui s&rsquo; occupent de toutes les t\u00e2ches m\u00e9nag\u00e8res. Alors pourquoi n&rsquo; avons-nous pas encore tous notre propre C-3PO, et pourquoi semble-t-il que nous remplacerons les programmeurs avant d&rsquo; arr\u00eater de faire la lessive ?<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">La r\u00e9ponse est que la robotique est un probl\u00e8me tr\u00e8s difficile, au point d&rsquo; avoir pouss\u00e9 beaucoup d&rsquo;entreprises \u00e0 l&rsquo; abandon, \u00e0 commencer par <em>OpenAI<\/em> en 2021. C&rsquo;est ce qu&rsquo; explique Ilya Sutskever, CTO d&rsquo;OpenAI dans cette <a href=\"https:\/\/youtu.be\/7tL1Jy_b_3Y?si=DSEAtn_PSg23zt9l\">vid\u00e9o<\/a>.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Mais pourquoi est-ce si compliqu\u00e9, que peuvent y faire les mod\u00e8les de langage et \u00e0 quoi faut-il s&rsquo;attendre ? C&rsquo;est ce que je me propose de vous expliquer dans cet article.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">1. Le paradoxe de Moravec<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">La premi\u00e8re difficult\u00e9 de la robotique est illustr\u00e9e par le <em>paradoxe de Moravec<\/em>. Il met en \u00e9vidence la diff\u00e9rence entre l&rsquo; intelligence humaine et l&rsquo; intelligence artificielle. Le paradoxe de Moravec se r\u00e9sume \u00e0 l&rsquo; id\u00e9e suivante : <em>le plus difficile en robotique est souvent ce qui est le plus facile pour l&rsquo; homme.<\/em><\/p>\n\n\n\n<p class=\"wp-block-paragraph\">En effet, des t\u00e2ches sensorimotrices qui nous paraissent \u00e9videntes comme reconna\u00eetre un objet, attraper une balle, \u00e9valuer les \u00e9motions d&rsquo; autrui etc&#8230; posent de gros probl\u00e8mes aux ordinateurs. A l&rsquo; inverse, les ordinateurs excellent dans certaines activit\u00e9s de pur raisonnement comme le jeu d&rsquo; \u00e9checs ou le choix du trajet optimal, activit\u00e9s que les humains consid\u00e8rent comme intellectuellement exigeantes.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Ce paradoxe peut \u00eatre expliqu\u00e9 par le fait que lorsque le cerveau humain ma\u00eetrise parfaitement une t\u00e2che, celle-ci ne s&rsquo; ex\u00e9cute pas consciemment, contrairement aux t\u00e2ches mal ma\u00eetris\u00e9es. Ces t\u00e2ches inconscientes ne sont donc pas catalogu\u00e9es comme difficiles.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Une explication compl\u00e9mentaire est li\u00e9e \u00e0 la th\u00e9orie de l&rsquo; \u00e9volution. Les t\u00e2ches sensorimotrices, en tant que fonctionnalit\u00e9s biologiques anciennes, ont \u00e9t\u00e9 perfectionn\u00e9es par les m\u00e9canismes \u00e9volutifs durant des millions d&rsquo;ann\u00e9es. Les facult\u00e9s de raisonnement, apparues tr\u00e8s r\u00e9cemment sur le plan biologique, ne se sont pas encore autant perfectionn\u00e9es, et c&rsquo; est pourquoi elles demandent encore un effort conscient significatif.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">D\u00e8s lors, notre perception de la difficult\u00e9 d&rsquo; une t\u00e2che cognitive n&rsquo; est pas objective&#8230;et il se fait que les t\u00e2ches perceptuelles sont tr\u00e8s complexes, mais la machine extr\u00eamement puissante qu&rsquo; est notre cerveau effectue l&rsquo; essentiel du traitement \u00e0 notre insu&#8230;le cerveau effectue environ 10^18 (c&rsquo;est-\u00e0-dire un milliard de milliards) de calculs par seconde, toutes t\u00e2ches confondues, et ce avec tr\u00e8s peu d&rsquo; \u00e9nergie ! Imiter tout cela est une entreprise colossale.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">2. Le probl\u00e8me des donn\u00e9es<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">L&rsquo; autre grand probl\u00e8me, ce sont les donn\u00e9es : si les mod\u00e8les de langage et d&rsquo; image peuvent s&rsquo; appuyer sur les vastes quantit\u00e9s de donn\u00e9es disponibles sur Internet, la situation est tout \u00e0 fait diff\u00e9rente en robotique, qui ne peut se reposer sur rien d&rsquo; analogue.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">En effet, les robots exhibent une grande variabilit\u00e9 dans leur morphologie, leurs capteurs et leurs actuateurs. Il n&rsquo; existe aucune forme de standardisation sur ces points ce qui signifie que les jeux de donn\u00e9es sont difficilement transf\u00e9rables d&rsquo; un mod\u00e8le de robot \u00e0 l&rsquo;autre&#8230;<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">De plus, les robots ont besoin d&rsquo; une interaction active avec leur environnement pour g\u00e9n\u00e9rer des donn\u00e9es significatives. Les robots physiques doivent donc effectuer des t\u00e2ches de mani\u00e8re r\u00e9p\u00e9t\u00e9e, ce qui entra\u00eene des efforts de collecte de donn\u00e9es chronophages et gourmands en ressources.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Ce manque de donn\u00e9es pose de gros probl\u00e8mes pour l&rsquo; entra\u00eenement des mod\u00e8les destin\u00e9s \u00e0 contr\u00f4ler ces robots. Mais les chercheurs ne baissent pas les bras et ont mis au point deux parades :<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">La premi\u00e8re est la <em>g\u00e9n\u00e9ration de donn\u00e9es synth\u00e9tiques<\/em> : il s&rsquo;agit ici de cr\u00e9er un simulateur logiciel de l&rsquo;environnement qui va permettre de g\u00e9n\u00e9rer des jeux de donn\u00e9es r\u00e9alistes. Si vous avez d\u00e9j\u00e0 jou\u00e9 \u00e0 un jeu vid\u00e9o immersif type <em>Call Of Duty<\/em> ou <em>Minecraft<\/em> vous voyez de quoi il s&rsquo;agit&#8230; et comme l&rsquo;environnement est enti\u00e8rement sous contr\u00f4le, il est possible d&rsquo;adapter les interactions aux actuateurs du robot. Un exemple de ce type de simulateur est <em>IsaacSim<\/em> de Nvidia :<\/p>\n\n\n\n<figure class=\"wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio\"><div class=\"wp-block-embed__wrapper\">\n<div class=\"embed-youtube\"><iframe loading=\"lazy\" title=\"Narrowing the Sim2Real Gap with NVIDIA Isaac Sim\" width=\"676\" height=\"380\" src=\"https:\/\/www.youtube.com\/embed\/VW-dOMBFj7o?feature=oembed\" frameborder=\"0\" allow=\"accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share\" referrerpolicy=\"strict-origin-when-cross-origin\" allowfullscreen><\/iframe><\/div>\n<\/div><\/figure>\n\n\n\n<p class=\"wp-block-paragraph\">L&rsquo; autre approche est de chercher \u00e0 <em>rendre les jeux de donn\u00e9es de diff\u00e9rents robots interop\u00e9rables<\/em> \u00e0 travers une couche d&rsquo; abstraction qui isole le mod\u00e8le IA des sp\u00e9cificit\u00e9s morphologiques du robot. <\/p>\n\n\n\n<p class=\"wp-block-paragraph\">C&rsquo; est l&rsquo; approche poursuivie par la collaboration entre <em>Google Deepmind<\/em> et 33 laboratoires acad\u00e9miques \u00e0 travers le projet <em><a href=\"https:\/\/www.deepmind.com\/blog\/scaling-up-learning-across-many-different-robot-types\">Open-X Embodiment Dataset<\/a><\/em> qui consolide les donn\u00e9es d&rsquo; entra\u00eenement de 22 robots diff\u00e9rents, d\u00e9montrant plus de 500 comp\u00e9tences et 150 000 t\u00e2ches \u00e0 travers plus d&rsquo;un million d&rsquo;\u00e9pisodes. <\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Cet ensemble de donn\u00e9es est le plus complet de ce type dans le domaine de la robotique. L&rsquo; id\u00e9e est de pouvoir utiliser ce jeu de donn\u00e9es consolid\u00e9 pour entra\u00eener un mod\u00e8le IA robotique g\u00e9n\u00e9raliste qui pourra ensuite \u00eatre adapt\u00e9 \u00e0 la morphologie de chaque robot. C&rsquo; est ce que Google a fait, et, en utilisant ce mod\u00e8le, Google a pu d\u00e9montrer une am\u00e9lioration de 50 % du taux de r\u00e9ussite en moyenne sur cinq robots diff\u00e9rents couramment utilis\u00e9s par rapport aux m\u00e9thodes d\u00e9velopp\u00e9es ind\u00e9pendamment et sp\u00e9cifiquement pour chaque robot. Encore plus int\u00e9ressant, Google a pu \u00e9tablir que le transfert de connaissance d&rsquo; un mod\u00e8le de robot \u00e0 l&rsquo; autre fonctionnait, rendant le co-entra\u00eenement possible, ce qui offre de grandes perspectives pour l&rsquo; entra\u00eenement des futurs mod\u00e8les robotiques.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><\/p>\n\n\n\n<h2 class=\"wp-block-heading\">3. Mod\u00e8les et agents multimodaux<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">L&rsquo; approche traditionnelle en robotique est d&rsquo; utiliser un syst\u00e8me de planification classique qui d\u00e9finit formellement chaque action et ses conditions pr\u00e9alables et pr\u00e9dit ses effets. Comme ces algorithmes sp\u00e9cifient de mani\u00e8re rigide ce qui est possible ou non dans l&rsquo; environnement, ces robots \u00ab\u00a0traditionnels\u00a0\u00bb sont souvent incapables de faire face \u00e0 toute forme d&rsquo; impr\u00e9vu, m\u00eame apr\u00e8s de nombreux cycles d&rsquo; essais et d&rsquo; erreurs.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Le champ d&rsquo; action de la robotique classique se limite donc \u00e0 des environnements \u00e9troitement contr\u00f4l\u00e9s permettant de suivre un script \u00e9troitement limit\u00e9, en r\u00e9p\u00e9tant de mani\u00e8re rigide les m\u00eames s\u00e9quences d&rsquo; actions.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">C&rsquo; est ici que les mod\u00e8les de langage (<em>LLM<\/em>) interviennent avec leur large \u00e9ventail de connaissances qui va de la physique quantique \u00e0 la K-pop en passant par la d\u00e9cong\u00e9lation d&rsquo; un filet de saumon. De leur c\u00f4t\u00e9, les robots ont ce qui manque aux LLM : des corps physiques capables d&rsquo; interagir avec leur environnement et de relier les mots \u00e0 la r\u00e9alit\u00e9.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Il semble logique de connecter des robots sans esprit et des mod\u00e8les de langage sans corps pour que le robot puisse agir comme les \u00ab\u00a0mains et les yeux\u00a0\u00bb du mod\u00e8le, tandis que ce dernier raisonne, planifie et fournit des connaissances s\u00e9mantiques de haut niveau sur la t\u00e2che.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Plus pr\u00e9cis\u00e9ment, le mod\u00e8le de langage au coeur du robot se comportera comme un agent qui cherche \u00e0 ex\u00e9cuter une t\u00e2che de haut niveau qui lui est transmise par un humain.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Il s&rsquo;appuiera pour cela sur des mod\u00e8les multimodaux capables d&rsquo;interpr\u00e9ter les images renvoy\u00e9es par les cam\u00e9ras (et les autres capteurs \u00e9ventuels dont il est \u00e9quip\u00e9), ainsi que sur d&rsquo; autres mod\u00e8les capables de transformer les instructions du mod\u00e8le de langage en mouvements \u00e0 travers l&rsquo; activation des servomoteurs dont les articulations sont munies.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">De nombreuses architectures internes sont possibles. La figure ci-dessous en montre un exemple :<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img decoding=\"async\" src=\"https:\/\/artificiellementintelligent.wordpress.com\/wp-content\/uploads\/2024\/03\/image-20240403a.png\" alt=\"\" class=\"wp-image-1198\" \/><figcaption class=\"wp-element-caption\">Figure 1 : Exemple d&rsquo; architecture interne d&rsquo;un robot exploitant un LLM <br>(source : <a href=\"https:\/\/arxiv.org\/pdf\/2305.17066.pdf\">https:\/\/arxiv.org\/pdf\/2305.17066.pdf<\/a>)<\/figcaption><\/figure>\n<\/div>\n\n\n<p class=\"wp-block-paragraph\">Le mod\u00e8le de langage en bas \u00e0 droite (\u00ab\u00a0Brain\u00a0\u00bb) joue le r\u00f4le de chef d&rsquo; orchestre. La partie \u00ab\u00a0robotique\u00a0\u00bb se trouve au centre et se compose des actuateurs (\u00ab\u00a0Sensor &amp; control\u00a0\u00bb) et des cam\u00e9ras (\u00ab\u00a0Eye\u00a0\u00bb). Un mod\u00e8le de langage s\u00e9par\u00e9 (\u00ab\u00a0Nerve\u00a0\u00bb) joue un r\u00f4le interm\u00e9diaire en interpr\u00e9tant les images et en fournissant un description textuelle de plus haut niveau au mod\u00e8le \u00ab\u00a0cerveau\u00a0\u00bb. A noter que le mod\u00e8le interm\u00e9diaire re\u00e7oit aussi les informations de position et de mouvement pour pouvoir interpr\u00e9ter plus facilement les images provenant des cam\u00e9ras&#8230;<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Je voudrais cl\u00f4turer cette description par un rappel de mes deux articles pr\u00e9c\u00e9dents parlant des <a href=\"https:\/\/artificiellementintelligent.wordpress.com\/2024\/03\/04\/les-agents-intelligents\/\">agents<\/a> et des <a href=\"https:\/\/artificiellementintelligent.wordpress.com\/2024\/03\/18\/des-modeles-de-langage-aux-modeles-multimodaux\/\">mod\u00e8les multimodaux<\/a> et qui sont directement li\u00e9s \u00e0 ce qui pr\u00e9c\u00e8de.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">4. Acteurs<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Certaines entreprises se concentrent sur des robots sp\u00e9cialis\u00e9s qui trient, pr\u00e9l\u00e8vent et emballent efficacement et peuvent remplacer les travailleurs des centres de traitement des commandes, tandis que d&rsquo;autres, comme Tesla, tentent de mettre au point un robot humano\u00efde polyvalent.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Le grand avantage des robots anthropomorphes est qu&rsquo; ils peuvent implicitement utiliser l&rsquo;ensemble des outils destin\u00e9s aux humains (bref, tout).<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Voici un petit tour d&rsquo; horizon des principaux acteurs qui d\u00e9veloppent des robots anthropomorphes g\u00e9n\u00e9ralistes et \u00ab\u00a0intelligents\u00a0\u00bb (c&rsquo;est \u00e0 dire bas\u00e9s sur un mod\u00e8le IA g\u00e9n\u00e9raliste) :<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>le projet GR00T de <em>Nvidia<\/em> : <\/li>\n<\/ul>\n\n\n\n<figure class=\"wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio\"><div class=\"wp-block-embed__wrapper\">\n<div class=\"embed-youtube\"><iframe loading=\"lazy\" title=\"What is project GR00T? | NVIDIA\" width=\"676\" height=\"380\" src=\"https:\/\/www.youtube.com\/embed\/AvxClAfpSHM?feature=oembed\" frameborder=\"0\" allow=\"accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share\" referrerpolicy=\"strict-origin-when-cross-origin\" allowfullscreen><\/iframe><\/div>\n<\/div><\/figure>\n\n\n\n<ul class=\"wp-block-list\">\n<li>le robot <em>Tesla<\/em> Optimus :<\/li>\n<\/ul>\n\n\n\n<figure class=\"wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio\"><div class=\"wp-block-embed__wrapper\">\n<div class=\"embed-youtube\"><iframe loading=\"lazy\" title=\"Optimus - Gen 2 | Tesla\" width=\"676\" height=\"380\" src=\"https:\/\/www.youtube.com\/embed\/cpraXaw7dyc?feature=oembed\" frameborder=\"0\" allow=\"accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share\" referrerpolicy=\"strict-origin-when-cross-origin\" allowfullscreen><\/iframe><\/div>\n<\/div><\/figure>\n\n\n\n<ul class=\"wp-block-list\">\n<li>le robot <em>Figure<\/em> 01, qui utilise un mod\u00e8le IA d\u00e9velopp\u00e9 par OpenAI : <\/li>\n<\/ul>\n\n\n\n<figure class=\"wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio\"><div class=\"wp-block-embed__wrapper\">\n<div class=\"embed-youtube\"><iframe loading=\"lazy\" title=\"Figure Status Update - OpenAI Speech-to-Speech Reasoning\" width=\"676\" height=\"380\" src=\"https:\/\/www.youtube.com\/embed\/Sq1QZB5baNw?feature=oembed\" frameborder=\"0\" allow=\"accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share\" referrerpolicy=\"strict-origin-when-cross-origin\" allowfullscreen><\/iframe><\/div>\n<\/div><\/figure>\n\n\n\n<ul class=\"wp-block-list\">\n<li>le robot Spot de <em>Boston Dynamics<\/em> : <\/li>\n<\/ul>\n\n\n\n<figure class=\"wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio\"><div class=\"wp-block-embed__wrapper\">\n<div class=\"embed-youtube\"><iframe loading=\"lazy\" title=\"Spot at AB InBev Belgium | Boston Dynamics\" width=\"676\" height=\"380\" src=\"https:\/\/www.youtube.com\/embed\/9pZQ29RSz4I?feature=oembed\" frameborder=\"0\" allow=\"accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share\" referrerpolicy=\"strict-origin-when-cross-origin\" allowfullscreen><\/iframe><\/div>\n<\/div><\/figure>\n\n\n\n<ul class=\"wp-block-list\">\n<li>le robot H1 de la soci\u00e9t\u00e9 chinoise <em>Unitree<\/em> :<\/li>\n<\/ul>\n\n\n\n<figure class=\"wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio\"><div class=\"wp-block-embed__wrapper\">\n<div class=\"embed-youtube\"><iframe loading=\"lazy\" title=\"Unitree\u00a0H1 Breaking humanoid robot speed world record [full-size humanoid] Evolution V3.0\" width=\"676\" height=\"380\" src=\"https:\/\/www.youtube.com\/embed\/83ShvgtyFAg?feature=oembed\" frameborder=\"0\" allow=\"accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share\" referrerpolicy=\"strict-origin-when-cross-origin\" allowfullscreen><\/iframe><\/div>\n<\/div><\/figure>\n\n\n\n<p class=\"wp-block-paragraph\">NB &#8211; Ne ratez pas la vid\u00e9o de Boston Dynamics, elle se passe dans la brasserie <em>Stella Artois<\/em> \u00e0 Louvain !<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">5. Conclusion<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Il suffit de voir les noms des acteurs ci-dessus pour se rendre compte que la course \u00e0 la robotique est bel et bien lanc\u00e9e entre g\u00e9ants de la tech. Et la robotique, ce ne sont pas seulement des robots anthropomorphes, mais aussi les voitures autonomes, les drones, les robots agricoles&#8230;.le potentiel pour certains secteurs comme l&rsquo; <em>industrie<\/em>, l&rsquo; <em>agriculture<\/em> et les <em>soins de sant\u00e9<\/em> est \u00e9norme. Sans parler des applications militaires qui sont \u00e9videntes&#8230;.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Encore faut-il que ces promesses soient r\u00e9alis\u00e9es. Si un mod\u00e8le g\u00e9n\u00e9ratif type <em>transformer<\/em> est \u00e0 la base de ces mod\u00e8les, cela veut dire que le robot risque fort d&rsquo; h\u00e9riter des d\u00e9fauts de ces mod\u00e8les (fiabilit\u00e9 incertaine, hallucinations), mais un robot ou un v\u00e9hicule qui hallucine repr\u00e9sente un plus grand danger qu&rsquo;un mod\u00e8le conversationnel&#8230;<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Toute cette complexit\u00e9 fait que la r\u00e9volution robotique de masse n&rsquo; aura pas lieu avant quelques ann\u00e9es, mais n&rsquo; en reste pas moins probable. Dans les 5 prochaines ann\u00e9es, nous aurons peut-\u00eatre des majordomes et des compagnons IA \u00e0 l&rsquo; apparence humaine et \u00e0 ce moment-l\u00e0, nous aurons cr\u00e9\u00e9 une nouvelle esp\u00e8ce&#8230;<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Sources et r\u00e9f\u00e9rences<\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n<li> <em>Can Robotics overcome its data scarcity challenge<\/em> ? , \u00e9ditorial du site RoboticsBiz le 29 f\u00e9vrier 2024 : <a href=\"https:\/\/roboticsbiz.com\/can-robotics-overcome-its-data-scarcity-challenge\/\">https:\/\/roboticsbiz.com\/can-robotics-overcome-its-data-scarcity-challenge\/<\/a><br><\/li>\n\n\n\n<li><em>Scientists Are Putting ChatGPT Brains Inside Robot Bodies. What Could Possibly Go Wrong?<\/em>, par David Berreby pour Scientific American, le 1er mars 2024 : <a href=\"https:\/\/www.scientificamerican.com\/article\/scientists-are-putting-chatgpt-brains-inside-robot-bodies-what-could-possibly-go-wrong\/\">https:\/\/www.scientificamerican.com\/article\/scientists-are-putting-chatgpt-brains-inside-robot-bodies-what-could-possibly-go-wrong\/<\/a><br><\/li>\n\n\n\n<li>Tweet de Dr Jim Fan concernant RT-X : <a href=\"https:\/\/x.com\/DrJimFan\/status\/1709217476922462268?s=20\">https:\/\/x.com\/DrJimFan\/status\/1709217476922462268?s=20<\/a><br><\/li>\n\n\n\n<li> <em>RT-1: Robotics Transformer for real-world control at scale<\/em>, par Keerthana Gopalakrishnan and Kanishka Rao sur le site de Google Reserch, le 13 d\u00e9cembre 2022<em> : <\/em><a href=\"https:\/\/blog.research.google\/2022\/12\/rt-1-robotics-transformer-for-real.html\">https:\/\/blog.research.google\/2022\/12\/rt-1-robotics-transformer-for-real.html<\/a><\/li>\n<\/ul>\n\n\n\n<ul class=\"wp-block-list\">\n<li><em>RT-2: New model translates vision and language into action<\/em>, par Yevgen Chebotar, Tianhe Yu pour Google Deepmind le 28 juillet 2023 : <a href=\"https:\/\/www.deepmind.com\/blog\/rt-2-new-model-translates-vision-and-language-into-action\">https:\/\/www.deepmind.com\/blog\/rt-2-new-model-translates-vision-and-language-into-action<\/a><br><\/li>\n\n\n\n<li><em>Scaling up learning across many different robot types<\/em>, par Quan Vuong and Pannag Sanketi pour Google Deepmind le 3 octobre 2023 : <a href=\"https:\/\/www.deepmind.com\/blog\/scaling-up-learning-across-many-different-robot-types\">https:\/\/www.deepmind.com\/blog\/scaling-up-learning-across-many-different-robot-types<\/a><\/li>\n<\/ul>\n\n\n\n<p class=\"wp-block-paragraph\"><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Depuis les ann\u00e9es 70, les films de science-fiction ont pr\u00e9sent\u00e9 des IA humano\u00efdes et des dro\u00efdes pour les t\u00e2ches m\u00e9nag\u00e8res. Le d\u00e9veloppement de la robotique est entrav\u00e9 par la complexit\u00e9 des t\u00e2ches cognitives et le manque de donn\u00e9es. De nombreuses entreprises et laboratoires d\u00e9veloppent des solutions pour relever ces d\u00e9fis.<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[2,11,12],"tags":[],"class_list":["post-1192","post","type-post","status-publish","format-standard","hentry","category-agents","category-modeles-dimage","category-modeles-de-langage","post-preview"],"_links":{"self":[{"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/posts\/1192","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/comments?post=1192"}],"version-history":[{"count":0,"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/posts\/1192\/revisions"}],"wp:attachment":[{"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/media?parent=1192"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/categories?post=1192"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/tags?post=1192"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}