{"id":856,"date":"2023-10-16T18:06:56","date_gmt":"2023-10-16T16:06:56","guid":{"rendered":"https:\/\/artificiellementintelligent.wordpress.com\/?p=856"},"modified":"2023-10-16T18:06:56","modified_gmt":"2023-10-16T16:06:56","slug":"tour-dhorizon-des-modeles-generatifs-dimages","status":"publish","type":"post","link":"https:\/\/artificiellementintelligent.eu\/index.php\/2023\/10\/16\/tour-dhorizon-des-modeles-generatifs-dimages\/","title":{"rendered":"Tour d&rsquo;horizon des mod\u00e8les g\u00e9n\u00e9ratifs d&rsquo;images"},"content":{"rendered":"\n<p class=\"wp-block-paragraph\">Voici quelque temps que les mod\u00e8les g\u00e9n\u00e9ratifs d&rsquo;image font parler d&rsquo;eux.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Ils peuvent en effet cr\u00e9er des images fascinantes avec un minimum d&rsquo; efforts, et je vous propose de voir ci-dessous comment en tirer parti au mieux. L&rsquo; arriv\u00e9e de DALL-E 3 rend les choses encore plus int\u00e9ressantes puisqu&rsquo; un mod\u00e8le tr\u00e8s performant est maintenant \u00e0 disposition du grand public.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Jusqu&rsquo;\u00e0 r\u00e9cemment, ces mod\u00e8les donnaient des r\u00e9sultats assez mitig\u00e9s. Leur arriv\u00e9e sur le devant de la sc\u00e8ne g\u00e9n\u00e9rative grand public est donc assez r\u00e9cente.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Cet article se focalise la g\u00e9n\u00e9ration d&rsquo; images originales \u00e0 partir d&rsquo; une phrase introduite par l&rsquo; utilisateur, ce qui offre le potentiel applicatif le plus large. Il existe d&rsquo; autres types de g\u00e9n\u00e9rateurs d&rsquo;image, comme ceux qui permettent de modifier votre apparence sur base de photos.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">La possibilit\u00e9 de cr\u00e9er des images \u00e0 partir de simples descriptions textuelles offre un \u00e9ventail \u00e9norme de possibilit\u00e9s. L&rsquo; image ci-dessous a \u00e9t\u00e9 g\u00e9n\u00e9r\u00e9e par DALL E 3 sur base du prompt \u00e9l\u00e9mentaire : <em>Dessine-moi Notre-Dame de Paris dans le style de Pierre-Paul Rubens<\/em>\u00a0\u00bb :<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img decoding=\"async\" src=\"https:\/\/artificiellementintelligent.wordpress.com\/wp-content\/uploads\/2023\/10\/image-20231015a.jpeg\" alt=\"\" class=\"wp-image-858\" \/><figcaption class=\"wp-element-caption\">Image 1 : Notre-Dame de Paris dans le style de Pierre-Paul Rubens<\/figcaption><\/figure>\n<\/div>\n\n\n<p class=\"wp-block-paragraph\">Ces g\u00e9n\u00e9rateurs d&rsquo;image ont \u00e9t\u00e9 entra\u00een\u00e9s sur des milliards de paires texte\/image. A force d&rsquo; expositions r\u00e9p\u00e9t\u00e9es, les mod\u00e8les apprennent progressivement \u00e0 quoi les choses ressemblent visuellement. Reste \u00e0 r\u00e9diger un <em>prompt<\/em> qui va \u00ab\u00a0r\u00e9sonner\u00a0\u00bb avec le mod\u00e8le et lui faire g\u00e9n\u00e9rer une image int\u00e9ressante (ce qui n&rsquo;est pas toujours le cas au premier coup&#8230; c&rsquo;est une activit\u00e9 dans laquelle la r\u00e9p\u00e9tition paie).<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">La g\u00e9n\u00e9ration d&rsquo;image en tant que telle fait appel \u00e0 un proc\u00e9d\u00e9 appel\u00e9 \u00ab\u00a0diffusion\u00a0\u00bb dont vous pouvez lire les d\u00e9tails techniques <a href=\"https:\/\/www.assemblyai.com\/blog\/diffusion-models-for-machine-learning-introduction\/\">ici<\/a>.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">1. Le g\u00e9n\u00e9rateur DALL-E 3<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">DALL-E 3 est le tout dernier mod\u00e8le d&rsquo; OpenAI, accessible depuis d\u00e9but octobre 2023. L&rsquo; immense avantage de DALL-E 3 est qu&rsquo; il extr\u00eamement simple \u00e0 utiliser et accessible gratuitement via le site de Microsoft Bing Image Creator qui se trouve <a href=\"https:\/\/www.bing.com\/create\">ici<\/a>, \u00e0 condition de poss\u00e9der un compte Microsoft .<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img decoding=\"async\" src=\"https:\/\/artificiellementintelligent.wordpress.com\/wp-content\/uploads\/2023\/10\/image-20231015b.png\" alt=\"\" class=\"wp-image-864\" \/><figcaption class=\"wp-element-caption\">Image 2 : Interface utilisateur de Bing Image Creator<\/figcaption><\/figure>\n<\/div>\n\n\n<p class=\"wp-block-paragraph\">Le syst\u00e8me g\u00e9n\u00e8re les images par s\u00e9rie de quatre. Vous pouvez ensuite choisir de sauvegarder les images qui vous plaisent dans des \u00ab\u00a0collections\u00a0\u00bb sur le site ou bien vous pouvez les t\u00e9l\u00e9charger au format JPEG. Les images g\u00e9n\u00e9r\u00e9es sont carr\u00e9es et leur taille est toujours de 1024 x 1024 ce qui est suffisant pour la plupart des applications. L&rsquo; interface ne permet pas de modifier les images, mais vous pouvez t\u00e9l\u00e9charger cette derni\u00e8re et ensuite la modifier dans un programme sp\u00e9cialis\u00e9 comme Photoshop.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Une force de DALL-E 3 est que vous pouvez lui demander d&rsquo; \u00e9crire un texte sur l&rsquo; image et que cela fonctionne relativement bien (sans \u00eatre parfait). Les mod\u00e8les pr\u00e9c\u00e9dents en \u00e9taient incapables.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Si vous disposez de l&rsquo;abonnement payant chatGPT+ d&rsquo;openAI, DALL-E 3 est \u00e9galement accessible directement depuis chatGPT4 depuis quelques jours. Il vous suffit de s\u00e9lectionner cette sous-option lorsque vous d\u00e9sirez utiliser chatGPT4.<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img decoding=\"async\" src=\"https:\/\/artificiellementintelligent.wordpress.com\/wp-content\/uploads\/2023\/10\/image-20231015e.png\" alt=\"\" class=\"wp-image-867\" \/><figcaption class=\"wp-element-caption\">Image 3 : Acc\u00e8s \u00e0 DALL-E 3 via ChatGPT+<\/figcaption><\/figure>\n<\/div>\n\n\n<h2 class=\"wp-block-heading\">2. Les autres g\u00e9n\u00e9rateurs d&rsquo;image disponibles<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Malheureusement, les autres mod\u00e8les sont payants, c&rsquo;est pourquoi je me limiterai \u00e0 les \u00e9voquer ici. Selon les exploitants, cela s&rsquo;explique par le co\u00fbt de la puissance de calcul n\u00e9cessaire \u00e0 la cr\u00e9ation de ces images: ces mod\u00e8les \u00e9taient accessibles gratuitement il y a quelques mois mais le nombre croissant d&rsquo;utilisateurs a oblig\u00e9 les sites de g\u00e9n\u00e9ration \u00e0 basculer vers un acc\u00e8s enti\u00e8rement payant.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">L&rsquo; application <a href=\"https:\/\/midjourney.com\">Midjourney<\/a> est la plus connue et r\u00e9put\u00e9e tr\u00e8s performante; elle est la favorite de nombreux illustrateurs mais son utilisation est peu intuitive puisqu&rsquo; il faut passer par l&rsquo;application de chat <em>Discord<\/em> pour demander la g\u00e9n\u00e9ration des images.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">L&rsquo; id\u00e9e de Midjourney est de fonctionner comme une communaut\u00e9 d&rsquo; artistes. La g\u00e9n\u00e9ration se fait en introduisant le <em>prompt <\/em>dans un canal Discord de <em>chat<\/em> public sur Discord ce qui signifie que tous les utilisateurs peuvent voir vos demandes de g\u00e9n\u00e9ration et leur r\u00e9sultat (et vous de m\u00eame avec leurs cr\u00e9ations). Ceci n&rsquo; est pas appropri\u00e9 pour la plupart des applications professionnelles. Midjourney vous co\u00fbtera 10 euros par mois pour avoir droit \u00e0 environ 200 g\u00e9n\u00e9rations d&rsquo; images mensuelles.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">De son c\u00f4t\u00e9, la soci\u00e9t\u00e9 anglaise Stability AI a publi\u00e9 le mod\u00e8le Stable Diffusion XL, via son application Dreamstudio accessible <a href=\"https:\/\/dreamstudio.ai\">ici<\/a> moyennant inscription pr\u00e9alable. Un syst\u00e8me de cr\u00e9dits vous permet de g\u00e9n\u00e9rer une quinzaine d&rsquo; images gratuitement, mais ensuite il vous faudra payer pour recharger vos cr\u00e9dits. Vous pouvez aussi passer par le site <a href=\"https:\/\/clipdrop.co\/stable-diffusion\">Clipdrop<\/a> mais \u00e0 nouveau pour utiliser Stable Diffusion XL il vous faudra prendre l&rsquo;abonnnement PRO qui vous co\u00fbtera 9 USD par mois.<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img decoding=\"async\" src=\"https:\/\/artificiellementintelligent.wordpress.com\/wp-content\/uploads\/2023\/10\/image-20231015c.png\" alt=\"\" class=\"wp-image-870\" \/><figcaption class=\"wp-element-caption\">Image 4 : Interface utilisateur Dreamstudio<\/figcaption><\/figure>\n<\/div>\n\n\n<p class=\"wp-block-paragraph\">Enfin, on attend dans un futur proche la mise \u00e0 disposition des mod\u00e8les <a href=\"https:\/\/imagen.research.google\/\">Imagen<\/a> de Google et <a href=\"https:\/\/ai.meta.com\/blog\/greater-creative-control-for-ai-image-generation\/\">Make-a-Scene<\/a> de Meta. Vu les moyens financiers de ces deux soci\u00e9t\u00e9s, il n&rsquo; est pas exclu que des acc\u00e8s gratuits soient offerts (comme Microsoft l&rsquo;a fait pour DALL-E 3). Esp\u00e9rons que ce sera le cas&#8230;<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">A toutes fins utiles, j&rsquo; ai mis en bas de cet article dans la partie \u00ab\u00a0Notes et r\u00e9f\u00e9rences\u00a0\u00bb des liens vers des explications plus d\u00e9taill\u00e9es concernant l&rsquo; utilisation de<em> Stable Diffusion XL<\/em>, <em>Midjourney<\/em> et <em>Adobe Firefly<\/em>.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">3. Exemple d&rsquo;utilisation pratique<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Une application simple est la r\u00e9alisation de logos et graphismes \u00e0 vocation marketing. Voici un exemple tout simple de r\u00e9alisation de logos pour un bar \u00e0 caf\u00e9 imaginaire appel\u00e9 \u00ab\u00a0maxi kawa\u00a0\u00bb. La figure ci-dessous montre le r\u00e9sultat obtenu du premier coup avec DALL-E 3 ainsi que le <em>prompt<\/em> utilis\u00e9.<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img decoding=\"async\" src=\"https:\/\/artificiellementintelligent.wordpress.com\/wp-content\/uploads\/2023\/10\/image-20231015d.png\" alt=\"\" class=\"wp-image-883\" \/><figcaption class=\"wp-element-caption\">Image 5 : G\u00e9n\u00e9ration d&rsquo;un logo pour le caf\u00e9 \u00ab\u00a0Maxi Kawa\u00a0\u00bb<\/figcaption><\/figure>\n<\/div>\n\n\n<p class=\"wp-block-paragraph\">Comme vous le voyez, le texte est correctement positionn\u00e9 mais il y a des fautes d&rsquo; orthographe. Dans ce cas, la marche \u00e0 suivre serait de t\u00e9l\u00e9charger le fichier JPEG, l&rsquo; \u00e9diter dans un programme comme <em>GIMP<\/em> ou <em>Photoshop<\/em> pour corriger l&rsquo; orthographe et \u00e9ventuellement r\u00e9aliser d&rsquo; autres modifications cosm\u00e9tiques.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Finalement, vous pouvez int\u00e9grer l&rsquo; image corrig\u00e9e dans un programme comme <a href=\"https:\/\/www.canva.com\/\">Canva<\/a>] pour int\u00e9grer le logo dans un menu par exemple. J&rsquo; en profite pour attirer votre attention sur Canva qui est un programme tr\u00e8s facile d&rsquo;utilisation et extr\u00eamement efficace pour la mise en page, notamment gr\u00e2ce \u00e0 l&rsquo; \u00e9norme palette de gabarits disponibles&#8230;<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">4. Contraintes et limitations<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">La question des droits d&rsquo; auteurs li\u00e9s \u00e0 ces images n&rsquo;est pas enti\u00e8rement r\u00e9solue. Il y a deux points sensibles \u00e0 ce sujet. <\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Le premier concerne l&rsquo;entra\u00eenement des mod\u00e8les, qui a eu recours \u00e0 des bases de donn\u00e9es d&rsquo; images \u00e9normes dans lesquelles se trouvent (tr\u00e8s probablement) des images couvertes par le droit d&rsquo; auteur, et ce sans que ces derniers aient donn\u00e9 leur accord. Une association d&rsquo; auteurs a d\u00e9j\u00e0 intent\u00e9 un proc\u00e8s \u00e0 Midjourney et Stability AI \u00e0 ce sujet.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Le second point est de savoir si les images g\u00e9n\u00e9r\u00e9es sont soumises ou non \u00e0 un droit d&rsquo; auteur et si oui, \u00e0 qui il revient (l&rsquo; utilisateur ? le mod\u00e8le ? un collectif d&rsquo; artistes?). La question n&rsquo; est pas simple car il ne s&rsquo;agit pas d&rsquo; un simple plagiat mais bien d&rsquo; une oeuvre originale.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Attention aussi que la plupart des d\u00e9clarations que vous lirez \u00e0 ce sujet se basent sur la situation aux Etats-Unis mais la situation dans nos pays peut tout \u00e0 fait \u00e9voluer dans une autre direction&#8230;<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">En pratique, vous ne risquez pas grand&rsquo; chose si vous utilisez des images g\u00e9n\u00e9r\u00e9es dans un cadre priv\u00e9 ou si vous vous limitez \u00e0 les publier sur les r\u00e9seaux sociaux. Une utilisation professionnelle ponctuelle (par exemple un logo) ne devrait pas non plus vous exposer \u00e0 des probl\u00e8mes significatifs.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Pas contre, je d\u00e9conseillerais de lancer une activit\u00e9 professionelle dans laquelle la production d&rsquo; images de synth\u00e8se joue un r\u00f4le central tant que ces questions juridiques n&rsquo; ont pas \u00e9t\u00e9 tranch\u00e9es. Ou \u00e0 tout le moins, prenez alors au pr\u00e9alable conseil aupr\u00e8s d&rsquo; un juriste sp\u00e9cialis\u00e9 en droits d&rsquo;auteur.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Une derni\u00e8re remarque : tout comme les mod\u00e8les g\u00e9n\u00e9rateurs de texte, ces mod\u00e8les d&rsquo; images ont \u00e9t\u00e9 \u00ab\u00a0brid\u00e9s\u00a0\u00bb pour ne pas g\u00e9n\u00e9rer d&rsquo; images haineuses, violentes, pornographiques ou mettant en sc\u00e8ne des personnages publics. Avis aux petits malins&#8230;<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">5. Notes et r\u00e9f\u00e9rences<\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n<li><em>The best image generators of 2023<\/em>, Zapier : <a href=\"https:\/\/zapier.com\/blog\/best-ai-image-generator\/\">https:\/\/zapier.com\/blog\/best-ai-image-generator\/<\/a><br><\/li>\n\n\n\n<li><em>How to use Stable Diffusion AI to create amazing images<\/em>, ZDNet : <a href=\"https:\/\/www.zdnet.com\/article\/how-to-use-stable-diffusion-ai-to-create-amazing-images\">https:\/\/www.zdnet.com\/article\/how-to-use-stable-diffusion-ai-to-create-amazing-images<\/a><br><\/li>\n\n\n\n<li><em>How to use Midjourney,<\/em> Zapier : <a href=\"https:\/\/zapier.com\/blog\/how-to-use-midjourney\/\">https:\/\/zapier.com\/blog\/how-to-use-midjourney\/<\/a><br><\/li>\n\n\n\n<li><em>How to use Dall-E 2 to turn your ideas into AI-generated art<\/em>, ZDNet : <a href=\"https:\/\/www.zdnet.com\/article\/how-to-use-dall-e-2-to-turn-your-creative-visions-into-ai-generated-art\/\">https:\/\/www.zdnet.com\/article\/how-to-use-dall-e-2-to-turn-your-creative-visions-into-ai-generated-art\/<\/a><br><\/li>\n\n\n\n<li><em>How to use Bing image creator<\/em>, ZDNet : <a href=\"https:\/\/www.zdnet.com\/article\/how-to-use-bing-image-creator\/\">https:\/\/www.zdnet.com\/article\/how-to-use-bing-image-creator\/<\/a><br><\/li>\n\n\n\n<li><em>How to use Adobe Firefly<\/em>, Jas Singh : <a href=\"https:\/\/twitter.com\/TheJasSingh\/status\/1663539500889387008?s=20\">https:\/\/twitter.com\/TheJasSingh\/status\/1663539500889387008?s=20<\/a><br><\/li>\n\n\n\n<li><em>Introduction to diffusion models for machine learning<\/em>, Ryan O&rsquo;Connor : <a href=\"https:\/\/www.assemblyai.com\/blog\/diffusion-models-for-machine-learning-introduction\/\">https:\/\/www.assemblyai.com\/blog\/diffusion-models-for-machine-learning-introduction\/<\/a><\/li>\n<\/ul>\n\n\n\n<p class=\"wp-block-paragraph\"><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Voici un aper\u00e7u des g\u00e9n\u00e9rateurs d&rsquo;images en 2023, mettant en lumi\u00e8re DALL-E 3 qui offre des cr\u00e9ations fascinantes. D\u00e9couvrez son fonctionnement, ses avantages, ainsi que d&rsquo;autres options disponibles avec des d\u00e9tails sur leur utilisation.<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[11],"tags":[],"class_list":["post-856","post","type-post","status-publish","format-standard","hentry","category-modeles-dimage","post-preview"],"_links":{"self":[{"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/posts\/856","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/comments?post=856"}],"version-history":[{"count":0,"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/posts\/856\/revisions"}],"wp:attachment":[{"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/media?parent=856"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/categories?post=856"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/artificiellementintelligent.eu\/index.php\/wp-json\/wp\/v2\/tags?post=856"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}