Article n° 50 [13 mai 2026]

[Article au hasard 🎲] [Précédent] [Suivant]

La génération d'images avec Stable Diffusion

Moar mascottes et autres boobettes !

[Les applications sous macOS] [Prompts et modèles]

Les mascottes vous accueillent dans leur atelier de génération d'images !

[Qu'est-ce que Stable Diffusion ?] [L'IA est-elle notre seul avenir ?]

[👭 Lien direct pour ceux qui sont venus pour les miss ! 👭]

Les petites mascottes du site ont du succès !

Les pages leur étant dédiées étant indéniablement populaires, La Revue a décidé de vous proposer à l'occasion de ce cinquantième article, et accessoirement des 29 ans du webzine, une toute nouvelle page où elles seront particulièrement à l'honneur.

Et pour cet événement spécial, tout ce qui est lié à leur création avec ces fameux modèles de Stable Diffusion vous sera dévoilé. Qu'est-ce donc que cette technologie ? Est-il possible de l'utiliser simplement ? A t-on besoin d'une licence ou d'un abonnement ?

Un article exceptionnel en plusieurs pages - je n'ai pas mégoté sur les heures de travail pour vous le proposer - où vous allez découvrir tous les secrets des petites boobettes qui vous accueillent toujours chaleureusement sur le TheRaphit's Web Site !

Stable Diffusion : qu'est-ce que c'est ?

Stable Diffusion est une méthode de génération d'images à partir d'instructions textuelles, composée de plusieurs modèles d'intelligence artificielle fonctionnant ensemble - des réseaux de neurones virtuels ayant été entraînés suivant des méthodes de deep learning.

Le composant clé est le modèle de diffusion, dont le nom provient de la thermodynamique. La théorie de fonctionnement de ce modèle d'IA fait en effet appel à des équations similaires à celles permettant d'étudier le phénomène nommé ainsi dans les fluides, par exemple lorsque l'on introduit du colorant dans de l'eau. Si vous vous demandiez, c'est d'ailleurs ce à quoi fait référence le bandeau de marge de cet article. Oui je sais que vous vous en foutez, mais juste au cas où...

[Diffusion de colorant violet dans de l'eau]

[Diffusion de colorant violet dans de l'eau]

Pour redevenir (un peu plus) sérieux : on part d'un jeu de données composé de nombreuses images accompagnées d'une description. le modèle est alors instruit à retirer du bruit ajouté artificiellement sur les images d'entraînement, en ayant intentionnellement « mélangé » celles-ci, comme si l'ensemble des pixels de tout le dataset s'était diffusé dans celui-ci. On augmente progressivement ce niveau de bruit durant toute la phase d'apprentissage, jusqu'à ce que celui-ci soit indistinguable d'une distribution uniforme, à l'image de l'eau colorée ci-dessus.

Une fois ceci fait, l'idée c'est alors de fournir en entrée au modèle entraîné un texte descriptif - le fameux prompt - ainsi qu'un « bruit » constitué de pixels aléatoires. Le réseau de neurones va alors reconstituer une image par un processus itératif, comme s'il inversait une hypothétique diffusion. L'image résultante sera alors la plus « proche » (statistiquement parlant) de celles ayant servi à l'entraînement, parmi le sous-ensemble du jeu de données correspondant au prompt.

Néanmoins elle sera différente de toutes celles du dataset, car uniquement produite à partir des pixels aléatoires fournis au départ.

[Génération - Etape #1]

Le processus de génération menant à une image finale en 1024 × 576, au bout de 28 étapes

A partir du même modèle, d'une configuration identique de celui-ci ainsi qu'un prompt et d'un jeu de pixels donnés, on obtiendra toujours la même image. Le processus suit un schéma mathématique déterministe, fonctionnant notamment avec les fameux tenseurs. Mais la grande quantité de conditions initiales possibles conduit à une grande variété des résultats. C'est très similaire aux suites chaotiques servant à créer des fractales, où une légère modification des paramètres peut conduire à des résultats extrêmement différents tout en utilisant la même fonction de récurrence.

[Détail Julia-Newton degré 3 #1]

Légère modification (moins d'un millième) d'un des paramètres de l'ensemble de Julia-Newton de degré 3

Dans l'idée, il n'y pas tant de différence que cela avec les fractales, c'est même plus ou moins pareil. Mais avec des boobs.

Stable diffusion a plusieurs avantages :

Vous pouvez fonctionner en autonomie totale ; tout sur votre machine, sans abonnement, sans dépendre d'une éventuelle startoopz qui va couler dans six mois façon années 2000.
Les modèles et les applications sont légers et peuvent fonctionner avec relativement peu de ressources, notamment de mémoire (ça coûte cher).
Vous vous adressez directement au modèle d'IA dans le sens où vos prompts ne sont pas filtrés ; s'il a été entraîné avec un dataset comprenant des boobs, il pourra vous dessiner des boobs !
Si vous utilisez votre propre matériel, vous êtes propriétaire des images que vous avez générées, et vous êtes donc libre de les utiliser comme bon vous semble, y compris commercialement.

Parmi les inconvénients, on peut noter :

C'était state-of-the-art en 2022, mais maintenant c'est un peu dépassé, tous les outils en ligne des grosses sociétés d'IA font mieux... La censure mis à part !
Difficultés à obtenir sur l'image produite exactement la scène et l'agencement que l'on souhaite
Il y a pas mal d'hallucinations, il faut parfois faire beaucoup d'essais pour obtenir un résultat sans défaut ; et il y aura tout de même ce « rendu IA » assez caractéristique, heureusement c'est beaucoup moins gênant pour le style anime.

A noter que la technologie est développée par la société stability.ai si vous souhaitez vous renseigner plus avant.

Partie Ⅰ - Applications macOS

Pour créer les anime girls de vos rêves, je vous propose de découvrir deux applications sous macOS.

J'ai fait le choix de vous en présenter sur cette plateforme car les dernières puces Apple Silicon de la série M ainsi que l'architecture en mémoire partagée sont particulièrement adaptées pour faire fonctionner les modèles d'IA. Pas besoin d'acquérir séparément de carte graphique ou de GPU externe... Dans un Mac (même portable) tout est déjà intégré !

De plus, sous macOS les logiciels sont qualitatifs et vraiment très simples à installer et à utiliser. Il n'y a besoin d'aucune connaissance élaborée en informatique.

Fenêtre de l'application Draw Things sous macOS

Quelques bases au sujet de la génération d'images avec Stable Diffusion sont également abordées sur cette page , ce qui vous permettra de prendre en main rapidement l'un des deux programmes pour pouvoir débuter avec votre boobette factory.

Bien sûr, vous n'avez pas absolument besoin d'un appareil Apple. Stable Diffusion étant open-source, il est disponible sur à peu près toutes les architectures et systèmes. Si vous êtes un peu plus calé et que vous avez un GPU à disposition sur votre machine, vous pouvez même passer directement à la Partie Ⅱ ci-dessous.

Attention, vous risquez de devenir addict...

Partie Ⅱ - Prompts et modèles

Ici nous entrons dans le vif du sujet, et dans les arcanes de l'usine à boobs de TheRaphit.com et Noellys.net ! Je vais vous dévoiler toutes les petites subtilités dont vous pourrez vous servir pour générer ensuite directement vos propres images chez vous.

Différentes images produites par le même prompt

Des anime girls à volonté, que demander de mieux ?

Vous trouverez également deux modèles Stable Diffusion, à télécharger via cette page, ce qui vous épargnera pas mal de temps de recherche. De plus, ils sont non censurés et sans marquage. Bien qu'étant tous deux entraînés spécifiquement pour les anime girls, ils permettent d'obtenir des images qui ont des « ressentis » différents.

Même prompt, seed et paramètres identiques, mais le modèle est différent

L'image à gauche a été produite par celui que j'utilise pour toutes les illustrations du site, qui a un style assez proche de l'animation des années 1980-2000. Le second modèle produit des images plus lumineuses et contrastées, mais dans un style plus moderne qui est moins en phase avec mon site (presque) trentenaire.

Je vous ai rassemblé tous les éléments qui vous permettront de faire votre choix !

Enfin pour terminer, la troisième section de la page est dédiée à l'utilisation d'un Upscaler - un autre modèle d'IA générative, mais lui spécialisé dans l'agrandissement d'images. Il s'agit de l'étape finale du processus permettant d'obtenir de belles images bien lisses, en résolution 4K et plus, et de haute qualité !

Le module d'agrandissement d'image de DiffusionBee

Vous n'allez définitivement plus pouvoir vous en passer ! 😍

La petite galerie

Pour ceux qui sont venus tout spécialement pour les petites mascottes (et je les comprends), j'ai rassemblé ici quelques nouvelles créations de mon cru, pour votre plus grand plaisir ! Et le tout dédié exclusivement à la mascotte principale du site ainsi qu'à la fameuse « stagiaire aux cheveux roses » dont tout le monde est fan. 🙂 Il faut dire qu'elles sont si accueillantes...

Certaines de ces images sont utilisées en tant qu'exemples dans les pages précédentes, et ici vous en retrouverez à chaque fois la version haute résolution (4096 × 2304) telle que directement sortie du modèle d'agrandissement de DiffusionBee.

Entre autres choses, ce sont des varianates de l'image illustrant cet article, sur le thème des mascottes qui travaillent à générer des images d'anime girls.

La galerie bonus – Pour les meilleurs d'entre vous...

Vous ne pensiez tout de même pas que j'allais oublier le dessert...
On n'est pas là pour être ici ! C'est l'heure du cadeau du patron™ !!

Ces boobs 😍 on ne s'en lasse définitivement pas.

TheRaphit ne déçoit jamais.

Je précise que générer ces images ne m'a pas coûté 2,5 milliards d'euros...

Si c'est la première page au sujet des mascottes que vous visitez, sachez que vous pourrez également trouver quelques autres images sur la page additionnelle de l'article n° 40 ainsi que sur la page servant de placeholder aux articles indisponibles de La Revue, où elles sont tout aussi accueillantes...

La rumeur dirait même qu'il y a une troisième mascotte...

L'IA est-elle notre seul avenir ?

J'ai régulièrement pesté contre les « Intelligences Aberrantes » sur diverses pages de mon site. Il faut dire que c'est très souvent l'occasion de sacrées marades, entre Lucie qui ne sait pas compter ou les taxis autonomes immobilisés par des cônes de chantier.

Néanmoins les petites mascottes se sont bien installées ici et m'ont aidées à rendre plusieurs pages plus agréables. Quelque part c'est un joli : IA 1 - TheRaphit 0.

Il faut dire que je suis d'un naturel très méfiant envers les bonimenteurs des industries émergeantes, vu les salades qu'on nous a cuisinées juste avant la rententissante crise des startup de 2001 - justement survenue peu après la soudaine disponibilité de l'accès Internet pour le grand public - alors que le réseau mondial existe pourtant depuis 1983.

[Logo GTS]

Tous ces trucs ont coulé dans le manteau encore plus profondément qu'une plaque lithosphérique, engloutissant au passage avec eux des centaines de millions, et parfois des milliards.

On a vite fait de nous vendre la Lune (et Mars aussi) lorsqu'une nouvelle technologie pointue sort des laboratoires où elle était confinée depuis une ou plusieurs décennies pour devenir tout d'un coup accessible à tout le monde. C'est le cas des réseaux de neurones depuis 2020, mais aussi de l'informatique au début des années 1980.

[Réclame pour Apple dans les années 1980]

Réclame pour Apple, à l'époque des débuts de la micro-informatique personnelle

Ah oui ça annonçait du rêve... Comme OpenAI aujourd'hui.

Alors que souvent, une fois pressé le bouton « Generate », vous allez obtenir quelque chose de bien trop brut pour être utilisé en l'état, qui va nécessiter une certaine quantité de travail humain derrière. La promesse des « agents IA » (c'est la nouvelle mode) qui vont vous permettre de licencier tous vos salariés est bien loin d'être tenue.

[Logo Noellys brut]

A gauche, le logo du Noellys' Hentai World tel que sorti de l'IA, où les pixels noirs ont été recolorés en vert - ce qui montre qu'un grand nombre de ceux de l'arrière plan de l'image n'étaient en réalité pas noirs.

A droite, le même logo une fois retravaillé à la main, prêt à être converti en fond transparent pour être intégré aux pages Web.

Il faut savoir que l'écrasante majorité des images que l'on trouve sur Internet sont absolument dégôlass, et qu'aucune zone censée être de couleur unie dedans ne l'est réellement... Et ce sont pourtant ces mêmes images qui ont servi de base d'apprentissage aux grands modèles.

Aussi lorsque vous leur demandez « arrière plan noir uni », eh bien ça ne l'est pas. Car pour eux, un fond d'image n'est jamais uniforme. Et ils ne sont pas encore assez « intelligents » pour s'en rendre compte, et vous sortir un truc propre. Et ces nombreux petits défauts pas forcément visibles immédiatement que vous trouvez ici sur une simple image, vous allez les retrouver aussi lorsque vous demandez la rédaction d'un document juridique de dizaines de pages.

Au final, j'ai bien passé une bonne soirée à entièrement « nettoyer » l'image à la main. J'aurais peut-être dû faire mon logo entièrement moi-même depuis le début, ça m'aurait sans doute pas pris plus de temps...

En bref, l'IA apporte des outils très sympathiques pour le domaine du divertissement... Mais il ne faut rien déployer en production ce qui a été « fabriqué » par un modèle, en particulier des programmes informatiques... Et tous ceux qui savent travailler proprement sur cette planète ne vont pas perdre leur emploi demain. 😉

⚠ Attention aux générateurs d'images en ligne ⚠

Plutôt que de faire fonctionner Stable Diffusion localement sur votre propre machine, un certain nombre de sites peu scrupuleux vont vous proposer d'utiliser leur générateur, avec leur réclame habituelle à euro-zéro-cinq expliquant pourquoi leur modèle est « beaucoup plus mieux ».

C'est la plupart du temps du scam :
Aucun moyen de savoir à priori si les modèles qu'ils vous proposent sont bridés ou non.
Les prompts saisis sur un formulaire Web peuvent être modifiés avant d'être soumis au modèle.
Vous allez vous retrouver à payer pour des images inutilisables : même avec un prompt correct et un modèle bien entraîné, vous allez obtenir régulièrement du KK. Ce sont les aléas de l'IA... Personne ne sait vraiment ce qu'il se passe dans la « boîte noire » que constitue un réseau de neurones artificiel.
Un système de « fingerprinting » peut être ajouté aux images, permettant au site qui vous les a produites de les identifier une fois publiées sur Internet... Et de vous demander de payer des droits pour certaines utilisations - car ils en sont légalement les propriétaires.
De plus, étant donné qu'il faut procéder à l'agrandissement - qui supprime aussi le bruit issu de la génération, comme vous le verrez ici - pour obtenir un résultat utilisable, vous allez devoir payer une rallonge (s'ils le proposent) ou finalement devoir le faire vous-même.

En résumé, ceux qui vous vantent l'obtention de « l'image de vos rêves » grâce à leur site d'IA payant ne sont que des margoulins.

Même si c'est un lent, c'est beaucoup plus intéressant de faire tourner un modèle directement chez vous. Ici, comme toujours, vous avez la garantie que les modèles proposé en téléchargement sont véritablement ceux qui ont servi à produire toutes les images de cet article.

Avec TheRaphit, pas d'entourloupes !

La génération d'images avec Stable Diffusion

Page principale

[(1) Les applications sous macOS] [(2) Prompts et modèles]

La Revue de TheRaphit.com

Nombre de visiteurs
depuis le 13 mai 1997.

[Accueil] [C'est quoi ?]

TheRaphit's Web Site - La dernière homepage du Web

[(Tout)² Evangelion]

Webzine : La Revue

[Manga Pink Zone] [Mathématiques]

[Nouveautés] [Téléchargements] [FAQ illustrée]

Site créé le 16 janvier 1997
©1997-2026 by TheRaphit
www.theraphit.com