|
La génération d'images avec Stable Diffusion
Moar mascottes et autres boobettes !
[Les applications sous macOS]
[Prompts et modèles]
Les mascottes vous accueillent dans leur atelier de génération d'images !
[Qu'est-ce que Stable Diffusion ?]
[L'IA est-elle notre seul avenir ?]
[👭 Lien direct pour ceux qui sont venus pour les miss ! 👭]
Les petites mascottes du site ont du succès !
Les pages leur étant dédiées étant indéniablement populaires, La Revue a décidé de
vous proposer à l'occasion de ce cinquantième article, et accessoirement des 29 ans du Webzine, une toute nouvelle page où elles seront particulièrement à l'honneur.
Et pour cet événement spécial, tout ce qui est lié à leur création avec ces fameux modèles
de Stable Diffusion vous sera dévoilé. Qu'est-ce donc que cette technologie ?
Est-il possible de l'utiliser simplement ? A t-on besoin d'une licence ou d'un
abonnement ?
Un article exceptionnel en plusieurs pages - je n'ai pas mégoté sur les heures
de travail pour vous le proposer - où vous allez découvrir tous les secrets
des petites boobettes qui vous accueillent toujours chaleureusement sur
le TheRaphit's Web Site !
Stable Diffusion : qu'est-ce que c'est ?
Stable Diffusion est une méthode de génération d'images à partir d'instructions
textuelles, composée de plusieurs modèles d'intelligence artificielle fonctionnant
ensemble - des réseaux de neurones virtuels ayant été entraînés suivant des méthodes
de deep learning.
Le composant clé est le modèle de diffusion, dont le nom provient de
la thermodynamique. La théorie de fonctionnement de ce modèle d'IA fait en effet appel
à des équations similaires à celles permettant d'étudier le phénomène nommé ainsi dans
les fluides, par exemple lorsque l'on introduit du colorant dans de l'eau. Si vous vous
demandiez, c'est d'ailleurs ce à quoi fait référence le bandeau de marge de cet article.
Oui je sais que vous vous en foutez, mais juste au cas où...
Pour redevenir (un peu plus) sérieux : on part d'un jeu de données composé
de nombreuses images accompagnées d'une description. le modèle est alors instruit
à retirer du bruit ajouté artificiellement sur les images d'entraînement, en ayant
intentionnellement « mélangé » celles-ci, comme si l'ensemble
des pixels de tout le dataset s'était diffusé dans celui-ci.
On augmente progressivement ce niveau de bruit durant toute la phase d'apprentissage,
jusqu'à ce que celui-ci soit indistinguable d'une distribution uniforme,
à l'image de l'eau colorée ci-dessus.
Une fois ceci fait, l'idée c'est alors de fournir en entrée au modèle entraîné un
texte descriptif - le fameux prompt - ainsi qu'un
« bruit » constitué de pixels aléatoires. Le réseau
de neurones va alors reconstituer une image par un processus itératif, comme s'il
inversait une hypothétique diffusion. L'image résultante sera alors la plus
« proche » (statistiquement parlant) de celles ayant servi
à l'entraînement, parmi le sous-ensemble du jeu de données correspondant au prompt.
Néanmoins elle sera différente de toutes celles du dataset, car uniquement
produite à partir des pixels aléatoires fournis au départ.
Le processus de génération menant à une image finale en 1024 × 576, au bout de 28 étapes
A partir du même modèle, d'une configuration identique de celui-ci ainsi qu'un prompt
et d'un jeu de pixels donnés, on obtiendra toujours la même image. Le processus
suit un schéma mathématique déterministe, fonctionnant notamment
avec les fameux tenseurs. Mais la grande quantité
de conditions initiales possibles conduit à une grande variété des résultats.
C'est très similaire aux suites chaotiques servant à créer des
fractales, où une légère modification des paramètres
peut conduire à des résultats extrêmement différents tout en utilisant la même fonction
de récurrence.
Légère modification (moins d'un millième) d'un des paramètres de l'ensemble de Julia-Newton de degré 3
Dans l'idée, il n'y pas tant de différence que cela avec les fractales,
c'est même plus ou moins pareil. Mais avec des boobs.
Stable diffusion a plusieurs avantages :
-
Vous pouvez fonctionner en autonomie totale ; tout sur votre machine, sans
abonnement, sans dépendre d'une éventuelle startoopz qui va couler dans six mois
façon années 2000.
-
Les modèles et les applications sont légers et peuvent fonctionner avec relativement peu de ressources, notamment de mémoire (ça coûte cher).
-
Vous vous adressez directement au modèle d'IA dans le sens où vos prompts
ne sont pas filtrés ; s'il a été entraîné avec un dataset comprenant
des boobs, il pourra vous dessiner des boobs !
-
Si vous utilisez votre propre matériel, vous êtes propriétaire des images
que vous avez générées, et vous êtes donc libre de les utiliser comme bon vous semble,
y compris commercialement.
Parmi les inconvénients, on peut noter :
-
C'était state-of-the-art en 2022, mais maintenant c'est un peu dépassé, tous
les outils en ligne des grosses sociétés d'IA font mieux... La censure mis à part !
-
Difficultés à obtenir sur l'image produite exactement la scène et l'agencement que l'on souhaite
-
Il y a pas mal d'hallucinations, il faut parfois faire beaucoup d'essais pour obtenir
un résultat sans défaut ; et il y aura tout de même
ce « rendu IA » assez caractéristique, heureusement c'est beaucoup
moins gênant pour le style anime.
A noter que la technologie est développée par la société
stability.ai si vous souhaitez
vous renseigner plus avant.
Partie Ⅰ - Applications macOS
Pour créer les anime girls de vos rêves, je vous propose de découvrir
deux applications sous macOS.
J'ai fait le choix de vous en présenter sur cette plateforme car les dernières
puces Apple Silicon de la série M ainsi que l'architecture en mémoire partagée
sont particulièrement adaptées pour faire fonctionner les modèles d'IA. Pas
besoin d'acquérir séparément de carte graphique ou de GPU externe... Dans un
Mac (même portable) tout est déjà intégré !
De plus, sous macOS les logiciels sont qualitatifs et vraiment très simples
à installer et à utiliser. Il n'y a besoin d'aucune connaissance élaborée
en informatique.
Fenêtre de l'application Draw Things sous macOS
Quelques bases au sujet de la génération d'images avec Stable Diffusion sont
également abordées sur cette page , ce qui vous permettra de prendre en main rapidement
l'un des deux programmes pour pouvoir débuter avec votre boobette factory.
Bien sûr, vous n'avez pas absolument besoin d'un appareil Apple.
Stable Diffusion étant open-source, il est disponible sur à peu près
toutes les architectures et systèmes. Si vous êtes un peu plus calé et que vous
avez un GPU à disposition sur votre machine, vous pouvez même passer directement
à la Partie Ⅱ ci-dessous.
Attention, vous risquez de devenir addict...
Partie Ⅱ - Prompts et modèles
Ici nous entrons dans le vif du sujet, et dans les arcanes
de l'usine à boobs de TheRaphit.com et
Noellys.net ! Je vais vous dévoiler
toutes les petites subtilités dont vous pourrez vous servir
pour générer ensuite directement vos propres images chez vous.
Différentes images produites par le même prompt
Des anime girls à volonté, que demander de mieux ?
Vous trouverez également deux modèles Stable Diffusion,
à télécharger via cette page, ce qui vous épargnera pas mal de temps de recherche.
De plus, ils sont non censurés et sans marquage.
Bien qu'étant tous deux entraînés spécifiquement pour les anime girls,
ils permettent d'obtenir des images qui ont des « ressentis »
différents.
Même prompt, seed et paramètres identiques, mais le modèle est différent
L'image à gauche a été produite par celui que j'utilise pour toutes les illustrations
du site, qui a un style assez proche de l'animation des années 1980-2000. Le second
modèle produit des images plus lumineuses et contrastées, mais dans un style
plus moderne qui est moins en phase avec mon site (presque) trentenaire.
Je vous ai rassemblé tous les éléments qui vous permettront de faire votre choix !
Enfin pour terminer, la troisième section de la page est dédiée à l'utilisation
d'un Upscaler - un autre modèle d'IA générative, mais lui spécialisé
dans l'agrandissement d'images. Il s'agit de l'étape finale du processus permettant
d'obtenir de belles images bien lisses, en résolution 4K et plus, et de haute qualité !
Le module d'agrandissement d'image de DiffusionBee
Vous n'allez définitivement plus pouvoir vous en passer ! 😍
La petite galerie
Pour ceux qui sont venus tout spécialement pour les petites mascottes
(et je les comprends), j'ai rassemblé ici quelques nouvelles créations
de mon cru, pour votre plus grand plaisir ! Et le tout dédié exclusivement
à la mascotte principale du site ainsi qu'à la fameuse
« stagiaire aux cheveux roses » dont tout le monde
est fan. 🙂 Il faut dire qu'elles sont si accueillantes...
Certaines de ces images sont utilisées en tant qu'exemples dans les pages précédentes,
et ici vous en retrouverez à chaque fois la version haute résolution
(4096 × 2304) telle que directement sortie du modèle d'agrandissement de
DiffusionBee.
Entre autres choses, ce sont des varianates de l'image illustrant cet article, sur le thème des mascottes qui travaillent à générer des images d'anime girls.
La galerie bonus – Pour les meilleurs d'entre vous...
Vous ne pensiez tout de même pas que j'allais oublier le dessert...
On n'est pas là pour être ici ! C'est l'heure du cadeau du patron™ !!
Ces boobs 😍 on ne s'en lasse définitivement pas.
TheRaphit ne déçoit jamais.
Je précise que générer ces images ne m'a pas coûté 2,5 milliards d'euros...
L'IA est-elle notre seul avenir ?
J'ai régulièrement pesté contre les « Intelligences Aberrantes »
sur diverses pages de mon site. Il faut dire que c'est très souvent l'occasion
de sacrées marades, entre Lucie qui ne sait pas
compter ou les taxis autonomes
immobilisés par des cônes de chantier.
Néanmoins les petites mascottes se sont bien installées ici et m'ont aidées
à rendre plusieurs pages plus agréables. Quelque part c'est un joli :
IA 1 - TheRaphit 0.
Il faut dire que je suis d'un naturel très méfiant envers les bonimenteurs des industries
émergeantes, vu les salades qu'on nous a cuisinées juste avant la rententissante crise
des startup de 2001 - justement survenue peu après la soudaine disponibilité de l'accès
Internet pour le grand public - alors que le réseau mondial existe pourtant depuis 1983.
|
Tous ces trucs ont coulé dans le manteau encore plus profondément qu'une plaque lithosphérique, engloutissant au passage avec eux des centaines de millions, et parfois des milliards.
|
On a vite fait de nous vendre la Lune (et Mars aussi) lorsqu'une nouvelle technologie
pointue sort des laboratoires où elle était confinée depuis une ou plusieurs décennies
pour devenir tout d'un coup accessible à tout le monde. C'est le cas
des réseaux de neurones depuis 2020, mais aussi de l'informatique au début des
années 1980.
Réclame pour Apple, à l'époque des débuts de la micro-informatique personnelle
Ah oui ça annonçait du rêve... Comme OpenAI aujourd'hui.
Alors que souvent, une fois pressé le bouton « Generate »,
vous allez obtenir quelque chose de bien trop brut pour être utilisé en l'état, qui
va nécessiter une certaine quantité de travail humain derrière. La promesse des
« agents IA » (c'est la nouvelle mode) qui vont vous
permettre de licencier tous vos salariés est bien loin d'être tenue.
A gauche, le logo du Noellys' Hentai World tel que sorti de l'IA, où les pixels noirs ont été recolorés en vert -
ce qui montre qu'un grand nombre de ceux de l'arrière plan de l'image n'étaient en réalité
pas noirs.
A droite, le même logo une fois retravaillé à la main, prêt à être converti en fond transparent pour être intégré aux pages Web.
|
Il faut savoir que l'écrasante majorité des images que l'on trouve sur Internet
sont absolument dégôlass, et qu'aucune zone censée être de couleur unie dedans ne l'est
réellement... Et ce sont pourtant ces mêmes images qui ont servi de base d'apprentissage
aux grands modèles.
Aussi lorsque vous leur demandez « arrière plan noir uni », eh
bien ça ne l'est pas. Car pour eux, un fond d'image n'est jamais uniforme. Et ils ne
sont pas encore assez « intelligents » pour s'en rendre compte,
et vous sortir un truc propre. Et ces nombreux petits défauts pas forcément visibles
immédiatement que vous trouvez ici sur une simple image, vous allez les retrouver
aussi lorsque vous demandez la rédaction d'un document juridique de dizaines de pages.
Au final, j'ai bien passé une bonne soirée à entièrement
« nettoyer » l'image à la main. J'aurais peut-être dû faire
mon logo entièrement moi-même depuis le début, ça m'aurait sans doute pas pris plus
de temps...
En bref, l'IA apporte des outils très sympathiques pour le domaine du
divertissement... Mais il ne faut rien déployer en production ce qui a
été « fabriqué » par un modèle,
en particulier des programmes informatiques... Et tous ceux qui savent travailler
proprement sur cette planète ne vont pas perdre leur emploi demain. 😉
⚠ Attention aux générateurs d'images en ligne ⚠
Plutôt que de faire fonctionner Stable Diffusion localement sur votre propre
machine, un certain nombre de sites peu scrupuleux vont vous proposer d'utiliser
leur générateur, avec leur réclame habituelle à euro-zéro-cinq expliquant
pourquoi leur modèle est « beaucoup plus mieux ».
C'est la plupart du temps du scam :
-
Aucun moyen de savoir à priori si les modèles qu'ils vous proposent sont bridés ou non.
-
Les prompts saisis sur un formulaire Web peuvent être modifiés avant d'être
soumis au modèle.
-
Vous allez vous retrouver à payer pour des images inutilisables : même avec un prompt
correct et un modèle bien entraîné, vous allez obtenir régulièrement du KK. Ce sont
les aléas de l'IA... Personne ne sait vraiment ce qu'il se passe dans la
« boîte noire » que constitue un réseau de neurones artificiel.
-
Un système de « fingerprinting » peut être ajouté aux images, permettant au site qui vous les a produites de les identifier une fois publiées sur Internet... Et de vous demander de payer des droits pour certaines utilisations - car ils en sont
légalement les propriétaires.
De plus, étant donné qu'il faut procéder à l'agrandissement - qui supprime aussi le
bruit issu de la génération,
comme vous le verrez ici - pour obtenir
un résultat utilisable, vous allez devoir payer une rallonge (s'ils le proposent)
ou finalement devoir le faire vous-même.
En résumé, ceux qui vous vantent l'obtention de
« l'image de vos rêves » grâce à leur site d'IA payant
ne sont que des margoulins.
Même si c'est un lent, c'est beaucoup plus intéressant de faire
tourner un modèle directement chez vous. Ici, comme toujours, vous avez la garantie
que les modèles proposé en téléchargement sont véritablement ceux qui
ont servi à produire toutes les images de cet article.
Avec TheRaphit, pas d'entourloupes !
La génération d'images avec Stable Diffusion
Page principale
[(1) Les applications sous macOS]
[(2) Prompts et modèles]
La Revue de TheRaphit.com
![[Compteur]](https://webcounter-ipv4.theraphit.com/scripts/Count.cgi?dd=B&ft=1&df=revue.dat)
Nombre de visiteurs
depuis le 13 mai 1997.
[Accueil]
[C'est quoi ?]
TheRaphit's Web Site - La dernière homepage du Web
[(Tout)2 Evangelion]
Webzine : La Revue
[Manga Pink Zone]
[Mathématiques]
[Nouveautés]
[Téléchargements]
[FAQ illustrée]
Site créé le 16 janvier 1997
©1997-2026 by TheRaphit
www.theraphit.com
|