|
Prompts et modèles Stable Diffusion
Spécialement dédiés aux anime girls !
[Les applications sous macOS]
Prompts et modèles
Prompts insérés dans DiffusionBee produisant deux images différentes
[Les prompts]
[Deux modèles à télécharger]
[L'agrandissement]
Le moment est venu de demander à ces braves réseaux de neurones et aux logiciels qui
les font fonctionner de nous livrer du rêve !
Nous allons voir les bases du prompting avec Stable Diffusion, puis ensuite
je vous propose de télécharger sur cette page deux modèles différents, spécialement
entraînés pour produire des images dans le style anime (et encore plus
particulièrement, avec des filles). Le tout sans censure !
La seule limite c'est votre imagination... Elle n'est pas belle la vie ?
Enfin la dernière partie aborde l'utilisation d'un modèle d'agrandissement, étape
finale indispensable et permettant d'obtenir le meilleur des résultats.
Rédaction des prompts
La première chose à noter, c'est qu'il va vous falloir écrire vos instructions
en anglais. C'est en effet avec des descriptions dans cette langue que
les dataset d'entraînement ont été constitués. Oui au 21ème siècle
les humains s'expriment avec des centaines de variantes linguistiques, mais les machines
n'en connaissent qu'une seule.
Vous pouvez bien sûr vous aider de Google Traduction, mais sachez que
Draw Things (vu précédemment)
intègre un vérificateur orthographique dans la fenêtre de prompt.
C'est vraiment pour l'exemple...
Qui ne sait pas écrire « boobs » ?
C'est loin d'être inutile. Car pour le modèle, un mot mal orthographié, ce n'est
pas le bon mot ! Les machines, même « intelligentes », restent
des machines.
Ensuite, pour assurer la meilleure interprétation possible, il vaut mieux adopter un
style télégraphique - plutôt qu'une phrase telle que...
A blond girl with green eyes and big boobs, wearing a white t-shirt showing a cleavage.
Il vaut mieux entrer :
one girl, blond hair, green eyes, big boobs, white t-shirt, cleavage
Renseignements pris un peu partout, c'est ce qui est conseillé sur divers formus.
Et d'ailleurs, si vous demandez à ChatGPT ou Gemini de vous préparer un prompt pour
Stable Diffusion, c'est ce qu'ils vont faire. Ah oui c'est quand même incroyable
le 21ème siècle, on a des machines qui travaillent pour nous, on peut faire
prompter des modèles par d'autres pour finalement leur donner des instructions comme
si on leur envoyait un télégramme au 19ème siècle. Au moins il n'y pas
besoin de mettre « STOP » à la fin.
J'étais bien évidemment o-bli-gé de vous montrer le résultat obtenu avec ce prompt
Attention aussi aux répétitions. Par exemple si vous écrivez
'girl'
plusieurs fois dans le prompt, même au singulier et à plusieurs mots d'intervalle,
le modèle pourrait comprendre que vous souhaitez qu'il vous dessine deux filles -
on n'est pas vraiment contre notez bien, mais on se les garde pour les jours
où on est en forme.
Comme vous avez pu le voir sur l'image illustrant cette page, il y a en fait deux prompts
à donner : le
Prompt principal (positif)
et le
Negative Prompt. Pour chacun d'entre eux,
Il y a un certain nombre de mots-clés que recommandent d'inclure systématiquement
ceux qui ont entraîné les modèles, mais aussi les développeurs de Stable Diffusion.
Ce sont les prompts de base.
Ainsi, en tant que vous pouvez employer :
(masterpiece, best quality), newest, highres, absurdres
Et pour le :
(low quality, worst quality:1.5), (bad anatomy), lowres, bad composition, fewer digits, text, username, logo, inaccurate eyes, fewer digits, extra arms, disfigured, missing arms, too many fingers, fused fingers, missing fingers
Les parenthèses indiquent une priorité des mots clés ainsi délimités par rapport
aux autres, et un mot-clé peut être suffixé d'un symbole : (deux points)
lui-même immédiatement suivi d'un nombre indiquant une priorité supplémentaire.
Je précise qu'il ne faut pas mettre de négation
(comme 'no extra arms') dans le prompt négatif,
moins par moins ça fait plus !
C'est loin d'être une science exacte : un tel prompt négatif n'empêchera pas
les hallucinations et des filles à trois bras d'apparaître assez souvent...
Mais cela ne coûte pas cher à ajouter - d'autant plus qu'avec Draw Things,
c'est une fenêtre cachée qui le contient, et vous pouvez
vous contenter de l'oublier après l'avoir écrit.
Dans la suite de cet page, lorsqu'un prompt sera donné, les
et seront implicites.
Y a-t-il un ordre à respecter pour les différents mots ? Théoriquement non, mais je
vous recommanderais tout de même d'entrer une description d'image
« telle qu'un humain la ferait » car ce sont bel et bien des
vrais gens qui ont constitué les datasets. Après les prompts de base (qui ont
la priorité la plus élevée) commencez donc par la description
du physique (avantageux) de la fille, puis sa posture et enfin le reste de la scène.
Puisque les modèles ne vont justement pas respecter scrupuleusement les prompts, une
des règles que vous pouvez appliquer c'est le less is more. Commencez par
en entrer de très simples, pour voir ce qu'il en sort. En effet, écrire juste
forest ne signifie pas que vous allez avoir toujours les mêmes arbres.
Le nombre d'images d'entraînement d'un modèle peut être colossal et en comporter de
nombreuses différentes libellées avec le mot clé « forest ».
Enfin pour adapter la posture des demoiselles, sachez que le mot-clé
'viewer'
correspond à celui qui regarde l'image. Ainsi
'profile, looking at viewer'
produira une posture de profil où la fille tourne la tête (ou au moins les yeux)
« vers l'objectif ».
Différentes images obtenues avec le prompt :
one girl, dark short hair, yellow eyes, t-shirt, cleavage, looking at viewer, working on computer
Si vous ne précisez pas la couleur d'un vêtement (comme ci-dessus) le modèle va
être libre de s'exprimer, et les résultats peuvent être très intéressants.
Un autre bon exemple c'est le prompt de l'image d'illustration principale
de cet article - j'ai conservé pas mal de bon visuels obtenus avec, même si je ne les ai
pas retenus. Oui c'est parfois difficile de faire un choix quand tout
est si cute. 😍
Images provenant de la
petite galerie de la page principale, partageant le prompt suivant :
one girl with dark short hair and yellow eyes, one girl with pink short hair and pink eyes, cleavage, looking at viewer, smiling, background with computer screens featuring anime girls
Notez les scènes, postures et plans très variés les uns par rapport aux autres.
Vous remarquerez aussi que sans lui préciser autre chose sur la tenue vestimentaire
que 'cleavage', il nous les mets parfois
juste en lingerie... C'est un genre d'intelligence artificielle qui déçoit
beaucoup moins que ChatGPT la plupart du temps ! Quand je vous dis que vous
allez devenir addict...
Modèles à télécharger
Afin de mettre tout cela en pratique, je vous propose ici pas moins de deux modèles
différents, tous les deux entraînés spécialement pour les anime girls.
De plus, ils ne sont pas censurés, signifiant que vous pouvez obtenir sans
problèmes le résultat attendu avec les prompts qui vont bien. 🙂
Ils sont également sans marquage, c'est
à dire qu'aucun filigrane à la con ne va venir s'ajouter aux images produites
(et Dieu sait le temps fou que je passe à « nettoyer »
les images d'illustration que je récupère sur Internet à cause de ça), mais également
qu'ils n'insèrent pas de métadonnées indiquant que l'image a été générée par l'IA.
- Liens de téléchargement -
Oui, il y a des boobs à l'air...
Mais il faut bien montrer que les modèles ne sont pas censurés. 😜
TheRaphit ne bidonne pas !! 😎
two girls, nude, big boobs, looking at viewer, sat on a public bench
Télécharger le modèle [📥Counterfeit 3.0 ] (4 Go)
two girls, nude, medium boobs, looking at viewer, sat in front of a bar
Télécharger le modèle [📥Any Hentai 2.0 ] (7,2 Go)
Un petit mot sur l'extension .safetensors (qui peut vous paraître
inhabituelle) et le format associé : il s'agit d'une architecture
de réseaux de neurones qui garantit qu'aucun code malveillant ne peut être inséré
dans un modèle. Vous pouvez importer directement ces fichiers dans n'importe
quelle application de Stable Diffusion, qui les reconnaîtront.
Pour les deux applications sous macOS que je vous ai présentées, la manière de le
faire est détaillée dans la section
importer un modèle de la page
précédente de cet article.
Quel modèle choisir ?
Les deux mon capitaine ! Plus précisément, suivant ce que vous recherchez, je vous ai
fait un petit comparatif résumé ci-dessous.
|
Any Hentai 2.0
|
✅ Fonctionne particulièrement bien avec les paramètres par défaut
de Draw Things
✅ Produit des scènes complexes avec un prompt simple
✅ Grande variété de scènes et de postures avec un prompt identique
✅ Est capable de rendre pas mal de lieux connus
(Paris,
Suisse, ...)
avec une pertinence assez étonnante
|
❌ Tient assez peu compte des prompts négatifs
❌ Couleurs parfois un peu fades, avec un léger biais vers le rose
❌ Les contours peuvent être flous ou fuyants au niveau des mains ou des vêtements des personnages - généralement le manque de contraste peut rendre la scène
assez « artificielle » à l'oeil
❌ Est assez sujet aux hallucinations
|
|
Counterfeit 3.0
|
✅ Style plus moderne
✅ Contours nets et contraste vif, donnant un rendu assez réaliste faisant
moins « IA générative »
✅ Meilleure cohérence globale des images générées
✅ Nécessite peu de RAM pour fonctionner
|
❌ Le modèle a besoin d'être guidé, il faut rédiger des prompts un peu plus élaborés
❌ Moins de variété sur la corpulence et la taille des personnages
❌ Assez typé « bande dessinée » plutôt que « animation »
|
Plus précisément, Any Hentai produit des images ressemblant davantage
à l'animation japonaise des années 1980-2000. Il a tendance à bien respecter
les prompts en ce qui concerne
le sujet principal (la miss) et moins en ce qui concerne l'environnement et le décor,
où il fait souvent preuve d'une certaine « liberté ».
Une de ses particularités est qu'il dessine parfois l'arrère-plan dans un style
« photo » qui ne fait pas trop dessin animé. C'est
particulièrement vrai si on lui demande de produire une scène avec un décor
de nature, de foret ou de montagne. Cela peut parfois paraître un peu
« hors-sujet » même si c'est plutôt pas mal pour un fond d'écran.
one girl, pink short hair, pink eyes, t-shirt, cleavage, looking at viewer, smiling, nature and mountains background
one girl, dark short hair, yellow eyes, t-shirt, cleavage, looking at viewer, smiling, in a forest, sunset
Les mascottes sont de sortie à la campagne !
Pour ces raison, Any Hentai est tout particulièrement adapté à la production d'images
au format 9:16 destinées à être utilisées sur un appareil mobile, en raison de la
moindre prépondérance de l'arrière plan.
Counterfeit permet d'obtenir des images plus proches de l'animation
du 21ème siècle, plus expressives et vibrantes, plus colorées et lumineuses.
Cela accentue le réalisme des scènes. Le style « dessin » est
renforcé par tracé plus épais, particulièrement visible sur les gros plans.
one girl, standing, upper body, blond hair, blue eyes, cleavage, looking at viewer, in a small street
Remarquez ici que l'arrière-plan a l'air d'avoir été peint
Le fait qu'il faille davantage le guider sur les prompts a pour conséquence qu'il
nécessite davantage de temps pour en tirer le meilleur parti, et c'est d'ailleurs
confirmé parce ce que j'ai pu lire sur des forums.
Enfin sur les images générées par Counterfeit, les demoiselles sont généralement
plus minces et élancées. Any Hentai lui, a tendance à produire des poitrines
plus généreuses et davantage de formes en général, ce qui est illustré par les deux
images ci-dessous. Cela peut être un critère déterminant de choix. 😉
Comparaison directe des deux modèles avec même prompt, seed et paramètres
one girl, blue hair, green eyes, swimsuit outfit, sat on a chair, swimming pool background
Any Hentai à gauche – Counterfeit à droite
A la finale, Any Hentai sera assez adapté à de l'image d'illustration tandis que
Counterfeit, une fois bien maîtrisé, peut produire de très belles cover images
susceptibles d'être imprimées. Et pour les fonds d'écran ? Franchement les deux
font le job, c'est vraiment une question de préférence personnelle.
Autres exemples – ⚠ il y a encore plus de boobs !
Voici les images produites sur quatre thèmes différents, obtenues avec les prompts suivants
Dans l'ordre, de gauche à droite et/ou de haut en bas, suivant votre appareil et la taille de son écran
one girl, standing, medium boobs, topless, wearing a crystal crown, green hair, colorful crystal cave background
one girl, standing, medium boobs, topless, orange hair, looking at viewer, city buildings background
one girl, standing, medium boobs, topless, purple hair, profile, looking at viewer, beach and sea background, sunset
one girl, medium boobs, topless, blond hair, maid outfit, looking at viewer, sat on a bed in a hotel room, window with city buildings
- Counterfeit 3.0 -
- Any Hentai 2.0 -
A noter que les seeds ne sont pas identiques à chaque fois, j'ai pris l'image la plus intéressante
parmi un batch de plusieurs dizaines, générées avec chacun des prompts.
Agrandissement (upscaling)
Lorsque vous générez une image avec Stable Diffusion, vous obtenez un
résultat assez chargé en « bruit », étant donné la nature
même de cette méthode - voir
la manière dont ça fonctionne sur
la page principale. En dehors du fait qu'elle soit
en basse résolution, l'image n'est pas vraiment utilisable en l'état, même si
vous n'aviez pas besoin de plus pour une illustration.
Si vous souhaitez vous en rendre compte par vous-même, vous pouvez télécharger
l'image d'origine en 1024 × 576 telle que sortie du modèle.
C'est là qu'intervient notre fameux Upscaler. Il s'agit d'un modèle
spécialisé dans l'agrandissement d'image. Avant l'IA générative, il était déjà possible
d'augmenter la résolution d'une image en utilisant des fonctions mathématiques,
et l'interpolation cubique donnait déjà de bons résultats. Mais ici l'avantage
c'est que l'image est abordée dans sa globalité, ce qui permet non seulement d'insérer
des pixels supplémentaires de manière adéquate, mais aussi de supprimer complètement
cet effet de « bruit » car interprété par le modèle
comme des imperfections d'une image en basse résolution.
Je vais vous détailler ici l'utilisation du module d'agrandissement de l'application
DiffusionBee (voir la page
précédente de cet article) car il est particulièrement simple à utiliser.
De plus, il vous permettra aussi d'agrandir les images issues de n'importe
quelle autre source, notamment de
Draw Things
(qui lui embarque un agrandisseur intégré à la génération d'image).
L'utilisation en est assez simple. Après avoir sélectionné Upscaler
via le menu principal de l'application, il vous suffit d'ajouter votre fichier
image en cliquant dans la zone « vignette » comme indiqué
(cliquez pour ajouter...) puis de presser le bouton Upscale
en bas à droite. Il ne vous reste ensuite plus qu'à sauvegarder votre image en cliqant
sur le bouton Actions en haut à gauche de celle-ci, ce qui ouvrira un petit menu.
L'agrandisseur de DiffusionBee est particulièrement commode à utiliser, tout en étant efficace
Une image en 1024 × 768 va en ressortir avec une résolution
de 4096 × 2304, comme celle ci-dessous.
Plus généralement, l'agrandisseur de DiffusionBee permet de multiplier le nombre
de pixels de l'image par 16. A partir d'une image en HD (1920 × 1080)
on obtient une image en 8K (7680 × 4320).
one girl, dark short hair, yellow eyes, white t-shirt, cleavage, looking at viewer, working on computer
Vous pouvez télécharger cette image en cliquant sur cet aperçu
Le lissage induit par l'agrandissement est particulièrement visible sur les zones
de peau avec différents niveaux d'ombrage. Oui, autrement dit : sur le décolleté
de la miss. Si ça ce n'est pas la meilleure excuse pour justifier que j'utilise
des anime girls à gros boobs en guise d'images d'illustration
et d'exemples... 😎
A noter qu'il ne vous est pas permis d'augmenter indéfiniment la taille d'une image
ainsi. Si vous tentez d'en agrandir une qui est déjà en 4K par exemple, le programme
va refuser de le faire.
Les modèles n'ont tout simplement pas été prévus pour cela.
Vous pouvez obtenir de nombreuses ressources concernant la génération d'images par l'IA
sur Civitai, qui est une sorte de référence dans le domaine.
Vous y trouverez énormément de choses, et je ne vais pas vous mentir sur le fait qu'il
peut être difficile de mettre la main sur ce que l'on cherche... Mais si vous avez du
temps devant vous, c'est tout simplement incontournable et
il est impossible de passer à côté. Tous les thèmes sont couverts, pas seulement
l'animation japonaise - ça va de la bande dessinée occidentale de toutes les époques
jusqu'au photoréalisme.
Pour la petite histoire, Civitai est parfois catégorisé en tant que
« site pour adultes » (...) Pour cette raison ils ont deux
domaines distincts :
Si vous êtes dans une démocrature qui n'aime pas les jolies filles et qui
« contrôle » Internet, au moins l'un des deux devrait
fonctionner pour vous !
La génération d'images avec Stable Diffusion
[Page principale]
[(1) Les applications sous macOS]
(2) Prompts et modèles
La Revue de TheRaphit.com
![[Compteur]](https://webcounter-ipv4.theraphit.com/scripts/Count.cgi?dd=B&ft=1&df=revue.dat)
Nombre de visiteurs
depuis le 13 mai 1997.
[Accueil]
[C'est quoi ?]
TheRaphit's Web Site - La dernière homepage du Web
[(Tout)2 Evangelion]
Webzine : La Revue
[Manga Pink Zone]
[Mathématiques]
[Nouveautés]
[Téléchargements]
[FAQ illustrée]
Site créé le 16 janvier 1997
©1997-2026 by TheRaphit
www.theraphit.com
|