Article n° 50 [B] - Page principale

[Article au hasard 🎲] [Précédent] [Suivant]

Prompts et modèles Stable Diffusion

Spécialement dédiés aux anime girls !

[Les applications sous macOS]

Prompts et modèles

Prompts insérés dans DiffusionBee produisant deux images différentes

[Les prompts] [Deux modèles à télécharger] [L'agrandissement]

Le moment est venu de demander à ces braves réseaux de neurones et aux logiciels qui les font fonctionner de nous livrer du rêve !

Nous allons voir les bases du prompting avec Stable Diffusion, puis ensuite je vous propose de télécharger sur cette page deux modèles différents, spécialement entraînés pour produire des images dans le style anime (et encore plus particulièrement, avec des filles). Le tout sans censure ! La seule limite c'est votre imagination... Elle n'est pas belle la vie ?

Enfin la dernière partie aborde l'utilisation d'un modèle d'agrandissement, étape finale indispensable et permettant d'obtenir le meilleur des résultats.

Rédaction des prompts

La première chose à noter, c'est qu'il va vous falloir écrire vos instructions en anglais. C'est en effet avec des descriptions dans cette langue que les dataset d'entraînement ont été constitués. Oui au 21^ème siècle les humains s'expriment avec des centaines de variantes linguistiques, mais les machines n'en connaissent qu'une seule.

Vous pouvez bien sûr vous aider de Google Traduction, mais sachez que Draw Things (vu précédemment) intègre un vérificateur orthographique dans la fenêtre de prompt.

[Vérificateur orthographique de Draw Things]

[Vérificateur orthographique de Draw Things]

C'est vraiment pour l'exemple...
Qui ne sait pas écrire « boobs » ?

C'est loin d'être inutile. Car pour le modèle, un mot mal orthographié, ce n'est pas le bon mot ! Les machines, même « intelligentes », restent des machines.

Ensuite, pour assurer la meilleure interprétation possible, il vaut mieux adopter un style télégraphique - plutôt qu'une phrase telle que...

A blond girl with green eyes and big boobs, wearing a white t-shirt showing a cleavage.

Il vaut mieux entrer :

one girl, blond hair, green eyes, big boobs, white t-shirt, cleavage

Renseignements pris un peu partout, c'est ce qui est conseillé sur divers formus. Et d'ailleurs, si vous demandez à ChatGPT ou Gemini de vous préparer un prompt pour Stable Diffusion, c'est ce qu'ils vont faire. Ah oui c'est quand même incroyable le 21^ème siècle, on a des machines qui travaillent pour nous, on peut faire prompter des modèles par d'autres pour finalement leur donner des instructions comme si on leur envoyait un télégramme au 19^ème siècle. Au moins il n'y pas besoin de mettre « STOP » à la fin.

[Prompt 'blond girl, green eyes, big boobs, white t-short, cleavage' en action]

J'étais bien évidemment o-bli-gé de vous montrer le résultat obtenu avec ce prompt

Attention aussi aux répétitions. Par exemple si vous écrivez 'girl' plusieurs fois dans le prompt, même au singulier et à plusieurs mots d'intervalle, le modèle pourrait comprendre que vous souhaitez qu'il vous dessine deux filles - on n'est pas vraiment contre notez bien, mais on se les garde pour les jours où on est en forme.

Comme vous avez pu le voir sur l'image illustrant cette page, il y a en fait deux prompts à donner : le

Prompt principal (positif) et le

Negative Prompt. Pour chacun d'entre eux, Il y a un certain nombre de mots-clés que recommandent d'inclure systématiquement ceux qui ont entraîné les modèles, mais aussi les développeurs de Stable Diffusion. Ce sont les prompts de base.

Ainsi, en tant que

vous pouvez employer :

(masterpiece, best quality), newest, highres, absurdres

Et pour le

(low quality, worst quality:1.5), (bad anatomy), lowres, bad composition, fewer digits, text, username, logo, inaccurate eyes, fewer digits, extra arms, disfigured, missing arms, too many fingers, fused fingers, missing fingers

Les parenthèses indiquent une priorité des mots clés ainsi délimités par rapport aux autres, et un mot-clé peut être suffixé d'un symbole : (deux points) lui-même immédiatement suivi d'un nombre indiquant une priorité supplémentaire.

Je précise qu'il ne faut pas mettre de négation (comme 'no extra arms') dans le prompt négatif, moins par moins ça fait plus !

C'est loin d'être une science exacte : un tel prompt négatif n'empêchera pas les hallucinations et des filles à trois bras d'apparaître assez souvent... Mais cela ne coûte pas cher à ajouter - d'autant plus qu'avec Draw Things, c'est une fenêtre cachée qui le contient, et vous pouvez vous contenter de l'oublier après l'avoir écrit.

[Draw Things prompt négatif]

Dans la suite de cet page, lorsqu'un prompt sera donné, les

seront implicites.

Y a-t-il un ordre à respecter pour les différents mots ? Théoriquement non, mais je vous recommanderais tout de même d'entrer une description d'image « telle qu'un humain la ferait » car ce sont bel et bien des vrais gens qui ont constitué les datasets. Après les prompts de base (qui ont la priorité la plus élevée) commencez donc par la description du physique (avantageux) de la fille, puis sa posture et enfin le reste de la scène.

Puisque les modèles ne vont justement pas respecter scrupuleusement les prompts, une des règles que vous pouvez appliquer c'est le less is more. Commencez par en entrer de très simples, pour voir ce qu'il en sort. En effet, écrire juste forest ne signifie pas que vous allez avoir toujours les mêmes arbres. Le nombre d'images d'entraînement d'un modèle peut être colossal et en comporter de nombreuses différentes libellées avec le mot clé « forest ».

Enfin pour adapter la posture des demoiselles, sachez que le mot-clé 'viewer' correspond à celui qui regarde l'image. Ainsi 'profile, looking at viewer' produira une posture de profil où la fille tourne la tête (ou au moins les yeux) « vers l'objectif ».

Différentes images obtenues avec le prompt :

one girl, dark short hair, yellow eyes, t-shirt, cleavage, looking at viewer, working on computer

Si vous ne précisez pas la couleur d'un vêtement (comme ci-dessus) le modèle va être libre de s'exprimer, et les résultats peuvent être très intéressants. Un autre bon exemple c'est le prompt de l'image d'illustration principale de cet article - j'ai conservé pas mal de bon visuels obtenus avec, même si je ne les ai pas retenus. Oui c'est parfois difficile de faire un choix quand tout est si cute. 😍

Images provenant de la petite galerie de la page principale, partageant le prompt suivant :

one girl with dark short hair and yellow eyes, one girl with pink short hair and pink eyes, cleavage, looking at viewer, smiling, background with computer screens featuring anime girls

Notez les scènes, postures et plans très variés les uns par rapport aux autres. Vous remarquerez aussi que sans lui préciser autre chose sur la tenue vestimentaire que 'cleavage', il nous les mets parfois juste en lingerie... C'est un genre d'intelligence artificielle qui déçoit beaucoup moins que ChatGPT la plupart du temps ! Quand je vous dis que vous allez devenir addict...

Modèles à télécharger

Afin de mettre tout cela en pratique, je vous propose ici pas moins de deux modèles différents, tous les deux entraînés spécialement pour les anime girls. De plus, ils ne sont pas censurés, signifiant que vous pouvez obtenir sans problèmes le résultat attendu avec les prompts qui vont bien. 🙂

Ils sont également sans marquage, c'est à dire qu'aucun filigrane à la con ne va venir s'ajouter aux images produites (et Dieu sait le temps fou que je passe à « nettoyer » les images d'illustration que je récupère sur Internet à cause de ça), mais également qu'ils n'insèrent pas de métadonnées indiquant que l'image a été générée par l'IA.

- Liens de téléchargement -

Oui, il y a des boobs à l'air...
Mais il faut bien montrer que les modèles ne sont pas censurés. 😜
TheRaphit ne bidonne pas !! 😎

two girls, nude, big boobs, looking at viewer, sat on a public bench

[Image générée par Counterfeit avec deux filles]

Télécharger le modèle [📥Counterfeit 3.0 ] (4 Go)

two girls, nude, medium boobs, looking at viewer, sat in front of a bar

[Image générée par Any Hentai avec deux filles]

Télécharger le modèle [📥Any Hentai 2.0 ] (7,2 Go)

Un petit mot sur l'extension .safetensors (qui peut vous paraître inhabituelle) et le format associé : il s'agit d'une architecture de réseaux de neurones qui garantit qu'aucun code malveillant ne peut être inséré dans un modèle. Vous pouvez importer directement ces fichiers dans n'importe quelle application de Stable Diffusion, qui les reconnaîtront.

Pour les deux applications sous macOS que je vous ai présentées, la manière de le faire est détaillée dans la section importer un modèle de la page précédente de cet article.

Quel modèle choisir ?

Les deux mon capitaine ! Plus précisément, suivant ce que vous recherchez, je vous ai fait un petit comparatif résumé ci-dessous.

Any Hentai 2.0
✅ Fonctionne particulièrement bien avec les paramètres par défaut de Draw Things ✅ Produit des scènes complexes avec un prompt simple ✅ Grande variété de scènes et de postures avec un prompt identique ✅ Est capable de rendre pas mal de lieux connus (Paris, Suisse, ...) avec une pertinence assez étonnante	❌ Tient assez peu compte des prompts négatifs ❌ Couleurs parfois un peu fades, avec un léger biais vers le rose ❌ Les contours peuvent être flous ou fuyants au niveau des mains ou des vêtements des personnages - généralement le manque de contraste peut rendre la scène assez « artificielle » à l'oeil ❌ Est assez sujet aux hallucinations

Counterfeit 3.0
✅ Style plus moderne ✅ Contours nets et contraste vif, donnant un rendu assez réaliste faisant moins « IA générative » ✅ Meilleure cohérence globale des images générées ✅ Nécessite peu de RAM pour fonctionner	❌ Le modèle a besoin d'être guidé, il faut rédiger des prompts un peu plus élaborés ❌ Moins de variété sur la corpulence et la taille des personnages ❌ Assez typé « bande dessinée » plutôt que « animation »

Plus précisément, Any Hentai produit des images ressemblant davantage à l'animation japonaise des années 1980-2000. Il a tendance à bien respecter les prompts en ce qui concerne le sujet principal (la miss) et moins en ce qui concerne l'environnement et le décor, où il fait souvent preuve d'une certaine « liberté ».

Une de ses particularités est qu'il dessine parfois l'arrère-plan dans un style « photo » qui ne fait pas trop dessin animé. C'est particulièrement vrai si on lui demande de produire une scène avec un décor de nature, de foret ou de montagne. Cela peut parfois paraître un peu « hors-sujet » même si c'est plutôt pas mal pour un fond d'écran.

one girl, pink short hair, pink eyes, t-shirt, cleavage, looking at viewer, smiling, nature and mountains background

one girl, dark short hair, yellow eyes, t-shirt, cleavage, looking at viewer, smiling, in a forest, sunset

Les mascottes sont de sortie à la campagne !

Pour ces raison, Any Hentai est tout particulièrement adapté à la production d'images au format 9:16 destinées à être utilisées sur un appareil mobile, en raison de la moindre prépondérance de l'arrière plan.

Counterfeit permet d'obtenir des images plus proches de l'animation du 21^ème siècle, plus expressives et vibrantes, plus colorées et lumineuses. Cela accentue le réalisme des scènes. Le style « dessin » est renforcé par tracé plus épais, particulièrement visible sur les gros plans.

one girl, standing, upper body, blond hair, blue eyes, cleavage, looking at viewer, in a small street

Remarquez ici que l'arrière-plan a l'air d'avoir été peint

Le fait qu'il faille davantage le guider sur les prompts a pour conséquence qu'il nécessite davantage de temps pour en tirer le meilleur parti, et c'est d'ailleurs confirmé parce ce que j'ai pu lire sur des forums.

Enfin sur les images générées par Counterfeit, les demoiselles sont généralement plus minces et élancées. Any Hentai lui, a tendance à produire des poitrines plus généreuses et davantage de formes en général, ce qui est illustré par les deux images ci-dessous. Cela peut être un critère déterminant de choix. 😉

Comparaison directe des deux modèles avec même prompt, seed et paramètres

one girl, blue hair, green eyes, swimsuit outfit, sat on a chair, swimming pool background

Any Hentai à gauche – Counterfeit à droite

A la finale, Any Hentai sera assez adapté à de l'image d'illustration tandis que Counterfeit, une fois bien maîtrisé, peut produire de très belles cover images susceptibles d'être imprimées. Et pour les fonds d'écran ? Franchement les deux font le job, c'est vraiment une question de préférence personnelle.

Autres exemples – ⚠ il y a encore plus de boobs !

Voici les images produites sur quatre thèmes différents, obtenues avec les prompts suivants

Dans l'ordre, de gauche à droite et/ou de haut en bas, suivant votre appareil et la taille de son écran

one girl, standing, medium boobs, topless, wearing a crystal crown, green hair, colorful crystal cave background

one girl, standing, medium boobs, topless, orange hair, looking at viewer, city buildings background

one girl, standing, medium boobs, topless, purple hair, profile, looking at viewer, beach and sea background, sunset

one girl, medium boobs, topless, blond hair, maid outfit, looking at viewer, sat on a bed in a hotel room, window with city buildings

- Counterfeit 3.0 -

- Any Hentai 2.0 -

A noter que les seeds ne sont pas identiques à chaque fois, j'ai pris l'image la plus intéressante parmi un batch de plusieurs dizaines, générées avec chacun des prompts.

Agrandissement (upscaling)

Lorsque vous générez une image avec Stable Diffusion, vous obtenez un résultat assez chargé en « bruit », étant donné la nature même de cette méthode - voir la manière dont ça fonctionne sur la page principale. En dehors du fait qu'elle soit en basse résolution, l'image n'est pas vraiment utilisable en l'état, même si vous n'aviez pas besoin de plus pour une illustration.

[Image sortie directement du modèle]

Si vous souhaitez vous en rendre compte par vous-même, vous pouvez télécharger l'image d'origine en 1024 × 576 telle que sortie du modèle.

C'est là qu'intervient notre fameux Upscaler. Il s'agit d'un modèle spécialisé dans l'agrandissement d'image. Avant l'IA générative, il était déjà possible d'augmenter la résolution d'une image en utilisant des fonctions mathématiques, et l'interpolation cubique donnait déjà de bons résultats. Mais ici l'avantage c'est que l'image est abordée dans sa globalité, ce qui permet non seulement d'insérer des pixels supplémentaires de manière adéquate, mais aussi de supprimer complètement cet effet de « bruit » car interprété par le modèle comme des imperfections d'une image en basse résolution.

Je vais vous détailler ici l'utilisation du module d'agrandissement de l'application DiffusionBee (voir la page précédente de cet article) car il est particulièrement simple à utiliser. De plus, il vous permettra aussi d'agrandir les images issues de n'importe quelle autre source, notamment de Draw Things (qui lui embarque un agrandisseur intégré à la génération d'image).

L'utilisation en est assez simple. Après avoir sélectionné Upscaler via le menu principal de l'application, il vous suffit d'ajouter votre fichier image en cliquant dans la zone « vignette » comme indiqué (cliquez pour ajouter...) puis de presser le bouton Upscale en bas à droite. Il ne vous reste ensuite plus qu'à sauvegarder votre image en cliqant sur le bouton Actions en haut à gauche de celle-ci, ce qui ouvrira un petit menu.

L'agrandisseur de DiffusionBee est particulièrement commode à utiliser, tout en étant efficace

Une image en 1024 × 768 va en ressortir avec une résolution de 4096 × 2304, comme celle ci-dessous. Plus généralement, l'agrandisseur de DiffusionBee permet de multiplier le nombre de pixels de l'image par 16. A partir d'une image en HD (1920 × 1080) on obtient une image en 8K (7680 × 4320).

one girl, dark short hair, yellow eyes, white t-shirt, cleavage, looking at viewer, working on computer

Vous pouvez télécharger cette image en cliquant sur cet aperçu

Le lissage induit par l'agrandissement est particulièrement visible sur les zones de peau avec différents niveaux d'ombrage. Oui, autrement dit : sur le décolleté de la miss. Si ça ce n'est pas la meilleure excuse pour justifier que j'utilise des anime girls à gros boobs en guise d'images d'illustration et d'exemples... 😎

A noter qu'il ne vous est pas permis d'augmenter indéfiniment la taille d'une image ainsi. Si vous tentez d'en agrandir une qui est déjà en 4K par exemple, le programme va refuser de le faire.

[Message d'erreur 'image trop grande']

Les modèles n'ont tout simplement pas été prévus pour cela.

Vous pouvez obtenir de nombreuses ressources concernant la génération d'images par l'IA sur Civitai, qui est une sorte de référence dans le domaine.

Vous y trouverez énormément de choses, et je ne vais pas vous mentir sur le fait qu'il peut être difficile de mettre la main sur ce que l'on cherche... Mais si vous avez du temps devant vous, c'est tout simplement incontournable et il est impossible de passer à côté. Tous les thèmes sont couverts, pas seulement l'animation japonaise - ça va de la bande dessinée occidentale de toutes les époques jusqu'au photoréalisme.

Pour la petite histoire, Civitai est parfois catégorisé en tant que « site pour adultes » (...) Pour cette raison ils ont deux domaines distincts :
civitai.com
civitai.red
Si vous êtes dans une démocrature qui n'aime pas les jolies filles et qui « contrôle » Internet, au moins l'un des deux devrait fonctionner pour vous !

La génération d'images avec Stable Diffusion

[Page principale]

[(1) Les applications sous macOS]

(2) Prompts et modèles

La Revue de TheRaphit.com

Nombre de visiteurs
depuis le 13 mai 1997.

[Accueil] [C'est quoi ?]

TheRaphit's Web Site - La dernière homepage du Web

[(Tout)² Evangelion]

Webzine : La Revue

[Manga Pink Zone] [Mathématiques]

[Nouveautés] [Téléchargements] [FAQ illustrée]

Site créé le 16 janvier 1997
©1997-2026 by TheRaphit
www.theraphit.com