Le "Saint Graal" de la génération d'images IA a toujours été la Cohérence des Personnages.
Générer un personnage cool une fois est facile. Générer ce même personnage dans une pose différente, portant des vêtements différents, ou se tenant dans une pièce différente ? Cela était presque impossible avec les modèles de diffusion standard.
Whisk AI change la donne en traitant l'"Identité" comme une couche d'entrée séparée.
.jpg)
Le Problème avec les Graines
Dans l'IA traditionnelle (ex. Midjourney v5), les utilisateurs tentent souvent d'utiliser des "Graines" pour maintenir la cohérence. Bien qu'utiles, les graines contrôlent le motif de bruit, pas l'identité sémantique spécifique. Vous pourriez obtenir une personne d'apparence similaire, mais la structure faciale, la couleur des cheveux, ou la tenue dérivent souvent.
Le Verrouillage d'Identité de Whisk
Whisk vous permet de télécharger une Référence de Sujet (votre fiche de personnage). Le modèle analyse les caractéristiques invariantes de ce sujet :
- Distance et forme des yeux
- Structure du nez
- Texture et style des cheveux
- Détails du costume
Lorsque vous demandez une nouvelle scène (ex. "combattant un dragon"), Whisk garde ces caractéristiques invariantes verrouillées tout en générant la nouvelle pose et l'environnement.
Guide Étape par Étape
1. Créez Votre Personnage "Maître"
Générez ou dessinez votre personnage dans une pose neutre (pose en T ou portrait standard) avec un éclairage neutre. La haute résolution est cruciale. Appelons-la "Agent K."
2. Isolez l'Identité
Utilisez l'emplacement Entrée Sujet pour l'image d'Agent K.
3. Changez la Scène
Téléchargez une image d'arrière-plan pour votre scène (ex. "Bar Cyberpunk").
4. Changez l'Action via Texte/Style
Bien que Whisk s'appuie sur les entrées visuelles, vous pouvez influencer le résultat. Si vous voulez un style spécifique (ex. "Encrage de Bande Dessinée"), utilisez l'Entrée Style.
.jpg)
Cas d'Usage pour la Cohérence
| Industrie | Application |
|---|---|
| Romans Graphiques | Créer case après case du même protagoniste évoluant dans l'histoire. |
| Assets de Jeu | Générer plusieurs avatars PNJ qui appartiennent clairement à la même "espèce" ou "faction" en réutilisant les variations de style et de sujet. |
| Storyboard | Visualiser rapidement un script de film avec des acteurs cohérents. |
Conseil Pro : Faire Tourner le Personnage
Attention : Whisk crée des mélanges 2D. Il ne peut pas "deviner" le dos d'un personnage si vous ne montrez que l'avant.
Si vous devez changer l'angle (ex. vue de profil), avoir une image de référence du personnage sous cet angle aide énormément. Whisk peut inférer une structure 3D, mais un petit guidage fait beaucoup.
La cohérence des personnages n'est plus un combat—c'est une fonctionnalité.