Der „Heilige Gral" der KI-Bildgenerierung war schon immer die Charakterkonsistenz.
Einen coolen Charakter einmal zu erstellen ist einfach. Genau denselben Charakter in einer anderen Pose, mit anderer Kleidung oder in einem anderen Raum zu erstellen? Das war bei Standard-Diffusionsmodellen nahezu unmöglich.
Whisk AI revolutioniert das Spiel, indem es „Identität" als separate Eingabeschicht behandelt.
.jpg)
Das Problem mit Seeds
In traditionellen KI-Tools (z.B. Midjourney v5) versuchen Nutzer oft, „Seeds" zur Aufrechterhaltung der Konsistenz zu verwenden. Obwohl hilfreich, steuern Seeds das Rauschbild, nicht die spezifische semantische Identität. Man erhält möglicherweise eine ähnlich aussehende Person, aber die Gesichtsstruktur, Haarfarbe oder Kleidung driftet oft ab.
Whisks Identitätssperre
Whisk ermöglicht es Ihnen, eine Subjekt-Referenz (Ihr Charakterbogen) hochzuladen. Das Modell analysiert die invarianten Merkmale dieses Subjekts:
- Augenabstand und -form
- Nasenstruktur
- Haartextur und -stil
- Kostümdetails
Wenn Sie eine neue Szene eingeben (z.B. „kämpft gegen einen Drachen"), behält Whisk diese invarianten Merkmale bei, während die neue Pose und Umgebung generiert werden.
Schritt-für-Schritt-Anleitung
1. Erstellen Sie Ihren „Master"-Charakter
Generieren oder zeichnen Sie Ihren Charakter in einer neutralen Pose (T-Pose oder Standardporträt) mit neutraler Beleuchtung. Hohe Auflösung ist entscheidend. Nennen wir sie „Agent K".
2. Isolieren Sie die Identität
Verwenden Sie den Subjekt-Eingabe-Slot für Agent Ks Bild.
3. Ändern Sie die Szene
Laden Sie ein Hintergrundbild für Ihre Szene hoch (z.B. „Cyberpunk-Bar").
4. Ändern Sie die Aktion über Text/Stil
Obwohl Whisk auf visuelle Eingaben angewiesen ist, können Sie das Ergebnis beeinflussen. Wenn Sie einen bestimmten Stil wünschen (z.B. „Comic-Tuschezeichnung"), verwenden Sie die Stil-Eingabe.
.jpg)
Anwendungsfälle für Konsistenz
| Branche | Anwendung |
|---|---|
| Graphic Novels | Erstellen Sie Panel für Panel desselben Protagonisten, der sich durch die Geschichte bewegt. |
| Spiele-Assets | Generieren Sie mehrere NPC-Avatare, die eindeutig zur selben „Spezies" oder „Fraktion" gehören, durch Wiederverwenden von Stil- und Subjektvarianten. |
| Storyboarding | Visualisieren Sie schnell ein Filmdrehbuch mit konsistenten Schauspielern. |
Profi-Tipp: Charakter drehen
Warnung: Whisk erstellt 2D-Mischungen. Es kann nicht die Rückseite eines Charakters „erraten", wenn Sie nur die Vorderseite zeigen.
Wenn Sie den Winkel ändern müssen (z.B. Profilansicht), hilft es enorm, ein Referenzbild des Charakters aus diesem Winkel zu haben. Whisk kann 3D-Struktur ableiten, aber ein wenig Führung geht weit.
Charakterkonsistenz ist nicht mehr ein Kampf—es ist eine Funktion.