Erreichen von Charakterkonsistenz im visuellen Geschichtenerzählen mit KI

Der „Heilige Gral" der KI-Bildgenerierung war schon immer die Charakterkonsistenz.

Einen coolen Charakter einmal zu erstellen ist einfach. Genau denselben Charakter in einer anderen Pose, mit anderer Kleidung oder in einem anderen Raum zu erstellen? Das war bei Standard-Diffusionsmodellen nahezu unmöglich.

Whisk AI revolutioniert das Spiel, indem es „Identität" als separate Eingabeschicht behandelt.

![Charakterbogen-Beispiel](/imgs/home/default (20).jpg)

Das Problem mit Seeds

In traditionellen KI-Tools (z.B. Midjourney v5) versuchen Nutzer oft, „Seeds" zur Aufrechterhaltung der Konsistenz zu verwenden. Obwohl hilfreich, steuern Seeds das Rauschbild, nicht die spezifische semantische Identität. Man erhält möglicherweise eine ähnlich aussehende Person, aber die Gesichtsstruktur, Haarfarbe oder Kleidung driftet oft ab.

Whisks Identitätssperre

Whisk ermöglicht es Ihnen, eine Subjekt-Referenz (Ihr Charakterbogen) hochzuladen. Das Modell analysiert die invarianten Merkmale dieses Subjekts:

  • Augenabstand und -form
  • Nasenstruktur
  • Haartextur und -stil
  • Kostümdetails

Wenn Sie eine neue Szene eingeben (z.B. „kämpft gegen einen Drachen"), behält Whisk diese invarianten Merkmale bei, während die neue Pose und Umgebung generiert werden.

Schritt-für-Schritt-Anleitung

1. Erstellen Sie Ihren „Master"-Charakter

Generieren oder zeichnen Sie Ihren Charakter in einer neutralen Pose (T-Pose oder Standardporträt) mit neutraler Beleuchtung. Hohe Auflösung ist entscheidend. Nennen wir sie „Agent K".

2. Isolieren Sie die Identität

Verwenden Sie den Subjekt-Eingabe-Slot für Agent Ks Bild.

3. Ändern Sie die Szene

Laden Sie ein Hintergrundbild für Ihre Szene hoch (z.B. „Cyberpunk-Bar").

4. Ändern Sie die Aktion über Text/Stil

Obwohl Whisk auf visuelle Eingaben angewiesen ist, können Sie das Ergebnis beeinflussen. Wenn Sie einen bestimmten Stil wünschen (z.B. „Comic-Tuschezeichnung"), verwenden Sie die Stil-Eingabe.

![Prozessablauf](/imgs/home/default (11).jpg)

Anwendungsfälle für Konsistenz

BrancheAnwendung
Graphic NovelsErstellen Sie Panel für Panel desselben Protagonisten, der sich durch die Geschichte bewegt.
Spiele-AssetsGenerieren Sie mehrere NPC-Avatare, die eindeutig zur selben „Spezies" oder „Fraktion" gehören, durch Wiederverwenden von Stil- und Subjektvarianten.
StoryboardingVisualisieren Sie schnell ein Filmdrehbuch mit konsistenten Schauspielern.

Profi-Tipp: Charakter drehen

Warnung: Whisk erstellt 2D-Mischungen. Es kann nicht die Rückseite eines Charakters „erraten", wenn Sie nur die Vorderseite zeigen.

Wenn Sie den Winkel ändern müssen (z.B. Profilansicht), hilft es enorm, ein Referenzbild des Charakters aus diesem Winkel zu haben. Whisk kann 3D-Struktur ableiten, aber ein wenig Führung geht weit.

Charakterkonsistenz ist nicht mehr ein Kampf—es ist eine Funktion.

Erreichen von Charakterkonsistenz im visuellen Geschichtenerzählen mit KI | Blog