"Chén Thánh" của việc tạo hình ảnh AI luôn là Tính nhất quán của nhân vật.
Tạo ra một nhân vật thú vị một lần thì dễ. Tạo ra chính xác cùng một nhân vật đó ở tư thế khác, mặc quần áo khác, hoặc đứng trong căn phòng khác? Điều đó từng gần như bất khả thi đối với các mô hình khuếch tán tiêu chuẩn.
Whisk AI thay đổi cuộc chơi bằng cách xử lý "Danh tính" như một lớp đầu vào riêng biệt.
.jpg)
Vấn đề với Seeds
Trong AI truyền thống (ví dụ: Midjourney v5), người dùng thường cố gắng sử dụng "Seeds" để duy trì tính nhất quán. Mặc dù hữu ích, seeds chỉ kiểm soát mô hình nhiễu, không phải danh tính ngữ nghĩa cụ thể. Bạn có thể nhận được một người trông giống nhau, nhưng cấu trúc khuôn mặt, màu tóc, hoặc trang phục thường xuyên thay đổi.
Khóa danh tính của Whisk
Whisk cho phép bạn tải lên một Tham chiếu chủ thể (bảng nhân vật của bạn). Mô hình sẽ phân tích các đặc điểm không đổi của chủ thể này:
- Khoảng cách và hình dáng mắt
- Cấu trúc mũi
- Kết cấu và kiểu tóc
- Chi tiết trang phục
Khi bạn tạo lời nhắc cho một cảnh mới (ví dụ: "chiến đấu với rồng"), Whisk giữ những đặc điểm không đổi này được khóa trong khi tạo ra tư thế và môi trường mới.
Hướng dẫn từng bước
1. Tạo nhân vật "Chính" của bạn
Tạo hoặc vẽ nhân vật của bạn ở tư thế trung tính (T-pose hoặc chân dung tiêu chuẩn) với ánh sáng trung tính. Độ phân giải cao là chìa khóa. Hãy gọi cô ấy là "Đặc vụ K."
2. Cô lập danh tính
Sử dụng khe Đầu vào chủ thể cho hình ảnh của Đặc vụ K.
3. Thay đổi cảnh
Tải lên một hình ảnh nền cho cảnh của bạn (ví dụ: "Quán bar Cyberpunk").
4. Thay đổi hành động thông qua văn bản/phong cách
Mặc dù Whisk dựa vào đầu vào hình ảnh, bạn có thể ảnh hưởng đến kết quả đầu ra. Nếu bạn muốn một phong cách cụ thể (ví dụ: "Vẽ mực truyện tranh"), hãy sử dụng Đầu vào phong cách.
.jpg)
Các trường hợp sử dụng cho tính nhất quán
| Ngành | Ứng dụng |
|---|---|
| Tiểu thuyết đồ họa | Tạo từng khung hình của cùng một nhân vật chính di chuyển qua câu chuyện. |
| Tài sản game | Tạo nhiều avatar NPC rõ ràng thuộc cùng một "loài" hoặc "phe phái" bằng cách tái sử dụng sự khác biệt về phong cách và chủ thể. |
| Storyboarding | Nhanh chóng hình dung một kịch bản phim với các diễn viên nhất quán. |
Mẹo chuyên nghiệp: Xoay nhân vật
Cảnh báo: Whisk tạo ra các hỗn hợp 2D. Nó không thể "đoán" mặt sau của nhân vật nếu bạn chỉ hiển thị mặt trước.
Nếu bạn cần thay đổi góc nhìn (ví dụ: góc nghiêng), việc có một hình ảnh tham chiếu của nhân vật từ góc đó sẽ giúp ích rất nhiều. Whisk có thể suy luận cấu trúc 3D, nhưng một chút hướng dẫn sẽ có tác dụng rất lớn.
Tính nhất quán của nhân vật không còn là một cuộc đấu tranh—mà là một tính năng.