Nanobanana Pro @HiggsField_AI Giữ sự nhất quán về không gian và vị trí → tham chiếu isometric và tạo lưới 3×3 (prompt ở phần bình luận) Chúng ta thật là những sinh vật tham lam. 🍌 Ngay khi tôi vui mừng vì có thể duy trì sự nhất quán của nhân vật, tôi lại gặp phải sự không hài lòng tiếp theo. "Liệu có thể kết nối nền giữa các cảnh tốt hơn không?" "Mối quan hệ vị trí giữa nền và nhân vật có thể cải thiện không?" Điều này ngay cả Sora2 cũng gặp phải khá nhiều vấn đề. (Sora2 thậm chí còn vượt qua cả đường tưởng tượng một cách dễ dàng) Tôi đã suy nghĩ về việc có phương pháp ổn định nào không, nhưng giải pháp thực tế hiện tại là như thế này. Nói một cách đơn giản, tạo ra một bức tranh isometric để nắm bắt mối quan hệ vị trí tổng thể. Sau đó, sử dụng lưới 3×3 để nhồi nhiều cảnh vào một hình ảnh. Điều gì tốt về điều này? Đầu tiên, vì là isometric nên có góc nhìn từ trên xuống và hiển thị đồng đều các bức tường, tòa nhà, sàn nhà, v.v., vì vậy thông tin về kích thước nhân vật cũng như nhiều thông tin khác khá phong phú. * Nhân tiện, isometric là hình ảnh nhìn từ trên xuống với góc 45 độ, nhưng nguồn gốc của nó là từ tiếng Hy Lạp Isos (bằng nhau) Metron (đo lường), nghĩa là đo lường chính xác vị trí và kích thước của vật thể, vì vậy nó cũng phù hợp với mục đích lần này. Tôi sẽ cung cấp tham chiếu cho nhân vật và nền để tạo storyboard cho lưới 3×3. Trong một hình ảnh, sự nhất quán sẽ cao hơn rất nhiều, vì vậy nhân vật và nền có thể di chuyển trong khi vẫn giữ mối quan hệ vị trí đó. 🍌 Ở hàng trên cùng, nó nhận diện hình ảnh bằng tọa độ như (1,1) (1,2) (1,3), vì vậy nếu bạn muốn hình ảnh ở giữa hàng giữa, Extract (2,2) chỉ cần như vậy là bạn có thể trích xuất hình ảnh đã được phóng to. Trong hình ảnh tham khảo, tôi đã làm cho cô gái vượt qua cậu bé từ phía sau và quay lại nhìn. Mặc dù không hoàn hảo, nhưng tôi nghĩ rằng tôi đã giữ được sự nhất quán về vị trí và nền (và từ nhiều góc độ khác nhau)!