熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
Nanobanana Pro @HiggsField_AI
空間と位置の一貫性を保つ→アイソメトリック参照と3×3グリッド生成(プロンプトはリプ欄)
私たちはなんと欲深い生き物なんでしょう。🍌で人物の一貫性を維持できてうれしくなった矢先に次の不満にぶつかるのです。「カット間の背景もっとうまくつながらないのか」「背景とキャラの位置関係どうにかならんか」と
これSora2でさえ結構破綻するんですよね。(Sora2はイマジナリーラインも余裕で越えてくる)
何か安定したいい方法ないかと考えてたんですが、現状の現実解がこれです
ざっくりいうとアイソメトリックな絵をつくって全体の位置関係を把握させる
そのうえで3×3グリッドでひとつの画像に複数カットを詰める
これ何がいいのか
まずアイソメトリックだと俯瞰視点かつ壁、建物、床などまんべんなく映してくれるのでキャラの大きさとかも含めて情報量が結構豊富です
*ちなみにアイソメトリックって斜め45度上から俯瞰した感じの図っていうイメージなんですが語源はギリシャ語のIsos(等しい)Metron(測定)、つまり物の位置や大きさを正しく測定することらしいので今回の目的にも合致しています
これとキャラクターと背景のリファレンスを渡して3×3グリッドの絵コンテをつくります
ひとつの画像の中では一貫性がかなり高くなるので、キャラクター、背景がその位置関係を保ちながら動き回ってくれます
🍌は上段は (1,1) (1,2) (1,3)みたいなかんじで(x,y)っていう座標で画像を認識してくれてるので、たとえば中段真ん中の画像が欲しければ
Extract (2,2)
っていうだけでアップスケールした画像が抽出できます
参考画像では女の子が後ろから男の子を追い越して振り向くっていう感じにしました
完ぺきではないですが、位置関係と背景の一貫性(しかもいろんな角度から)を保てたかなと!

熱門
排行
收藏

