これは、はるかに詳細であるため、棒人間よりも実際にはうまく機能する可能性があると思います。 問題は、テキストプロンプトから正確な人型図を生成する方法であり、何千ものアニメーションを作成します。