Falls es jemanden interessiert: Nachdem ich Hedra, MultiTalk, Grok und eine benutzerdefinierte App auf Google AI Studio ausprobiert habe...
habe ich mich für @runwayml entschieden, da dies die einzige Lösung war, die die Qualität erfüllte, die ich wollte - aber es konnte nur für die beiden Charaktere jeweils einen Satz pro Generation erzeugen (wenn ich mehr hinzufügte, wurde es durcheinander, wer sprach usw.)
Ich habe sie zusammengefügt und verschiedene Zooms/Szenen zwischen den Stichen verwendet, damit es nicht sprunghaft wirkte.
Gibt es gute Modelle für die Umwandlung von Bildern in Videos, die Gespräche zwischen zwei oder mehr Charakteren verarbeiten können?
(wo man einen Dialog mit mehr als einem Sprecher hochladen kann, und es den sprechenden Charakteren zuordnet)
Gibt es gute Modelle für die Umwandlung von Bildern in Videos, die Gespräche zwischen zwei oder mehr Charakteren verarbeiten können?
(wo man einen Dialog mit mehr als einem Sprecher hochladen kann, und es den sprechenden Charakteren zuordnet)