✨Z radością ogłaszamy, że udostępniamy Tencent HY-Motion 1.0 jako open-source, model tekst-do-ruchu z miliardem parametrów, zbudowany na architekturze Diffusion Transformer (DiT) oraz dopasowywaniu przepływu. Tencent HY-Motion 1.0 umożliwia programistom i indywidualnym twórcom przekształcanie naturalnego języka w wysokiej jakości, płynne i różnorodne animacje 3D postaci, oferując wyjątkowe możliwości śledzenia instrukcji w szerokim zakresie kategorii. Wygenerowane zasoby animacji 3D można bezproblemowo zintegrować z typowymi pipeline'ami animacji 3D.🎮🎥 Najważniejsze cechy: 🔹DiT w skali miliardowej: Sukcesywnie skalowany model DiT z dopasowaniem przepływu do ponad 1 miliarda parametrów, ustanawiając nowy sufit dla możliwości śledzenia instrukcji i jakości generowanego ruchu. 🔹Strategia pełnego etapu szkolenia: Pierwszy w branży model generacji ruchu z kompletną pętlą Pre-training → SFT → RL, aby zoptymalizować fizyczną prawdopodobieństwo i dokładność semantyczną. 🔹Kompleksowe pokrycie kategorii: Oferuje ponad 200 kategorii ruchu w 6 głównych klasach - najbardziej kompleksowe w branży, starannie opracowane za pomocą starannego pipeline'u danych. 🌐Strona projektu: 🔗Github: 🤗Hugging Face: 📄Raport techniczny: