Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Hunyuan
Modelul mare de la Tencent cuprinde generarea de text, generarea de imagini, generarea de videoclipuri și generarea 3D. @ eu oricând!
✨Suntem entuziasmați să lansăm open-source Tencent HY-Motion 1.0, un model text-to-motion cu miliarde de parametri, construit pe arhitectura Diffusion Transformer (DiT) și potrivirea fluxului. Tencent HY-Motion 1.0 oferă atât dezvoltatorilor, cât și creatorilor individuali, transformând limbajul natural în animații 3D de înaltă fidelitate, fluide și diverse, oferind capabilități excepționale de urmărire a instrucțiunilor într-o gamă largă de categorii. Activele de animație 3D generate pot fi integrate perfect în fluxurile tipice de animație 3D. 🎮🎥
Momente importante:
🔹DiT la scară miliardă: A scalat cu succes adaptarea fluxului DiT la parametri 1B+, stabilind un nou plafon pentru capacitatea de urmărire a instrucțiunilor și generând calitate a mișcării.
🔹Strategie de antrenament complet: Primul model de generare a mișcării din industrie, care include un ciclu complet de pre-antrenament → SFT → RL pentru optimizarea plauzibilității fizice și a acurateței semantice.
🔹Acoperire cuprinzătoare a categoriilor: Include 200+ categorii de mișcare în 6 clase majore — cele mai cuprinzătoare din industrie, selectate printr-un flux de date meticulos.
🌐Pagina proiectului:
🔗Github:
🤗Față de îmbrățișare:
📄Raport tehnic:
🚀🚀🚀Suntem încântați să lansăm open-source Tencent-HY-MT1.5, care oferă două modele de traducere — 1.8B și 7B — concepute pentru o implementare fluidă pe dispozitiv și cloud, cu viteză și precizie de top în industrie.
Momente importante:
🔹 1.8B Putere On-Device: Optimizat pentru hardware de consum cu o suprafață de memorie de 1GB. Folosind distilarea on-policy pentru a se alinia cu modele mai mari, oferă o latență de 0,18s (50 tokenuri), depășind API-urile comerciale mainstream.
🔹 7B SOTA Performance: O versiune îmbunătățită a campionului nostru WMT25, depășind modelele open-source de dimensiuni medii și rivalizând cu percentila 90 a giganților din sursă închisă precum Gemini-3.0-Pro.
🔹 33+ Languages & Dialects: Traducere de înaltă fidelitate în 33 de limbi și 5 dialecte chinezești.
🔹 Pregătit pentru producție: Suport nativ pentru terminologie personalizată, context de dialog lung și menținerea formatării documentelor.
Deja alimentând mai multe servicii Tencent, sinergia noastră dual-model asigură performanțe constante și stabile atât în mediile on-device, cât și în cele cloud. 🌍
👉🏻 Încearcă acum:
🔗 GitHub:
🤗 Față de îmbrățișare:


22
🚀🚀🚀Vă prezentăm HY World 1.5 (WorldPlay)! Acum am deschis în sursă cel mai sistematizat și cuprinzător cadru de modele în timp real din industrie.
În HY World 1.5, dezvoltăm WorldPlay, un model de difuzie video în streaming care permite modelarea interactivă a lumii în timp real, cu consistență geometrică pe termen lung, rezolvând compromisul dintre viteză și memorie care limitează metodele actuale.
Poți genera și explora lumi 3D pur și simplu introducând text sau imagini. Plimbă-te, uită-te în jur și interacționează ca și cum ai juca un joc.
Momente importante:
🔹Timp real: Generează streaming video pe termen lung la 24 FPS cu o consistență superioară.
🔹Consistență geometrică: Realizată folosind un mecanism de Memorie Reconstituită a Contextului pentru a reconstrui dinamic contextul din cadrele anterioare pentru a reduce atenuarea memoriei
🔹Control robust: Folosește o Reprezentare de Acțiune Duală pentru un răspuns robust la inputurile de tastatură și mouse ale utilizatorului.
🔹Aplicații versatile: Suportă atât perspective la persoana întâi, cât și la persoana a treia, permițând aplicații precum evenimente promptabile și extindere infinită a lumii.
👉🏻Încearcă acum:
🌐Pagina proiectului:
🔗Github:
🤗Față de îmbrățișare:
📄Raport tehnic:
1,81K
Limită superioară
Clasament
Favorite
