Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Hunyuan
Duży model Tencent obejmuje generowanie tekstu, generowanie obrazów, generowanie wideo i generowanie 3D. @ mnie w każdej chwili!
✨Z radością ogłaszamy, że udostępniamy Tencent HY-Motion 1.0 jako open-source, model tekst-do-ruchu z miliardem parametrów, zbudowany na architekturze Diffusion Transformer (DiT) oraz dopasowywaniu przepływu. Tencent HY-Motion 1.0 umożliwia programistom i indywidualnym twórcom przekształcanie naturalnego języka w wysokiej jakości, płynne i różnorodne animacje 3D postaci, oferując wyjątkowe możliwości śledzenia instrukcji w szerokim zakresie kategorii. Wygenerowane zasoby animacji 3D można bezproblemowo zintegrować z typowymi pipeline'ami animacji 3D.🎮🎥
Najważniejsze cechy:
🔹DiT w skali miliardowej: Sukcesywnie skalowany model DiT z dopasowaniem przepływu do ponad 1 miliarda parametrów, ustanawiając nowy sufit dla możliwości śledzenia instrukcji i jakości generowanego ruchu.
🔹Strategia pełnego etapu szkolenia: Pierwszy w branży model generacji ruchu z kompletną pętlą Pre-training → SFT → RL, aby zoptymalizować fizyczną prawdopodobieństwo i dokładność semantyczną.
🔹Kompleksowe pokrycie kategorii: Oferuje ponad 200 kategorii ruchu w 6 głównych klasach - najbardziej kompleksowe w branży, starannie opracowane za pomocą starannego pipeline'u danych.
🌐Strona projektu:
🔗Github:
🤗Hugging Face:
📄Raport techniczny:
6
🚀🚀🚀Z radością ogłaszamy otwarte źródło Tencent-HY-MT1.5, które zawiera dwa modele tłumaczeniowe—1.8B i 7B—zaprojektowane do bezproblemowego wdrażania na urządzeniach i w chmurze, z wiodącą w branży prędkością i dokładnością.
Najważniejsze cechy:
🔹 1.8B Moc na urządzeniu: Optymalizowane dla sprzętu konsumenckiego z pamięcią o wielkości 1GB. Używając destylacji na polityce, aby dostosować się do większych modeli, osiąga opóźnienie 0.18s (50 tokenów), przewyższając mainstreamowe komercyjne API.
🔹 7B Wydajność SOTA: Ulepszona wersja naszego mistrza WMT25, przewyższająca średniej wielkości modele open-source i rywalizująca z 90. percentylem gigantów zamkniętoźródłowych, takich jak Gemini-3.0-Pro.
🔹 33+ Języków i Dialektów: Tłumaczenie o wysokiej wierności w 33 językach i 5 dialektach chińskich.
🔹 Gotowe do produkcji: Natywne wsparcie dla niestandardowej terminologii, kontekstu długich dialogów i zachowania formatowania dokumentów.
Już zasilające wiele usług Tencent, nasza synergia dwóch modeli zapewnia spójną i stabilną wydajność zarówno w środowiskach na urządzeniach, jak i w chmurze. 🌍
👉🏻 Wypróbuj to teraz:
🔗 GitHub:
🤗 Hugging Face:


27
🚀🚀🚀Przedstawiamy HY World 1.5 (WorldPlay)! Teraz udostępniliśmy najbardziej zsystematyzowany, kompleksowy framework modelu świata w czasie rzeczywistym w branży.
W HY World 1.5 rozwijamy WorldPlay, model dyfuzji wideo strumieniowego, który umożliwia interaktywne modelowanie świata w czasie rzeczywistym z długoterminową spójnością geometryczną, rozwiązując problem kompromisu między szybkością a pamięcią, który ogranicza obecne metody.
Możesz generować i eksplorować światy 3D, po prostu wprowadzając tekst lub obrazy. Chodź, rozglądaj się i wchodź w interakcje, jakbyś grał w grę.
Najważniejsze cechy:
🔹Czas rzeczywisty: Generuje wideo strumieniowe o długim horyzoncie w 24 FPS z doskonałą spójnością.
🔹Spójność geometryczna: Osiągnięta dzięki mechanizmowi Reconstituted Context Memory, który dynamicznie odbudowuje kontekst z poprzednich klatek, aby złagodzić osłabienie pamięci.
🔹Solidna kontrola: Używa Dual Action Representation do solidnej reakcji na wejścia z klawiatury i myszy użytkownika.
🔹Wszechstronne zastosowania: Obsługuje zarówno perspektywę pierwszoosobową, jak i trzecioosobową, umożliwiając zastosowania takie jak zdarzenia wywoływane przez użytkownika i nieskończone rozszerzenie świata.
👉🏻Wypróbuj to teraz:
🌐Strona projektu:
🔗Github:
🤗Hugging Face:
📄Raport techniczny:
1,81K
Najlepsze
Ranking
Ulubione
