Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Hunyuan
Mô hình lớn của Tencent, bao gồm tạo văn bản, tạo hình ảnh, tạo video và tạo 3D. @ tôi bất cứ lúc nào!
✨Chúng tôi rất vui mừng khi mở mã nguồn Tencent HY-Motion 1.0, một mô hình chuyển đổi văn bản thành chuyển động với một tỷ tham số được xây dựng trên kiến trúc Diffusion Transformer (DiT) và khớp dòng chảy. Tencent HY-Motion 1.0 trao quyền cho các nhà phát triển và người sáng tạo cá nhân bằng cách chuyển đổi ngôn ngữ tự nhiên thành các hoạt hình nhân vật 3D chất lượng cao, mượt mà và đa dạng, mang lại khả năng theo dõi hướng dẫn xuất sắc trên nhiều danh mục khác nhau. Các tài sản hoạt hình 3D được tạo ra có thể được tích hợp liền mạch vào các quy trình hoạt hình 3D điển hình.🎮🎥
Điểm nổi bật:
🔹DiT quy mô tỷ: Đã thành công trong việc mở rộng DiT khớp dòng chảy lên hơn 1B tham số, thiết lập một giới hạn mới cho khả năng theo dõi hướng dẫn và chất lượng chuyển động được tạo ra.
🔹Chiến lược đào tạo toàn diện: Mô hình tạo chuyển động đầu tiên trong ngành với một vòng lặp hoàn chỉnh Pre-training → SFT → RL để tối ưu hóa tính hợp lý vật lý và độ chính xác ngữ nghĩa.
🔹Phạm vi danh mục toàn diện: Có hơn 200 danh mục chuyển động trên 6 lớp chính—toàn diện nhất trong ngành, được tuyển chọn qua một quy trình dữ liệu tỉ mỉ.
🌐Trang dự án:
🔗Github:
🤗Hugging Face:
📄Báo cáo kỹ thuật:
61
🚀🚀🚀Chúng tôi rất vui mừng thông báo mã nguồn mở Tencent-HY-MT1.5, với hai mô hình dịch thuật—1.8B và 7B—được thiết kế cho việc triển khai liền mạch trên thiết bị và đám mây với tốc độ và độ chính xác hàng đầu trong ngành.
Điểm nổi bật:
🔹 1.8B Sức mạnh trên thiết bị: Tối ưu hóa cho phần cứng tiêu dùng với dung lượng bộ nhớ 1GB. Sử dụng chưng cất theo chính sách để đồng bộ với các mô hình lớn hơn, nó cung cấp độ trễ 0.18 giây (50 token), vượt trội hơn các API thương mại chính thống.
🔹 Hiệu suất SOTA 7B: Phiên bản nâng cấp của nhà vô địch WMT25 của chúng tôi, vượt qua các mô hình mã nguồn mở cỡ trung và cạnh tranh với phần trăm 90 của các gã khổng lồ mã nguồn đóng như Gemini-3.0-Pro.
🔹 Hơn 33 Ngôn ngữ & Địa phương: Dịch thuật độ trung thực cao trên 33 ngôn ngữ và 5 phương ngữ Trung Quốc.
🔹 Sẵn sàng cho sản xuất: Hỗ trợ bản địa cho thuật ngữ tùy chỉnh, ngữ cảnh hội thoại dài và duy trì định dạng tài liệu.
Đã cung cấp năng lượng cho nhiều dịch vụ của Tencent, sự kết hợp của chúng tôi giữa hai mô hình đảm bảo hiệu suất nhất quán và ổn định trên cả môi trường thiết bị và đám mây. 🌍
👉🏻 Thử ngay:
🔗 GitHub:
🤗 Hugging Face:


51
🚀🚀🚀Giới thiệu HY World 1.5 (WorldPlay)! Chúng tôi đã mở mã nguồn cho khung mô hình thế giới thời gian thực hệ thống hóa và toàn diện nhất trong ngành.
Trong HY World 1.5, chúng tôi phát triển WorldPlay, một mô hình khuếch tán video trực tuyến cho phép mô hình hóa thế giới tương tác thời gian thực với tính nhất quán hình học lâu dài, giải quyết sự đánh đổi giữa tốc độ và bộ nhớ mà các phương pháp hiện tại gặp phải.
Bạn có thể tạo và khám phá các thế giới 3D chỉ bằng cách nhập văn bản hoặc hình ảnh. Đi bộ, nhìn xung quanh và tương tác như thể bạn đang chơi một trò chơi.
Điểm nổi bật:
🔹Thời gian thực: Tạo video trực tuyến dài hạn ở 24 FPS với tính nhất quán vượt trội.
🔹Tính nhất quán hình học: Đạt được bằng cách sử dụng cơ chế Bộ nhớ Ngữ cảnh Tái cấu trúc để xây dựng lại ngữ cảnh từ các khung hình trước đó nhằm giảm thiểu sự suy giảm bộ nhớ.
🔹Kiểm soát mạnh mẽ: Sử dụng Đại diện Hành động Kép để phản hồi mạnh mẽ với các đầu vào từ bàn phím và chuột của người dùng.
🔹Ứng dụng đa dạng: Hỗ trợ cả góc nhìn người thứ nhất và người thứ ba, cho phép các ứng dụng như sự kiện có thể yêu cầu và mở rộng thế giới vô hạn.
👉🏻Thử ngay:
🌐Trang Dự án:
🔗Github:
🤗Hugging Face:
📄Báo cáo Kỹ thuật:
1,86K
Hàng đầu
Thứ hạng
Yêu thích
