Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Một hình ảnh để hiểu mô hình mới DeepSeek DeepSeek-Math-V2!
DeepSeek vừa mới phát hành DeepSeek-Math-V2!
Đúng vậy, đây là một mô hình chuyên dụng dành riêng cho lĩnh vực suy luận toán học, lần này được huấn luyện lại/tinh chỉnh dựa trên DeepSeek-V3.2, có nghĩa là DeepSeek đã hoàn toàn chuyển sang kiến trúc mới.
Về hiệu suất, IMO 2025 (Cuộc thi Olympic Toán học Quốc tế) đã đạt 83.3%, đạt mức vàng của IMO. ProofBench-Basic đã đạt điểm số 99%, vượt trội hơn tất cả các mô hình khác. Trong khi đó, ProofBench-Advanced chỉ đứng sau Gemini Deep Think (đây là nền tảng có Agent, không phải là mô hình thuần túy).
Nhân tiện, năm nay IMO 2025 đầu tiên cũng là của nước ta. Sau đó, tôi đã tính điểm 83.3% của DeepSeek-Math-V2 trung bình cho mỗi câu hỏi, điểm số sẽ là 210 điểm (điểm tối đa 252 điểm, tỷ lệ chính xác 83.3%), có thể nằm giữa Mỹ (216 điểm) và Hàn Quốc (203 điểm), tức là vị trí thứ 3.

Hàng đầu
Thứ hạng
Yêu thích

