DeepSeek V4 bị rò rỉ: HumanEval: ~90% (các rò rỉ từ cộng đồng trên Reddit + tóm tắt của Skywork AI) SWE-bench: “>80%” lãnh thổ (được tham chiếu trong các bài so sánh Wavespeed suy diễn từ các tiêu chuẩn của Claude Opus) Bối cảnh: lên đến 1 triệu token (gói tin đồn được lặp lại trong Reddit AI Insider + các tóm tắt blog) Chi phí: được cho là rẻ hơn 20–40 lần so với OpenAI (dựa trên các so sánh với giá API của DeepSeek V3/R1 so với các cấp độ mô hình frontier) Dự kiến: 17 tháng 2 (thời gian Tết Nguyên Đán được báo cáo rộng rãi trong các bài viết rò rỉ)
Hãy coi những con số này với một chút hoài nghi.
24