Tôi thấy thật buồn cười khi nghiên cứu của DeepSeek hầu như bị bỏ qua. Họ đã kéo ngành công nghiệp, vừa đá vừa la hét, vào thế giới của các MoE hiệu quả và RL hiệu quả, nhưng chỉ có vậy. Tại sao chưa có tất cả các Instructs DSA được chú ý đầy đủ? Các phương pháp Math-V2 đã được áp dụng chưa? Không. «Cho tôi biết trọng lượng cá voi»
Ahmad
Ahmad11:53 10 thg 1
hãy sớm phát hành v4 đó nhé, cá voi
(Tất nhiên tôi cũng muốn V4)
219