bảng rất thú vị từ deepseek v3.2 so sánh số lượng token đầu ra trên các chuẩn khác nhau, phiên bản đặc biệt dsv3.2 suy nghĩ nhiều hơn bất kỳ mô hình nào khác, NHƯNG vì họ đang sử dụng attention thưa nên chi phí suy diễn vẫn sẽ ổn chứ?