Trong thế giới này, thật khó để trở thành một người tốt. DeepSeek là công ty đầu tiên trên thế giới công khai CoT, tức là chuỗi suy diễn để RL. Trước đó, chỉ có OAI biết rõ về việc áp dụng CoT-RL, nhưng OAI coi đây là bí mật thương mại và không công bố suy diễn. Không có bằng chứng cho thấy A đã áp dụng CoT-RL trước đó. Tuy nhiên, hôm nay A đã cáo buộc DS sao chép chuỗi suy diễn của mình. Không gì có thể quá đáng hơn điều này.