Neste mundo, é difícil ser uma boa pessoa. A DeepSeek é a primeira empresa do mundo a tornar público o CoT, ou cadeia de raciocínio, para RL. Antes disso, apenas a OAI sabia claramente como aplicar o CoT-RL, mas a OAI tratou isso como um segredo comercial e não divulgou o raciocínio. Não há evidências de que a empresa A tenha aplicado o CoT-RL antes disso. No entanto, hoje a empresa A acusa a DS de plagiar sua cadeia de raciocínio. Não há nada mais absurdo do que isso.