В этом мире быть хорошим человеком очень трудно. DeepSeek — первая в мире компания, которая открыла CoT, то есть цепочку рассуждений для RL. До этого только OAI четко знала о применении CoT-RL, но OAI считала это коммерческой тайной и не делилась рассуждениями. Нет доказательств того, что компания A применяла CoT-RL до этого. Тем не менее, сегодня компания A обвиняет DS в плагиате своей цепочки рассуждений. Это просто слишком.