DeepSeek-R1の論文は2日前に更新され、22ページから86ページに拡大され、かなりの詳細が加えられました。 新コンテンツでは、DeepSeek-R1-Zeroの自己進化、評価、さらなる分析、そしてDeepSeek-R1の蒸留などのトピックが扱われています。 DeepSeek-R1:強化学習によるLLMにおける推論能力のインセンティブ化 論文: