O artigo do DeepSeek-R1 foi atualizado há 2 dias, expandindo de 22 para 86 páginas e adicionando uma quantidade substancial de detalhes. O novo conteúdo aborda temas como a autoevolução do DeepSeek-R1-Zero, avaliação do DeepSeek-R1, análises adicionais e destilação do DeepSeek-R1. DeepSeek-R1: Incentivando a Capacidade de Raciocínio em LLMs por Meio de Aprendizagem por Reforço Papel: