O artigo do DeepSeek-R1 foi atualizado há 2 dias, expandindo de 22 páginas para 86 páginas e adicionando uma quantidade substancial de detalhes. O novo conteúdo abrange tópicos como a auto-evolução do DeepSeek-R1-Zero, avaliação do DeepSeek-R1, análise adicional e destilação do DeepSeek-R1. DeepSeek-R1: Incentivando a Capacidade de Raciocínio em LLMs através do Aprendizado por Reforço Artigo: