Het paper van DeepSeek-R1 is 2 dagen geleden bijgewerkt, uitgebreid van 22 pagina's naar 86 pagina's en met een aanzienlijke hoeveelheid detail toegevoegd. De nieuwe inhoud behandelt onderwerpen zoals de zelf-evolutie van DeepSeek-R1-Zero, evaluatie van DeepSeek-R1, verdere analyse en distillatie van DeepSeek-R1. DeepSeek-R1: Het stimuleren van redeneercapaciteit in LLM's via versterkend leren Paper: