Das Papier von DeepSeek-R1 wurde vor 2 Tagen aktualisiert, von 22 Seiten auf 86 Seiten erweitert und enthält eine erhebliche Menge an Details. Der neue Inhalt behandelt Themen wie die Selbstentwicklung von DeepSeek-R1-Zero, die Bewertung von DeepSeek-R1, weitere Analysen und die Destillation von DeepSeek-R1. DeepSeek-R1: Anreize für die Denkfähigkeit in LLMs durch Verstärkungslernen Papier: