Článek DeepSeek-R1 byl aktualizován před 2 dny, rozšířil se z 22 na 86 stran a přidal značné množství detailů. Nový obsah pokrývá témata jako je samovývoj DeepSeek-R1-Zero, hodnocení DeepSeek-R1, další analýza a destilace DeepSeek-R1. DeepSeek-R1: Motivace schopnosti uvažování v LLM prostřednictvím posilovaného učení Článek: