DeepSeek-R1:n artikkeli päivitettiin kaksi päivää sitten, laajentaen 22 sivusta 86 sivuun ja lisäten huomattavasti yksityiskohtia. Uusi sisältö kattaa aiheita kuten DeepSeek-R1-Zeron itsekehitys, DeepSeek-R1:n arviointi, lisäanalyysit ja DeepSeek-R1:n tislaus. DeepSeek-R1: Päättelykyvyn kannustaminen LLM:issä vahvistusoppimisen avulla Artikkeli: