Статтю DeepSeek-R1 оновили 2 дні тому, розширивши сторінки з 22 до 86 сторінок і додавши значну кількість деталей. Новий контент охоплює такі теми, як самоеволюція DeepSeek-R1-Zero, оцінка DeepSeek-R1, подальший аналіз та дистиляція DeepSeek-R1. DeepSeek-R1: Стимулювання здатності до мислення в LLM через навчання на основі підкріплення Стаття: