DApp-butik | Web3-hubb för evenemang och spel

Trendande ämnen

DeepSeek R1 kan vara första gången den exakta artefakten fick tre olika tekniska rapporter – originalet, *Nature*-artikeln och en fullständig revision. Många tekniker förklaras här, infra, promptar... Men den största vinnaren? @TheZvi! De *är* faktiskt medvetna om att säkerhet är en sak.

Den 31 januari gjorde @EpochAIResearch en uppskattning av kostnaderna för RL som gick in i R1. Sedan Nature-artikeln visste vi att det var tre gånger den totala budgeten. Fel hur exakt? - Antagen batch = 1024 & Gruppstorlek = 64, som i DeepSeekMath. Verkligen: B=512, G=16. - endast 1700 steg för R1.

@EpochAIResearch förstås är @EgeErdil2 välkalibrerad och epistemiskt noggrann, så han visste exakt vad som sannolikt skulle hända

@EpochAIResearch @EgeErdil2 jag tror att det Ege gjorde fel var att underskatta att de var väldigt tydliga med att det inte var framgångsrikt på små modeller (de delar fler detaljer nu; r1-lite-preview var troligen Qwen2.5-32B). Ergo V3 var mycket mer samplingseffektiv. En meta-nivå före är mer intressant. Låg de efter?

872

Topp

Rankning

Favoriter