Ik vind het grappig hoe het onderzoek van DeepSeek grotendeels wordt genegeerd. Ze hebben de industrie, schreeuwend en tegenstribbelend, de wereld van efficiënte MoEs en efficiënte RL binnengetrokken, maar dat is het. Waarom zijn alle volledige aandacht Instructs DSA nog niet? Zijn de Math-V2-methoden aangenomen? Nee. «Geef me walvisgewichten»
Ahmad
Ahmad10 jan, 11:53
laat die v4 snel vallen, walvis
(Natuurlijk wil ik ook V4)
221