Acho engraçado como a pesquisa da DeepSeek é em grande parte ignorada. Eles arrastaram a indústria, a contragosto, para o mundo dos MoEs eficientes e do RL eficiente, mas é isso. Por que ainda não estão todas as Instructs DSA com total atenção? Os métodos Math-V2 foram adotados? Não. «Dá-me os pesos das baleias»
Ahmad
Ahmad10/01, 11:53
por favor, lance essa v4 em breve, baleia
(Claro que eu também quero o V4)
209