ByteDance впроваджує віртуальні мережі ширини (VWN) для ефективного масштабування ШІ Цей новий фреймворк розширює простір для вкладення моделей для ширших представлень, залишаючи при цьому обчислення сталим. Це прискорює оптимізацію більш ніж у 2 рази для next-token і у 3x для прогнозування next-2-token!