percepta только что скомпилировала интерпретатор webassembly прямо в веса трансформера. никакого использования инструментов. никакого выполнения кода. сам модель запускает программы через свой прямой проход, токен за токеном. 33k токенов/сек на процессоре. 100% точность на самых сложных судоку. 7 слоев. 18 голов. компьютер, живущий внутри трансформера, это невероятно дико еще один для моей полки закладок.