玩弄 Helion,真不错! 我自己基准测试了一些实现,考虑到它们的实现方式相对简单,速度提升还算不错(大多数 torch 实现已经有超级高效的内核作为后端,所以它能有正向的速度提升已经很令人印象深刻)