我在想,在某些定點硬體上,使用以 2 為底的 softmax 而不是以 e 為底,是否會是一種有用的優化。將 1 加在小數部分前面,然後根據整數部分向左移位,作為 2^fixed_point 的一個近似值。