乘法曾经是 LLM 的一个难点,但现在几乎已经解决。为了这次比赛,我对所有主流模型进行了网格搜索,gpt-oss-120b 脱颖而出,在 18 位数乘以 18 位数的乘法中正确率达到了 ~93%!太疯狂了! 例如:364826485628193748 * 492816485726395817 = ...