熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
對於這些好奇的人來說,正如預期的那樣,Gemini 3 Deep Think 解決了讓我損失幾天的堆疊下溢錯誤。這個答案比 Opus 4.5 更具決斷性,後者是唯一其他能解決此問題的公開模型(即使 Gemini 3 Pro 也失敗了)。它甚至自信地指出了確切的位置。不過,這需要很長時間...
目前我沒有更困難的測試,我的大多數基準測試都已飽和,而且我在 SupGen 的工作上非常忙,所以我對這個問題就這麼多要說的。

熱門
排行
收藏

