對於這些好奇的人來說,正如預期的那樣,Gemini 3 Deep Think 解決了讓我損失幾天的堆疊下溢錯誤。這個答案比 Opus 4.5 更具決斷性,後者是唯一其他能解決此問題的公開模型(即使 Gemini 3 Pro 也失敗了)。它甚至自信地指出了確切的位置。不過,這需要很長時間... 目前我沒有更困難的測試,我的大多數基準測試都已飽和,而且我在 SupGen 的工作上非常忙,所以我對這個問題就這麼多要說的。