對我來說,GPT-5.2 和 Opus 4.5 在十一月確實感覺像是一個轉折點——那種模型逐漸變得更好的時刻,跨越了一條看不見的能力線,突然之間出現了一大堆更難的編碼問題。
Gemini 3 Pro 可能也應該被納入那個群體,但我並沒有看到像對另外兩款那樣,來自資深軟體工程師的驚訝熱議。
@Patarino 我認為這裡適合的原因是大多數模型升級都是漸進式的,但並不啟用之前無法運作的新用例——對我來說,GPT-5.2 和 Opus 4.5 似乎擁有了新的能力,可以進行長時間運行的代理循環,而這在之前的模型中並不夠可靠。
107