気になっている方のために、予想通り、Gemini 3 Deep Thinkは私が数日間時間を失っていたスタックアンダーフローのバグを解決してくれました。その答えは、Opus 4.5よりも決定的であり、Opus 4.5はこの問題を解決した唯一の他の公開モデルです(Gemini 3 Proでさえ失敗しています)。正確な場所まで自信を持って指し示している。でも時間はすごくかかる... 今のところ難しいテストはなく、ほとんどのベンチマークは飽和状態で、SupGenの作業でとても忙しいので、これくらいしか言えません