.@poetiq_aiは、元DeepMindの研究者(@itfische・@sbpoetiq)によって設立された新しいスタートアップで、最近、Gemini 3の上に再帰的な自己改善システムを重ねることで、ARC-AGIベンチマークで大きなジャンプを達成しました。 NeurIPSでのこの対談で、@FrancoisChauba1はPoetiqの共同創業者イアン・フィッシャーと対談し、プロンプトとシステム設計だけでパフォーマンスを向上させる方法について話を聞きました。 また、再帰的自己改善、AGIへの進捗ベンチマーク、そしてプロンプトエンジニアリングの自動化が今日のAIにおける最も強力なレバーの一つである理由についても探ります。 00:11 — PoetiqとARC-AGIブレイクスルーの紹介 00:49 — パフォーマンスの大幅な向上はどれくらいか? 01:18 — イアン・フィッシャーの背景:YC、Google、DeepMind 02:00 — 再帰的自己改善の解説 03:00 — なぜPoetiqがARC-AGIを標的にしたのか 03:58 — 重みを使わずにモデルを改善する 04:26 — アンサンブル、投票、システムレベルの最適化 05:30 — なぜジェミニ3号がすべてを変えたのか 06:21 — 今後:ベンチマーク、リサーチ、そして顧客 07:14 — 再帰的な自己改善はAGIへの道なのか? 08:46 — ヒルクライムをやめるタイミング 09:16 — プロンプトエンジニアとエージェントの自動化