.@poetiq_ai 是一家由前 DeepMind 研究人員 (@itfische 和 @sbpoetiq) 創立的新創公司,最近在 ARC-AGI 基準上取得了重大進展,通過在 Gemini 3 上層疊一個遞歸自我改進系統。 在這次 NeurIPS 的對話中,@FrancoisChauba1 與 Poetiq 的聯合創始人 Ian Fischer 坐下來了解他們如何僅通過提示和系統設計來提高性能。 他們還探討了遞歸自我改進、朝 AGI 的基準進展,以及為什麼自動化提示工程可能是當今 AI 中最強大的杠杆之一。 00:11 — 介紹 Poetiq 和 ARC-AGI 突破 00:49 — 性能提升有多大? 01:18 — Ian Fisher 的背景:YC、Google、DeepMind 02:00 — 遞歸自我改進的解釋 03:00 — 為什麼 Poetiq 針對 ARC-AGI 03:58 — 在沒有權重訪問的情況下改進模型 04:26 — 集成、投票和系統級優化 05:30 — 為什麼 Gemini 3 改變了一切 06:21 — 下一步:基準、研究和客戶 07:14 — 遞歸自我改進是否是通往 AGI 的道路? 08:46 — 何時停止爬坡 09:16 — 自動化提示工程師和代理人