🚀 介紹 LongCat-Flash-Thinking-2601 — 一個為深度和一般代理思考而建的版本。 ✨ 亮點: 🤖 頂級代理能力 🔹 性能:頂級基準結果(TIR / 代理搜索 / 代理工具使用);卓越的泛化能力,在複雜的隨機任務中超越 Claude 🔹 環境擴展:多個自動構建的高質量環境;密集的依賴圖 🔹 多環境強化學習:擴展 DORA(我們的強化學習基礎設施),支持大規模多環境代理訓練 🛡️ 現實世界的穩健性 🔹 性能:在混亂、不確定的場景中表現穩定(Vita-Noise & Tau^2-Noise) 🔹 噪音分析:系統性分析代理場景中的現實世界噪音 🔹 課程強化學習:在訓練過程中增加噪音類型和強度 🎯 重思考模式 ​🔹 平行思考:通過多個獨立的推理軌道擴展廣度 🔹 迭代總結:通過使用總結模型合成輸出來增強深度,支持迭代推理循環 📅 還有一件事:1M-token 上下文通過 Zigzag Attention 即將推出。 🔍 現在就試試: ✅ 此版本的 API 訪問也可用。 Hugging Face: GitHub: