🚀 Présentation de LongCat-Flash-Thinking-2601 — Une version conçue pour une pensée agentique profonde et générale. ✨ Points forts : 🤖 Capacités d'agent de premier ordre 🔹 Performance : Résultats de benchmark de premier ordre (TIR / Recherche agentique / Utilisation d'outils agentiques) ; capacité de généralisation superbe, surpassant Claude dans des tâches complexes et aléatoires 🔹 Échelle d'environnement : Plusieurs environnements de haute qualité construits automatiquement ; graphique de dépendance dense 🔹 RL Multi-Environnement : DORA étendu (notre infrastructure RL), supportant un entraînement agentique multi-environnement à grande échelle 🛡️ Robustesse dans le monde réel 🔹 Performance : Performance solide dans des scénarios désordonnés et incertains (Vita-Noise & Tau^2-Noise) 🔹 Analyse du bruit : Analyse systématique du bruit du monde réel dans des scénarios agentiques 🔹 RL par curriculum : Augmentation du type et de l'intensité du bruit pendant l'entraînement 🎯 Mode de pensée intensive ​🔹 Pensée parallèle : Élargit la portée via plusieurs pistes de raisonnement indépendantes 🔹 Résumé itératif : Améliore la profondeur en utilisant un modèle de résumé pour synthétiser les sorties, soutenant des boucles de raisonnement itératives 📅 Une chose de plus : un contexte de 1M tokens via Zigzag Attention arrive bientôt. 🔍 Essayez-le maintenant : ✅ L'accès API pour cette version est également disponible. Hugging Face : GitHub :