🚀 LongCat-Flash-Thinking-2601 Teknik Raporu – Şimdi Tam Olarak Yayınlandı! Temel bilgiler: 🌍 Büyük ölçekli ajanik gerçek deneyim (14 sayfa derinlemesine inceleme!) 🔹 Ortam ölçeklendirme: 20+ alan içinde 10.000+ çalıştırılabilir, doğrulanabilir ortam oluşturan otomatik pipeline'ımıza ayrıntılı bir bakış. 🔹 RL altyapısı: 32.000+ eşzamanlı ortamda asenkron eğitimi destekleyen ve uzun kuyruklu ve yüksek heterojen görevlerde istikrar sorunlarını çözen yükseltilmiş bir DORA çerçevesi. 🛡️ Vahşi doğada dayanıklılık 🔹 Gürültü enjeksiyonu: Artık "sera" maddesi yok. Gerçek dünya gürültüsünü (kullanıcı/araç gürültüsü) sistematik olarak analiz eder ve doğrudan eğitim döngüsüne entegre ederiz. 🔹 Müfredat RL: Karmaşık ve kusurlu ortamlara karşı modeli yavaş yavaş sertleştiren müfredat temelli bir strateji. 🧠 Ağır Düşünme Çerçevesi 🔹 Paralel akıl yürütme: Birden fazla bağımsız akıl yürütme yörüngesi oluşturarak genişliği genişletir. 🔹 Yinelemeli özetleme: Nihai kararlar vermeden önce paralel yörüngeleri yansıtmak ve sentezlemek için özet model kullanarak derinliği genişletir. 🔹 Bağlam belleği: Uzun ufuklar boyunca akıl yürütmeyi tutarlı tutmak için özel olarak tasarlanmış bir bellek modülü. ⚡ Zigzag Dikkat 🔹 MLA + SSA'yı birleştiren Zigzag Connectivity tasarımı, hesaplamayı azaltırken küresel bilgi akışını koruyor. 🔹 Eğitim ortasında seyrek varyantlara geçiş 1.5× hızlanma sağlar ve 1M-token bağlamlarını destekler — uzun bağlamlı ajanik akıl yürütmede gelecekteki atılımların temelini oluşturur. 🔹 Keşfedin: 📊 SOTA arasında başarılar Anahtar ajanik kıyaslamalar arasında açık kaynak modeller: arama, araç kullanımı, matematiksel akıl yürütme ve kodlama. Daha fazla detay isterseniz, tam teknik raporu incelemekten çekinmeyin. • Makale: • Web Sitesi: • GitHub: • Sarılma Yüzü: