Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
ORTAM ÖLÇEKLENDIRME DURUMU //
Çevresel ölçeklendirme, ajanik yapay zeka için model ölçeklendirme kadar önemli olabilir.
Mevcut yapay zeka araştırmaları, güçlü bir ajanik yapay zeka modeli oluşturmanın sadece daha iyi akıl yürütmeyle ilgili olmadığını gösteriyor. Aynı zamanda daha iyi ortamlarla ilgili.
Yetenekli yapay zeka ajanlarını eğitmenin varsayılan yaklaşımı, statik yörüngeler veya insan gösterimleri toplamaktır. Bu daha fazla veri, daha fazla örnek ve daha fazla açıklama çabası gerektirir.
Ama statik veriler dinamik karar vermeyi öğretemez. Bu şekilde eğitilen modeller, gerçek ajanik görevlerin uzun ufuklu, hedef odaklı doğasıyla mücadele eder.
Bu yeni araştırma, sadece veri ölçeklendirmek yerine etkileşimli eğitim ortamlarının çeşitliliğini ve karmaşıklığını sistematik olarak ölçekleyen Nex-N1 çerçevesini tanıtıyor.
Ajan yetenekleri taklit değil, etkileşimden ortaya çıkar. Daha fazla gösterim toplamak yerine, doğal dil spesifikasyonlarından otomatik olarak çeşitli ajan mimarileri ve iş akışları oluşturacak altyapı inşa ettiler.
Sistemin üç bileşeni vardır. NexAU (Ajan Evreni), basit yapılandırmalardan karmaşık ajan hiyerarşileri üreten evrensel bir ajan çerçevesi sunar. NexA4A (Ajan for Agent) doğal dilden çeşitli ajan mimarilerini otomatik olarak sentezler. NexGAP, gerçek dünya MCP araçlarını entegre ederek simülasyon-gerçeklik boşluğunu kapatarak yere dayalı yörünge sentezi sağlar.
Sonuç -ları:
- τ2-bench'te, DeepSeek-V3.1 üzerine inşa edilen Nex-N1, 80.2 puan alır ve temel modelin 42.8'ini geride bırakır.
- SWE-bench Verified'de, Qwen3-32B-Nex-N1 %50,5 oranına ulaşırken, temel modelin %12,9'u vardır.
- Araç kullanımı için BFCL v4'te Nex-N1 (65.3) GPT-5'i (61.6) geride bırakıyor.
43 kodlama senaryosunda gerçek dünya proje geliştirme insan değerlendirmelerinde, Nex-N1 %64,5'te Claude Sonnet 4.5'e karşı kazanır veya berabere kalır, GPT-5'e karşı ise ~%70'inde başarır.
Ayrıca Nex-N1 üzerinde derin bir araştırma ajanı geliştirdiler; Derin Araştırma Kıyaslaması'nda %47,0 oran elde ettiler; slaytlar ve araştırma posterleri dahil olmak üzere görselleştirilmiş rapor oluşturma yeteneklerine sahipler.
Kâğıt:

En İyiler
Sıralama
Takip Listesi

