DApp Mağazası | Etkinlikler ve Oyunlar için Web3 Merkezi

Trend Olan Konular

Yetenekli insanlar yöneticiliğe terfi ediyor. Yetenekli modeller de öyle. Claude kod çalıştırmayı yönetir. Gemini, isteği CRM ve sohbet üzerinden yönlendiriyor. GPT-5, kamu hisse senedi araştırmalarını koordine edebilir. Neden şimdi? Araç çağrısı doğruluğu bir eşiği aştı. İki yıl önce, GPT-4 fonksiyon çağırma görevlerinin %50'sinden azında başarılı oldu. Modeller, yanlış uç noktalar olarak adlandırılan parametreleri halüsinasyon olarak görüyor, konuşma ortasında bağlamı unutuyordu. Bugün, SOTA modelleri fonksiyon çağıran benchmarklarda %90 doğruluğun üzerindedir. Gemini 3 gibi en yeni modellerin performansı, testlerin önerdiğinden pratikte önemli ölçüde daha iyi.

Fonksiyon çağrıları yapmak için trilyon parametreli modellere mi ihtiyacımız vardı? Şaşırtıcı bir şekilde, evet. Küçük aksiyon modelleri, sadece alet seçimi için eğitilmiş hafif ağlarla yapılan deneyler üretimde başarısız olur. Dünya bilgisinden yoksunlar. Görünüşe göre yönetim bağlam gerektiriyor. Günümüzde, orkestratör genellikle kendini bir alt ajan olarak ortaya çıkarır (Claude Code başka bir Claude Code geliştirir). Bu simetri uzun sürmez. Acı ders ise, her şeyi daha büyük modellerin halletmesi gerektiğinde ısrar ediyor. Ama ekonomi buna karşı çıkıyor: damıtma ve güçlendirme ince ayarlama, modelleri %40 daha küçük ve %60 daha hızlı üretirken performansı %97 korur. Farklı tedarikçilerden uzmanlaşmış temsilciler ortaya çıkıyor. Sınır modeli, yöneticiler olur ve talepleri uzmanlar arasında yönlendirir. Bu uzmanlar, alanında en iyisi olmak için yarışan üçüncü parti satıcılar olabilir.

56

En İyiler

Sıralama

Takip Listesi