DApp Mağazası | Etkinlikler ve Oyunlar için Web3 Merkezi

Trend Olan Konular

Bu grafik zaten modası geçmiş ve kimse bundan bahsetmiyor. Liderlik tablosu "Anthropic Opus 4.5"i %76,1 olarak gösteriyor. Opus 4.6, Perplexity'nin bu sonuçları yayınlamasından bir gün sonra, 5 Şubat'ta piyasaya sürüldü. Anthropic'in kendi yayın notlarında Opus 4.6'nın "hem BrowseComp hem de DeepSearchQA'dan daha iyi oldukları" yazıyor. BrowseComp'ta bu iyileşme 16 puan (%67,8'e %84,0) idi. Henüz DeepSearchQA sayısına sahip değiliz, ancak sıçrayış bunun yarısı bile büyükse, Opus 4.6 bağımsız olarak Perplexity'nin %79,5'inin üzerinde olurdu. İşte işin ilginç olduğu yer buraya. Perplexity'nin Advanced Deep Research, Opus 4.5 üzerindeki tüm sorguları çalıştırıyor. Bu, kendi duyurularında da doğrulanıyor. Opus 4.6, Comet için Perplexity'nin API'sinde zaten mevcut, ancak Deep Research henüz geçiş yapmadı. Bu yüzden Kobeissi'nin son dakika haber olarak nitelendirdiği "son teknoloji" sonuç, 24 saat sonra yerini alan bir modelle karşılaştırıldı. "Perplexity Anthropic'i yeniyor" çerçevesi, Perplexity'nin motorunun ANTHROPIC olduğu gerçeğini de gömüyor. Her Gelişmiş Derin Araştırma sorgusu, Perplexity'nin ajanik arama deferinde Opus 4.5'i çalıştırır. Antropik temeldir. Şaşkınlık iskele yapısıdır. Aralarındaki 3,4 puanlık fark (%79,5 vs %76,1), Perplexity'nin geri getirme hattının Anthropic'in mantığının üzerine değeridir. Üç şey olmak üzere. Anthropic, Opus 4.6'yı liderlik tablosuna gönderir. Perplexity, Deep Research'i 4.5'ten 4.6'ya yükseltiyor. Ve bu tablo haftalar içinde yeniden düzenleniyor. Bir benchmark yarışının bir anlık görüntüsünü paylaşıp ona "breaking" demek, 186K izlenme ve sıfır içgörü elde etmenin yoludur.

En İyiler

Sıralama

Takip Listesi