DApp Store | Hub Web3 pentru evenimente și jocuri

Subiecte populare

Acest grafic este deja depășit și nimeni nu vorbește despre el. Clasamentul arată "Anthropic Opus 4.5" la 76,1%. Opus 4.6 a fost lansat pe 5 februarie, la o zi după ce Perplexity a publicat aceste rezultate. Notele de lansare ale Anthropic spun că Opus 4.6 "îmbunătățește atât BrowseComp, cât și DeepSearchQA." Pe BrowseComp, această îmbunătățire a fost de 16 puncte procentuale (67,8% față de 84,0%). Nu avem încă cifra DeepSearchQA, dar dacă saltul ar fi măcar jumătate din această dimensiune, Opus 4.6 independent ar depăși 79,5% pentru Perplexity. Aici devine interesant. Advanced Deep Research de la Perplexity rulează fiecare interogare pe Opus 4.5. Acest lucru este confirmat în propriul lor anunț. Opus 4.6 este deja disponibil pe API-ul Perplexity pentru Comet, dar Deep Research nu a făcut încă tranziția. Astfel, rezultatul "de ultimă generație" pe care Kobeissi îl numește știri de ultimă oră a fost comparat cu un model care a fost depășit 24 de ore mai târziu. Încadrarea piesei "Perplexity beats Anthropic" ascunde și faptul că motorul Perplexity ESTE Anthropic. Fiecare interogare Advanced Deep Research rulează Opus 4.5 prin harness-ul agențic de căutare al Perplexity. Anthropic este fundația. Perplexitatea este schelă. Diferența de 3,4 puncte dintre ele (79,5% față de 76,1%) reprezintă valoarea pipeline-ului de recuperare al Perplexity peste raționamentul Anthropic. Trei lucruri urmează să se întâmple. Anthropic trimite Opus 4.6 în clasament. Perplexity actualizează Deep Research de la 4.5 la 4.6. Și tot acest grafic este rearanjat în câteva săptămâni. Să împărtășești o imagine de referință a unei curse de referință în mijlocul pasului și să o numești "breaking" este modul în care obții 186.000 de vizualizări și zero informații.

Limită superioară

Clasament

Favorite