DApp Store | Web3 Hub tapahtumille ja peleille

Trendaavat aiheet

Tämä kaavio on jo vanhentunut, eikä kukaan puhu siitä. Tulostaululla "Anthropic Opus 4.5" on 76,1 %. Opus 4.6 julkaistiin 5. helmikuuta, päivää sen jälkeen kun Perplexity julkaisi nämä tulokset. Anthropicin omien julkaisutietojen mukaan Opus 4.6 "parantaa sekä BrowseCompia että DeepSearchQA:ta." BrowseCompissa tämä parannus oli 16 prosenttiyksikköä (67,8 % vastaan 84,0 %). Meillä ei vielä ole DeepSearchQA-lukua, mutta jos nousu on edes puolet siitä, Opus 4.6 itsenäinen olisi Perplexityn 79,5 % yläpuolella. Tässä kohtaa asiat muuttuvat mielenkiintoisiksi. Perplexityn Advanced Deep Research suorittaa kaikki kyselyt Opus 4.5:ssä. Tämä vahvistetaan heidän omassa ilmoituksessaan. Opus 4.6 on jo saatavilla Perplexityn Cometin API:ssa, mutta Deep Research ei ole vielä vaihtanut sitä. Joten Kobeissin kutsuma "huippumoderni" tulos verrattiin malliin, joka korvattiin 24 tuntia myöhemmin. "Perplexity voittaa Anthropicin" kehystys peittää myös sen tosiasian, että Perplexityn moottori ON anthropic. Jokainen Advanced Deep Research -kysely suorittaa Opus 4.5:n Perplexityn agenttihakuvaljaston kautta. Antropinen on perusta. Hämmennys on teline. 3,4 pisteen ero niiden välillä (79,5 % vs 76,1 %) on Perplexityn hakuputken arvo Anthropicin päättelyn lisäksi. Kolme asiaa on tapahtumassa. Anthropic lähettää Opus 4.6:n tulostaululle. Perplexity päivittää Deep Researchin 4.5:stä 4.6:een. Ja koko tämä kaavio sekoitetaan uudelleen viikkojen sisällä. Jakamalla snapshotin benchmark-kisasta kesken askeleen ja kutsumalla sitä "breakingiksi" saat 186 000 katselukertaa eikä lainkaan oivalluksia.

Johtavat

Rankkaus

Suosikit