Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Vi kjørte vår siste Box AI avanserte resonnering på Opus 4.5 med middels og høy innsats, og så en økning på 20 prosentpoeng over Opus 4.1. Det som er sprøtt å tenke på er at Opus 4.1 kom ut for bare 3 måneder siden.
Denne evalueringen nærmer seg å tilnærme seg hva en kunnskapsarbeider gjør som en diskret oppgave med sine forretningsdokumenter. Det kan være en finansanalytiker som analyserer et selskap eller en konsulent som gjør research for en kunde.
Evalueringen vurderer modellen ut fra hvordan den svarer på en kompleks forretningsprompt på tvers av ulike kriterier. Vi er fortsatt tidlig ute med denne vurderingen og vil utvide den til et bredere spekter av industrier og bruksområder.
Det som er klart, er at disse nyeste resonnementsmodellene vil bli bedre og bedre på økonomisk nyttig arbeid for hver oppdatering. Dette startet opprinnelig med koding, men vi vil se lignende oppgraderinger innen helsevesen, jus, finansielle tjenester, produksjon og mange andre felt.

Topp
Rangering
Favoritter

