Provedli jsme naše nejnovější hodnocení pokročilého uvažování Box AI na Opus 4.5 se středním a vysokým úsilím a zaznamenali jsme nárůst o 20 procentních bodů oproti Opus 4.1. Co je šílené přemýšlet, je, že Opus 4.1 vyšel teprve před třemi měsíci. Toto hodnocení se přibližuje tomu, co pracovník znalostí dělá jako samostatný úkol se svými podnikovými dokumenty. Může to být finanční analytik, který analyzuje firmu, nebo konzultant, který provádí výzkum pro klienta. Hodnocení hodnotí model podle toho, jak odpovídá na složitý obchodní zadání v rámci řady kritérií. S tímto hodnocením jsme stále na začátku a budeme jej rozšiřovat do širšího spektra odvětví a případů použití. Je jasné, že tyto nejnovější modely uvažování budou v každé aktualizaci stále lepší a lépe ekonomicky výhodné práce. Začalo to původně programováním, ale podobné vylepšení uvidíme ve zdravotnictví, právu, finančních službách, výrobě a mnoha dalších oborech.