クロード作品4.5が本日発売されました。 コーディング、エージェント、コンピュータの利用に関して最先端であり、スプレッドシートやスライドの作成といった日常的な作業においても大幅に向上しています。 私たちが見ている様子は以下の通りです:
社内テスターからの一貫したフィードバックは、ただ「理解している」というものです。曖昧さやトレードオフに関する理由を手取り足取り教えることなく扱います。 Sonnet 4.5ではほぼ不可能だった課題が、今や手の届くところに来ています。
例えば、パフォーマンスエンジニアリングの候補者に悪名高い難しい持ち帰り試験を課しています。2時間の制限時間内で、Opus 4.5は人類の候補者よりも高いスコアを獲得しました。
また、効率も劇的に向上します。SWE-bench Verified at medium effortでは、Opus 4.5はSonnet 4.5を上回り、出力トークン数を76%少なく抑えています。 新しい努力パラメータにより、単一のダイヤルで知能とコストや遅延をトレードオフできます。
295.35K