Sonet 4.5 właśnie został wydany – zajmuje 1. miejsce w naszych benchmarkach finansowych i programistycznych! Mieliśmy okazję przetestować nowy model @claudeai przed premierą i uznaliśmy go za wyjątkowo zdolny, szczególnie w zastosowaniach agentowych.
(1/6)
GPT-5 Codex osiągnął imponujące wyniki w prawie każdym benchmarku, który ocenialiśmy! Najbardziej godne uwagi jest jego 10% poprawa w Terminal-Bench w porównaniu do poprzedniego #1, GPT-5. Gratulacje dla zespołu @OpenAI za mocny model kodowania!
(1/6)