GPT-5.4 кращий бенчмаркінг, ніж Claude Opus 4.6, щодо використання комп'ютера, веб-серфінгу, завдань з роботи з знаннями та використання 👀 інструментів агентів Час спробувати