Benchmarking GPT-5.4 lepsze niż Claude Opus 4.6 w zakresie użycia komputera, przeglądania internetu, zadań związanych z pracą wiedzy i użycia narzędzi przez agentów 👀 Czas to wypróbować