GPT-5 získal v OSWorld téměř 70 %: "OSWorld: Benchmarking multimodal agentů pro otevřené úlohy v reálných počítačových prostředích" OSWorld je první škálovatelné reálné počítačové prostředí svého druhu pro multimodální agenty, podporující nastavování úloh, vyhodnocování založené na provádění a interaktivní učení napříč operačními systémy. Může sloužit jako jednotné prostředí pro vyhodnocování otevřených počítačových úloh, které zahrnují libovolné aplikace (např. příklady úloh na obr. výše).