Benchmark Kimi K2.5 ale wykonany przez naukowców danych OpenAI