Бенчмарк Kimi K2.5 но выполненный учеными данных OpenAI