Kimi K2.5-benchmarken men gjort av OpenAI-dataforskere