Cline-Benchのようなベンチマークは、完全に開いている状態でしか動作しません。 すべてのタスクはオープンソースリポジトリから提供されるため、誰でも問題を調査し、環境を再現し、同じ実際のエンジニアリング作業でモデルやエージェントを比較できます。 これこそが、@MistralAIのリサーチサイエンティストである@b_roziereのような人々にとって重要な点であり、誰もが利用できるコーディング能力の最前線を押し広げるオープンインフラを望んでいるのです。