📊 スキル❓️の評価方法 多くの企業がコーディングエージェントのスキルを育成しています。でも、自分のスキルが本当に効果があるかどうかはどうやってわかるのでしょうか? 雰囲気で判断したくなるかもしれませんが、パフォーマンスはタスクごとに大きく異なりますし、コーディングエージェントには膨大なアクションスペースがあるため、その変動を予測するのはさらに難しいです。 私たちは新たにリリースされたLangSmithとLangChainのスキルに対する評価ベンチマークを作成しました。 ➡️ 私たちの調査結果はこちらをご覧ください: ➡️ 自分の目でベンチマークをチェックしてみてください: