Vibeコーディングは安全ですか? この問題に深く踏み込んだ研究がついに実現しました。 調査結果は以下の通りです。 AIコーディングエージェントは機能的なコードを書くことができます。しかし、機能的であることは安全という意味ではありません。 「バイブコーディング」と呼ばれる、開発者がAIエージェントに最小限の監督でタスクを任せる手法の台頭は加速しています。より多くの自律性、より速い、より高い生産性。前提としては、うまくいけば十分だということです。 しかし、動作するコードと安全なコードは同じものではありません。 この新しい研究では、SUSVIBESというベンチマークを導入します。これはオープンソースプロジェクトからの200件の実際の機能要望を対象としており、特に人間のプログラマーに割り当てられた際に脆弱な実装につながったタスクを対象としています。 その結果は驚くべきものです! SWE-Agent with Claude Sonnet 4がこれらのタスクに取り組むと、61%の解答が機能的に正しいです。安全であるのはわずか10.5%です。 それは大きなギャップです。エージェントの解決策は10回中6回効果があります。約10人に1人は生産に安全です。 研究者たちは複数のフロンティアエージェントをテストし、一貫したパターンを発見しました。すべてのエージェントがソフトウェアセキュリティの面でパフォーマンスが悪いというものです。これはモデル固有の問題ではありません。それはシステム的な問題です。 さらに懸念されるのは、機能リクエストに脆弱性のヒントを追加したり、潜在的なセキュリティ問題をエージェントに警告したりしても、これらのセキュリティ問題を緩和できないことです。明白に思える対策は、これらのエージェント系には効果がありません。 開発者や組織が速度と効率のためにAIコーディングエージェントの採用を競う中で、セキュリティを優先して速度を上げているかもしれません。 🔖 (ブックマーク) 紙: