OpenAIがコードのセキュリティレビューを自動化するAIエージェント「Codex ...
同社でのベータ版の導入では、同じリポジトリを継続的にスキャンした結果精度が向上し、あるケースではノイズが84%削減され、重大度が過大報告される割合は90%以上削減、すべてのリポジトリにおける誤検出率は50%以上減少したという。
AnthropicのFrontier Red TeamとMozillaがAIを用いた脆弱(ぜいじゃく)性検出に関する連携を行い、Claude Opus 4.6がわずか2週間の調査でFirefoxについて計112件の報告を提出し、その中から22件の脆弱性が確認されたことを報告しました。この成果は、AIが大規模なコードベースの安全性を極めて高い速度で検証し、強化できる可能性を実証するものです。