英国AIセキュリティ研究所、GPT-5.5の脆弱性発見能力をベンチマーク
英国の**AIセキュリティ研究所**は最近、**GPT-5.5**のセキュリティ脆弱性特定能力を評価しました。その結果は、**Claude Mythos**と同等であり、AI主導のサイバーセキュリティ分析における重要な進歩を示唆しています。興味深いことに、テストされた**OpenAI**モデルは一般公開されています。
英国の**AIセキュリティ研究所**は、**GPT-5.5**のセキュリティ脆弱性検出能力に関する評価を発表し、その能力が**Claude Mythos**と比較可能であることを明らかにしました。これは、同研究所の公式レポートによるものです。
[Claude Mythosの評価はこちら](https://www.aisi.gov.uk/blog/our-evaluation-of-claude-mythos-previews-cyber-capabilities)で確認できます。
より小規模でコスト効率の高いモデルの分析では、十分なプロンプトとガイダンスがあれば、同様の結果が得られることが示唆されています。この分析は[こちら](https://aisle.com/blog/ai-cybersecurity-after-mythos-the-jagged-frontier)で見ることができます。