富士通株式会社は、セキュリティに特化したスキルやナレッジを持つ複数のAIエージェントを連携させることで、企業や公共団体のITシステムにおいて、新たな脅威へのセキュリティ対策を支援するマルチAIエージェントセキュリティ技術を開発した。
この技術は、組織や拠点をまたぐ複数のAIエージェントを連携するマルチAIエージェント連携技術、プロアクティブなセキュリティ対策に必要なAIエージェントを実現するセキュリティAIエージェント技術、生成AIのセキュリティ耐性について攻撃を自動的に防御・緩和する生成AIセキュリティ強化技術の3つの技術で構成されている。
一つ目のマルチAIエージェント連携技術では、組織や拠点ごとに開発されたAIエージェントを、透過的に協働させる。
協働におけるポリシーを自律的に制御して接続する、セキュアエージェントゲートウェイを組織や拠点ごとのAIエージェント基盤に導入することで、AIエージェントを連携させることが可能になった。
なお、セキュリティ用途だけでなく汎用的に利用可能とのことだ。
二つ目のセキュリティAIエージェント技術では、プロアクティブなセキュリティ対策に必要な基本的なセキュリティAIエージェントとして、「攻撃AIエージェント」「防御AIエージェント」「テストAIエージェント」の3つのAIエージェントを開発した。
それぞれのAIエージェントには、サイバーセキュリティの研究しているベングリオン大学と共同開発した技術が搭載されている。
これらのAIエージェントを、マルチAIエージェント連携技術で連携させることで、テストAIエージェントに構築された「サイバーツイン」上で攻撃AIエージェントと防御AIエージェントによる攻撃・防御シミュレーションが交互に行われ、新たな脆弱性へのプロアクティブな対策を行う。
三つ目の生成AIセキュリティ強化技術では、生成AIのセキュリティ耐性について、自動で網羅性高く確認を行うLLM脆弱性スキャナーと、攻撃を自動的に防御・緩和できるLLMガードレールを、ベングリオン大学と共同開発した。
LLM脆弱性スキャナーは、生成AIに存在しうることが知られている様々な脆弱性について、3,500以上の最新の脆弱性に対応している。
なお、LLM脆弱性スキャナーには、生成コード脆弱性チェック機能や、LLMの応答にあわせて攻撃プロンプトを選択して攻撃・評価を実現するアダプティブ・プロンプト技術、生成AIを活用した脆弱性説明技術が含まれている。
一方LLMガードレールは、LLM脆弱性スキャナーと連携し、脆弱性と判定されて対処が必要な攻撃的なプロンプトを、ITシステム運用中に検知し拒絶する機能であるガード規則を自動的に適用して、不適切な回答を防ぐ。
LLM脆弱性スキャナーとLLMガードレールは、それぞれ攻撃AIエージェント、防御AIエージェントと連携して動作する。
まずは、生成AIセキュリティ強化技術に関して、Cohere Inc.とのパートナーシップを通じて、2024年12月より技術実証を開始する。
さらに、マルチAIエージェント連携技術の一部をオープンソースのAIエージェント基盤である「OpenHands」から2025年1月に公開し、その後、2025年3月より、セキュリティAIエージェント技術、生成AIセキュリティ強化技術を含むマルチAIエージェントセキュリティ技術のトライアル提供を開始するとしている。
今後は、さらに様々なセキュリティ業務を自動化するアプリケーション構築へ向け、セキュア設計、インシデント対応、セキュリティ監査などのセキュリティAIエージェントを拡充していく予定だ。
また、生成AIセキュリティ強化技術については、対応領域をRAGアプリケーションに特有の脆弱性や幻覚(ハルシネーション)対策にも広げる計画だ。
[マルチAIエージェントセキュリティ技術の紹介動画]無料メルマガ会員に登録しませんか?
IoTに関する様々な情報を取材し、皆様にお届けいたします。