Salesforceは、同社の自律型AIエージェント「Agentforce」のテストを自動化し、Sandbox(仮想環境)でAIエージェントのプロトタイプを試作するAIエージェントライフサイクル管理ツール「Agentforce Testing Center」を発表した。
AIエージェントとは?
Salesforceは、AIエージェントをソフトウェアの新たな概念とし、顧客や従業員の代わりに推論、そして行動できるシステムだと定義している。
人間の介入なしに顧客の問い合わせを理解して対応できるシステムで、機械学習と自然言語処理(NLP)を利用して、単純な質問への回答から複雑な問題の解決、マルチタスクといった幅広いタスクを処理する。
AIエージェントの大きな特徴は、自己学習を通じて自身のパフォーマンスを継続的に向上させることができる点だ。
AIエージェントの課題
一方で、AIエージェントの可能性を引き出すためには、実際の運用環境で中断することなくテストおよび設定をする必要がある。
テストや設定を実運用環境でを行わないと、ハルシネーションや不正確な結果につながる可能性がある。
「Agentforce Testing Center」の概要
そこで今回発表された「Agentforce Testing Center」では、「Agentforce」でAIエージェントのテストや作動、監視を実行することができる。
なお、「Agentforce Testing Center」は、法人向けのアプリケーション開発・実行基盤となるクラウド型プラットフォーム「Salesforce Platform」上に構築されており、データプラットフォームである「Data Cloud」と統合されている。
「Agentforce」向けのAI生成テスト
「Agentforce」を使用するチームは、顧客が質問をしたり、AIエージェントとやりとりしたりする際に考えられる方法を正確にテストする必要がある。
そこで、AIエージェントの推論過程を調査するPlan Tracerを備えた「Agent Builder」に加え、今回の「Agentforce Testing Center」により、トピックとアクションの選択を大規模にテストする。
具体的には、自然言語による指示により、「Agentforce Service Agent」を利用する際に顧客が行うリクエストなど、数百の合成インタラクションを自動生成する。
チームは、テストデータを使用して指示を改良し、期待したトピックがより頻繁に選択されるようにすることで、顧客体験を向上させることができる。
「Agentforce」と「Data Cloud」向けSandbox
「Agentforce」をテストするチームは、安全で隔離された環境でテストする必要があるが、現在Salesforceが一般提供しているSandboxは、本番環境の組織のデータと構成をミラーイメージで再現しており、「Data Cloud」と「Agentforce」の両方をサポートする。
リスクのない環境に組織のデータとメタデータを複製することで、開発チームは非構造化データ基盤を構築し、業務に支障をきたすことなく「Agentforce」のプロトタイプを作成することができる。
チームは、初期ユーザグループを対象にユーザ受け入れテスト(UAT:User Acceptance Testing) を実施し、「Agentforce」が意図した通りにタスクを実行することを確認したうえで、変更セット、DevOps Center、Data Cloud とAgentforceをサポートするSalesforce CLIなどのツールを使用して、これらの変更を本番環境に移行することが可能だ。
「Agentforce」の監視と可観測性
「Data Cloud」向けSandboxの一般提供により、本番環境に先立って、セキュリティ機能を提供する「Einstein Trust Layer」のテストが可能になり、「Agentforce Agent」とプロンプトテンプレートの設定が可能になる。
また、「Einstein Trust Layer」の監査証跡とフィードバックがSandbox内に保存されるため、チームはユーザからのフィードバックに基づいてプロンプトやアクションを繰り返すことで、AIテストのクローズドループを構築することができる。
さらに、Data Cloud上にネイティブに構築された、新しい可観測性ソリューションにより、Agentforceの分析と発話分析を通じて、定着率と精度に関する詳細なインサイトを取得するための機能が利用できるようになる。
デジタルウォレットにおける使用状況の監視
「Data Cloud Sandbox」と「Agentforce」の使用量はデジタルウォレットで計測されるため、顧客はAI開発ライフサイクル全体にわたる使用状況を可視化することが可能だ。
どの機能がクレジットを消費しているか詳細なインサイトが得られるため、チームは規模を拡大しながら使用状況に関する新しい傾向を発見できる。
また、デジタルウォレットはSalesforce Platformに統合されているため、例えば、使用量が特定の最小値を示す閾値を超えた場合に管理者へ自動的に警告する、といったことが可能だ。
無料メルマガ会員に登録しませんか?
IoTに関する様々な情報を取材し、皆様にお届けいたします。