株式会社PKSHA Technologyおよびグループ会社である株式会社PKSHA Workplaceと、TOPPANホールディングスのグループ会社であるTOPPANエッジ株式会社は、生成AIの回答精度を向上させる新RAG(※)サービスを共同開発し、サービス提供の第一弾として「PKSHA AIヘルプデスク」へ新RAGサービスを活用できる新プランを搭載し、2024年10月15日から金融業界を中心に共同で販売を開始する。
※RAG:LLM(大規模言語モデル)のテキスト生成に、信頼性の高い外部情報の検索を組み合わせることで、プロンプトだけではコントロールしづらい出力精度を向上させるフレームワーク。検索(Retrieval)機能を拡張(Augmented)し、質の高い回答を生成(Generation)できるようになることから、それぞれの頭文字を取って「RAG」と呼ばれる。
このサービスは、参照データの構造化やアルゴリズムのチューニングをすることで、RAGの回答精度を高めるための設計をしており、各工程を単独で設計した際と比較して高い回答精度の実現が可能となっている。
また、AIリーダブル化に特化した独自の生成AI専用ツールを用いることで、大量のドキュメントの一括での構造化をサポートする。
これにより、企業が保有する業務マニュアルや事務規定類を生成AIが参照するにあたり、元データをAIが読み取りやすいリーダブルな形式に構造化し、その構造化データに最適化されたアルゴリズムで読み取ることで、生成AIの回答精度を向上させている。
なお、サービスの開発にあたり、2024年5月7日から9月6日まで、株式会社静岡銀行の協力のもと、同行の行内規程類やマニュアルを題材に実証実験を実施した。
実証実験では、静岡銀行が検証対象となる元データとして行内規程類やマニュアル全34種を選定し、当該規程等に関する質問および模範回答を作成。元データをTOPPANエッジの新たな生成AI専用ツールにより、複数のLLMを統合的にカスタマイズできる環境を提供する「PKSHA LLMS」に最適化された文章に構造化し、PKSHAグループの新たな文字抽出・分割技術と検索アルゴリズムを組み合わせ、データベースを作成した。
そのデータベースを適用した「PKSHA AIヘルプデスク」に対して、静岡銀行行員が質問した回答を取得し、静岡銀行がその回答と模範解答を比較して正誤判定の上、評価した。
その結果、質問に対する回答の根拠が含まれるドキュメントを検索できた割合は87.3%から95.4%になり、質問に対する回答の根拠が含まれるテキストの塊(チャンク)まで検索できた割合は63.2%から84.6%に向上した。これにより、一般的なRAGと比較して回答精度が約2割向上したのだという。
なおTOPPANエッジは、今回の実証実験の結果および共同開発中の新RAGサービスの概要について、9月開催「PKSHA AI Summit for Workplace 2024」にて講演を行うとのことだ。
無料メルマガ会員に登録しませんか?
IoTに関する様々な情報を取材し、皆様にお届けいたします。