シナモンAI、非構造ドキュメントを読み込む「Super RAG」を実用化

昨今、大規模言語モデル(以下、LLM)が実業務へ導入され始め、LLMによるテキスト生成に外部情報の検索を組み合わせることで回答精度を向上させる技術「Retrieval Augmented Generation(RAG)」が注目されている。

RAGにより、最新の正確な情報に基づいた回答生成や事実に基づかない情報生成(ハルシネーション)を抑制する効果が期待されている。

しかし、企業が保有するデータを扱う際に文書が複雑であることや、専門知識を要するなど、ドキュメントの解析や理解、意味抽出の観点からRAGにデータを取り込む過程での課題もある。

こうした中、株式会社シナモン(以下、シナモンAI)は、社内文書を活用するためのドキュメントLLM「Super RAG」を発表した。

「Super RAG」は、表やチャート図、棒グラフやダイアグラム、手書きなどの帳票から、情報抽出しながらハルシネーションを抑制し、LLM利用における文書活用を支援するサービスだ。

LLMが提供する全ての機能が利用可能であることを基本とし、「ドキュメント解析」「ナレッジ注入」「プロンプト自動生成」といった3つの独自技術を活用している。

以下は、一般のRAGシステムでは読み取り難易度が高い図表のサンプルと、シナモンAI「Super RAG」による情報抽出結果だ。読取対象とした元データは、同社が独自に作成したサンプルデータだが、読取結果は実際に各データをインプットとして「Super RAG」に投入した出力結果となっている。

シナモンAI、非構造ドキュメントを読み込む「Super RAG」を実用化
「Super RAG」 による情報抽出例

今後シナモンAIは、ドキュメントLLM「Super RAG」をエンドユーザ企業やパートナー企業向けに販売を推進するとしている。

なお、パートナー企業においては、提供されるアプリケーション内で「Super RAG」を組み込んで共同提供を行うパートナーシップや、カスタマイズによるエンドユーザのLLM利用を支援する際に「Super RAG」を採用するパートナーシップについて、パートナー企業各社との連携を開始しているとのことだ。

無料メルマガ会員に登録しませんか?

膨大な記事を効率よくチェック!

IoTNEWSは、毎日10-20本の新着ニュースを公開しております。 また、デジタル社会に必要な視点を養う、DIGITIDEという特集コンテンツも毎日投稿しております。

そこで、週一回配信される、無料のメールマガジン会員になっていただくと、記事一覧やオリジナルコンテンツの情報が取得可能となります。

  • DXに関する最新ニュース
  • 曜日代わりのデジタル社会の潮流を知る『DIGITIDE』
  • 実践を重要視する方に聞く、インタビュー記事
  • 業務改革に必要なDX手法などDXノウハウ

など、多岐にわたるテーマが配信されております。

また、無料メルマガ会員になると、会員限定のコンテンツも読むことができます。

無料メールから、気になるテーマの記事だけをピックアップして読んでいただけます。 ぜひ、無料のメールマガジンを購読して、貴社の取り組みに役立ててください。

無料メルマガ会員登録