シナモン、技術文書デジタル化とナレッジ活用をワンストップで行うAI-OCR「ぜんぶよむもん LLMオプション」を提供開始

製造業界では、いまだに大量の書類が紙で保管されている企業が多く、倉庫や書庫に探しに行かないと必要な情報を参照できない場合がある。また、文書がPDF化されていたとしてもファイル名でしか検索できず、文章の中身を含めた検索ができないなど、保管してきた大量のナレッジを有効活用しきれていないことが課題となっている。

株式会社シナモン（以下、シナモンAI）は、手書きと活字いずれの書類でも文字を自動認識し、テキスト抽出することができるAI-OCR「Flax Scanner」を、製造業、建設業の技術文書画像の文字読み取りに特化し、ナレッジ資産化を推進するAIモデルとして「ぜんぶよむもん」を提供している。

ぜんぶよむもんは、業界用語を含む、仕様書、報告書、点検記録、図面、実験・試験データ、取扱説明書、マニュアル、専門誌、調査資料、契約書など各種文書に対応し、漢字やひらがな、カタカナ、英数字、記号・単位を読み取ることができる。

このほど、シナモンAIは大規模言語モデルをオプションとして連携する「ぜんぶよむもん LLMオプション Powered by Azure OpenAI Service」（以下、ぜんぶよむもん LLMオプション）を、2023年8月1日より提供開始する。
　
ぜんぶよむもん LLMオプションは、ぜんぶよむもんをAzure OpenAI Serviceと連携させることで、チャットを通じて技術文書の内容について様々な情報処理サポートを行い、文書ナレッジの活用が可能となる。代表的なユースケースとして、従来では個別開発が必要とされた「文書内容からの特定情報の抽出」を簡易的に実行できる。

また、ブラウザ経由でChatGPTを使用する場合、入力データが学習に利用されることによる情報漏洩がセキュリティ面での課題となるが、ぜんぶよむもん LLMオプションではAPI経由でChatGPTと連携されるため、入力データが学習に利用されることがない。そのため、入力データを学習に利用されない環境で大規模言語モデルを業務利用することが可能となる。

さらに、ぜんぶよむもん、およびぜんぶよむもん LLMオプションは、PDF・JPG・JPEG・PNG・TIFF・TIFの6種類のファイル形式から画像取り込み（全文AI-OCR処理）が可能だ。

一方の出力は、Excel（lmage line report）では、画像ファイルとテキストのOCR読み取り出力結果になり、Excel（line report）ではテキストのみのOCR読み取り出力結果、PDF（透明テキスト付き）では、Searchable PDF（サーチャブルPDF）として元の画像ファイルの情報に載せてPDFファイルで出力される。これにより、画像に加えてOCR読み取り結果からの全文テキスト検索などが可能となる。