株式会社モルフォAIソリューションズ(以下、モルフォAIS)は、日本語LLMの学習データを生成するための、AI-OCR(光学文字認識)出力サービスの提供を、2023年12月19日より開始する。
このサービスは、独自LLMの構築を検討している企業・官公庁・地方自治体などの組織や、LLM開発を進めるAI企業・研究機関向けに、日本語テキストデータを提供するものだ。
モルフォAISの提供するOCR出力サービスは、日本語文書の多様なレイアウト(縦書き、横書き、多段組等)や、約7000種類の文字種に対応し、文章の読み順まで含めたテキスト生成を行う。
また、JPEG、PDF、PNGなどの画像が含まれている雑多な文書を、テキストで出力することが可能だ。
サービスの概要図
なお、このサービスは、国立国会図書館をはじめとして、様々な機関向けにテキスト生成を実施済みとのことだ。
無料メルマガ会員に登録しませんか?
膨大な記事を効率よくチェック!
IoTNEWSは、毎日新着ニュースを公開しております。
週一回配信される、無料のメールマガジン会員になっていただくと、記事一覧やオリジナルコンテンツの情報が取得可能となります。
- AIに関する最新ニュース
- 実践を重要視する方に聞く、インタビュー記事
- 業務改革に必要なAI活用方などのノウハウ
など、多岐にわたるテーマが配信されております。
また、無料メルマガ会員になると、会員限定のコンテンツも読むことができます。
無料メールから、気になるテーマの記事だけをピックアップして読んでいただけます。
ぜひ、無料のメールマガジンを購読して、貴社の取り組みに役立ててください。
無料メルマガ会員登録
IoTに関する様々な情報を取材し、皆様にお届けいたします。
企業向けAI活用虎の巻
生成AIは、使い手の「言語化能力」を暴く、リトマス試験紙
AIに「ゴミ」を食わせるな ーAIエージェントが賢くなるデータ、バカになるデータ
AIで業務を自動化する方法とは ーなぜ、ChatGPTを配っても仕事は減らないのか?
なぜあなたの会社で、生成AIが活用されないのか?どこで活用すべきか?
生成AI活用ガイド
サムスンが描く「AIリビング」 ーCES2026レポート1
顧客の声を生成AIで活用できる資産へ、ボタンひとつで分析するシステムの構築方法を解説
2026年、必須となる「3つの要素」を知り、AIでビジネスをブースト
IoTは、AIによって「産業のOS」へと変貌 —PoCと可視化の時代を超えて、デー...
SNS運用をAIで内製化するには?カスタムAIとノーコードツールで効率化する方法を解...
飲食店運営にAIをどう活用する?「在庫・ロス管理」「売上機会の損失」に対するAIシス...
生成AIでデキる営業の商談メモを再現性のあるナレッジへ、Difyを使ったナレッジ検索...
AI-OCRとは?基本定義や種類からDifyとGeminiで営業の紙処理を自動化する...
AIで社内に点在するデータを「価値」に変えるには?営業業務効率化へ向けたDifyによ...
カスタマーサポートの仕分けにAIを活用するメリットとは?Difyを活用したシステム構...