広告掲載　 | 会員登録　

2023-09-20

エクサウィザーズ、画像内容を基に対話型で説明する生成AIモデル「exaBase Visual QA」を開発

TOP > 人工知能（AI） > エクサウィザーズ、画像内容を基に対話型で説明する生成AIモデル「exaBase Visual QA」を開発

企業：エクサウィザーズ（ExaWizards）

by IoTNEWS編集部

株式会社エクサウィザーズは、画像の内容を基に、その状況を対話型で説明する生成AIモデル「exaBase Visual QA」を開発したことを発表した。

「exaBase Visual QA」を開発するにあたりエクサウィザーズは、人が画像を見た時にどこに注目するのかを、生成AIモデルに学習させることに取り組んだ。

その結果、人が直感的に認識可能な、画像内の危険性や違和感といった状況を解釈することが可能になった。「exaBase Visual QA」を実装したシステムとチャットボットのように対話することで、状況を説明する文章を生成することができる。

具体的には、トップ画のような画像に対して、「潜在的な危険性はありますか」と入力することで、「作業員がバランスを崩したり足場が崩れたりすると落下につながる。作業員は金属棒を接続するために電動工具を使用しており、工具が滑ると負傷する可能性がある。適切な安全予防措置を講じるべきである」といった文章を生成する。

システムの実装時には長文を出力するが、それらをChatGPTを用いて必要な部分にフォーカスした要約が可能だ。

なお、エクサウィザーズでの評価実験では、他の商用利用可能なモデルより最大で1割弱高い解釈の精度を持っていることが確認されている。

また、「exaBase Visual QA」は、オープンソースの生成AIモデルをベースに開発されており、エクサウィザーズが追加学習を実施しているため、すぐに利用することが可能だ。

さらに、個別の分野のデータを学習し、設定を調節する「ファインチューニング」をエクサウィザーズ側で行うことで、特定の分野での精度を向上させることもできる。

特に自然画像（人工的に生成した画像など以外）は高い精度で解釈することができ、解釈した意味内容に基づいてデータを振り分ける「分類モデル」としての利用も可能だ。

適用分野は、建設現場などでの作業における危険性の判定や、学校など多様な人の動きがある場所での状況把握、製品ラインなどでの合否を判定する分類モデルの構築などが挙げられている。

提供形態は、さまざまなソフトウェアやシステムに組み込んで活用することが想定されており、現時点でPoC（概念実証）用途での提供が可能だ。当初は静止画を対象とするが、動画での活用も可能だとしている。

無料メルマガ会員に登録しませんか？

膨大な記事を効率よくチェック！

IoTNEWSは、毎日新着ニュースを公開しております。

週一回配信される、無料のメールマガジン会員になっていただくと、記事一覧やオリジナルコンテンツの情報が取得可能となります。

AIに関する最新ニュース
実践を重要視する方に聞く、インタビュー記事
業務改革に必要なAI活用方などのノウハウ

など、多岐にわたるテーマが配信されております。

また、無料メルマガ会員になると、会員限定のコンテンツも読むことができます。

無料メールから、気になるテーマの記事だけをピックアップして読んでいただけます。ぜひ、無料のメールマガジンを購読して、貴社の取り組みに役立ててください。

無料メルマガ会員登録

IoTNEWS編集部

IoTに関する様々な情報を取材し、皆様にお届けいたします。

企業向けAI活用虎の巻

AIによって「優秀な人材」の定義が変化したことを、どうみるべきか　—AI時代の人材採用と教育

AIによって「優秀な人材」の定義が変化したことを、どうみるべきか　—AI時代の人材採...

まだ、生成AIのチャットボットで消耗しているの？　ー自律的に動くAIエージェントが働き方を180°変える

まだ、生成AIのチャットボットで消耗しているの？　ー自律的に動くAIエージェントが働...

AI時代の「中間管理職クライシス」　—部下がAIに相談する時代、上司の価値はどこに残るか？

AI時代の「中間管理職クライシス」　—部下がAIに相談する時代、上司の価値はどこに残...

AIに仕事を頼む技術　—なぜ「営業資料を作って」と頼むと失敗するのか？

AIに仕事を頼む技術　—なぜ「営業資料を作って」と頼むと失敗するのか？

生成AIは、使い手の「言語化能力」を暴く、リトマス試験紙

生成AIは、使い手の「言語化能力」を暴く、リトマス試験紙

AIに「ゴミ」を食わせるな　ーAIエージェントが賢くなるデータ、バカになるデータ

AIに「ゴミ」を食わせるな　ーAIエージェントが賢くなるデータ、バカになるデータ

AIで業務を自動化する方法とは　ーなぜ、ChatGPTを配っても仕事は減らないのか？

AIで業務を自動化する方法とは　ーなぜ、ChatGPTを配っても仕事は減らないのか？

なぜあなたの会社で、生成AIが活用されないのか？どこで活用すべきか？

なぜあなたの会社で、生成AIが活用されないのか？どこで活用すべきか？

生成AI活用ガイド

AIでパワポ生成はどこまでできるか？Claude Cowork×PowerPointアドインで実現できる可能性と限界

AIでパワポ生成はどこまでできるか？Claude Cowork×PowerPoint...

Claude Coworkは経費精算をどこまで効率化できる？30件の非構造化データを用いた抽出精度検証

Claude Coworkは経費精算をどこまで効率化できる？30件の非構造化データを...

なぜAIは的外れな回答をするのか？RAG構築の要「チャンク分割」と「メタデータ」の概要と設計方法を解説

なぜAIは的外れな回答をするのか？RAG構築の要「チャンク分割」と「メタデータ」の概...

「自律型AI」が変えるSEO対策、Claude Codeを用いたSearch Console解析と競合調査の自動化検証

「自律型AI」が変えるSEO対策、Claude Codeを用いたSearch Con...

ロー・ノーコードツールDifyとn8n、あなたの業務に最適なのはどっち？両者の思想・機能・構築プロセスの全容を解説

ロー・ノーコードツールDifyとn8n、あなたの業務に最適なのはどっち？両者の思想・...

AIでスカウト文を自動生成！プロフィールから「コピペ感ゼロ」の刺さる文案を自動生成する仕組みを解説

AIでスカウト文を自動生成！プロフィールから「コピペ感ゼロ」の刺さる文案を自動生成す...

「CV増が売上に繋がらない」を解消！n8nでリードスコアリングと戦略立案を自動化する方法を解説

「CV増が売上に繋がらない」を解消！n8nでリードスコアリングと戦略立案を自動化する...

ノーコードで実現！人事データの不整合を自動抽出する給与監査システムの構築方法を解説

ノーコードで実現！人事データの不整合を自動抽出する給与監査システムの構築方法を解説

AIはどんな業務を効率化できる？13の検証事例から見えた生成AI導入方法と活用を徹底解説

AIはどんな業務を効率化できる？13の検証事例から見えた生成AI導入方法と活用を徹底...

現代のOJTの新常識！？Difyで教育を「補完」する対話型AIメンターの構築方法を解説

現代のOJTの新常識！？Difyで教育を「補完」する対話型AIメンターの構築方法を解...