マクニカとALBERT、画像キャプションを自動生成する「マルチモーダルAIライブラリ」を提供開始

AIに対する知識・理解が深まり実装による新たな価値創出に取り組む企業も多くなってきた中、課題となっているのがAIの精度の向上である。
マクニカとALBERT、画像キャプションを自動生成する「マルチモーダルAIライブラリ」を提供開始
株式会社マクニカのAI専門家組織であるAI Research & Innovation Hub(ARIH)は、統合ブランド「macnica.ai」のサービスポートフォリオの一つとして、2020年9月にRe:Alize(※1)サービスをリリースし、技術検証を最短で実施し効果的に運用できるように、AI実装に不可欠なライブラリ(※2)をライセンス化し提供してきた。

また、それに先立ち、マクニカと株式会社ALBERTは2019年11月に資本業務提携契約を締結し、両社でデジタルデータを活用した社会課題解決への取り組みを推進している。

このほど、両社は画像キャプション生成の自動化を実現する「マルチモーダルAI」を活用したライブラリの提供を開始した。

マルチモーダルAIとは、現在のビジネス領域で広く活用されている「特化型AI」に分類される画像認識や音声認識などを複合的に処理・判断することが可能なAIである。これにより、多様な情報を統合して判断する熟練者の問題処理能力に近づくことが期待できる。

これにより多面的な情報を組み合わせて人間の判断に近いライブラリを手軽に利用することが可能となり、ユーザーの事業領域におけるマルチモーダルAIの導入を拡大し、AIの社会実装を加速させるとしている。

例えば、テレマティクス保険やリスクアセスメントなどのレポート作成業務の中には、収集した動画データを目視で確認して手動でのレポート作成が必要なケースがある。この作業には人手がかかり、個人の作業に依存してしまうという課題があるが、マルチモーダルAIを活用することにより、動画データのインプットから状況のテキスト化までを自動化し、レポート作成業務時間短縮などの効率化が期待できるとしている。

マクニカとALBERT、画像キャプションを自動生成する「マルチモーダルAIライブラリ」を提供開始
画像キャプション生成例
※1 Re:Alize:AIの技術検証から運用開始までを最短1か月で実現し、その後の継続的な保守・運用をサポートするサービス。
※2 ライブラリ:ARIHにおける約300件のAIプロジェクト支援実績で培った知見・ノウハウ並びに前処理やAIアルゴリズムを、業界や課題ドメイン毎に共通化し、再利用可能な形にしたもの。これに「マルチモーダルAIライブラリ」が追加された。