サイトアイコン IoTNEWS

インサイトテクノロジー、データ活用基盤構築ソリューションに「名寄せ」「関連データ検知」の機能を強化・追加

インサイトテクノロジー、データ活用基盤構築ソリューションに「名寄せ」「関連データ検知」の機能を強化・追加

株式会社インサイトテクノロジーは、企業に散在しているデータを統合・可視化し、意思決定を支援するためのデータ活用基盤構築ソリューション「Insight Governor(インサイトガバナー)」の最新版「Ver. 1.1」の提供とサポートを、2023年7月から開始したことを発表した。

同社はこれまで、製造業、金融業、流通業の顧客とともに「Insight Governor」を活用した「顧客データ」や「製品データ」、「部品データ」の統合といったPoCを行っているが、データの形式が異なっていたり、登録ルールが混在していたりするため、時間や労力がかかるほか、統合自体が難しいケースなどが共通して起きていたとしている。

そこで「Ver.1.1」では、異なるテーブルやデータソースのデータを組み合わせて、日本語に強いAIによる名寄せができるようになった。

これにより、予め名寄せのルールを登録・管理することなく、氏名などの新字体・旧字体や表記ゆれ、製品名などの表記のばらつきを自動で検知できるようになった。

例えば、顧客データの「氏名」「社名」「住所」「電話番号」などの複数のデータを参照することで、同性同名の別人を正しく区別するといったことや、既存の名寄せルールを参照することでは難しかった、初出の「氏名」「社名」「製品名」などの名寄せが可能になる。

名寄せ機能の画面イメージ

なお、この機能は、ChatGPTのような大規模言語モデルに、インサイトテクノロジー独自のファインチューニングを行って構築したものだ。

さらに、「Ver.1.1」には異なるデータソースの関連データを検知する機能が追加されている。

関連データとは、データ自体やデータ項目名などに類似性があるものを指すが、その関連性がわからないデータが社内に散在していることが多くある。これらの関連データを検知して紐付けることではじめて、データを分析に利用することができるようになる。

例えば、販売管理システムの「部品データ」と在庫管理システムの「部品データ」が各部署で別のデータ項目名で管理されているといったことがあるが、「Ver.1.1」では、これらの「部品データ」を類似性のあるデータとしてまとめて検知し、紐付けることができる。

関連データ検知機能の画面イメージ
モバイルバージョンを終了