インサイトテクノロジー、データ活用基盤構築ソリューションに「名寄せ」「関連データ検知」の機能を強化・追加

株式会社インサイトテクノロジーは、企業に散在しているデータを統合・可視化し、意思決定を支援するためのデータ活用基盤構築ソリューション「Insight Governor(インサイトガバナー)」の最新版「Ver. 1.1」の提供とサポートを、2023年7月から開始したことを発表した。

同社はこれまで、製造業、金融業、流通業の顧客とともに「Insight Governor」を活用した「顧客データ」や「製品データ」、「部品データ」の統合といったPoCを行っているが、データの形式が異なっていたり、登録ルールが混在していたりするため、時間や労力がかかるほか、統合自体が難しいケースなどが共通して起きていたとしている。

そこで「Ver.1.1」では、異なるテーブルやデータソースのデータを組み合わせて、日本語に強いAIによる名寄せができるようになった。

これにより、予め名寄せのルールを登録・管理することなく、氏名などの新字体・旧字体や表記ゆれ、製品名などの表記のばらつきを自動で検知できるようになった。

例えば、顧客データの「氏名」「社名」「住所」「電話番号」などの複数のデータを参照することで、同性同名の別人を正しく区別するといったことや、既存の名寄せルールを参照することでは難しかった、初出の「氏名」「社名」「製品名」などの名寄せが可能になる。

インサイトテクノロジー、データ活用基盤構築ソリューションに「名寄せ」「関連データ検知」の機能を強化・追加
名寄せ機能の画面イメージ

なお、この機能は、ChatGPTのような大規模言語モデルに、インサイトテクノロジー独自のファインチューニングを行って構築したものだ。

さらに、「Ver.1.1」には異なるデータソースの関連データを検知する機能が追加されている。

関連データとは、データ自体やデータ項目名などに類似性があるものを指すが、その関連性がわからないデータが社内に散在していることが多くある。これらの関連データを検知して紐付けることではじめて、データを分析に利用することができるようになる。

例えば、販売管理システムの「部品データ」と在庫管理システムの「部品データ」が各部署で別のデータ項目名で管理されているといったことがあるが、「Ver.1.1」では、これらの「部品データ」を類似性のあるデータとしてまとめて検知し、紐付けることができる。

インサイトテクノロジー、データ活用基盤構築ソリューションに「名寄せ」「関連データ検知」の機能を強化・追加
関連データ検知機能の画面イメージ

無料メルマガ会員に登録しませんか?

膨大な記事を効率よくチェック!

IoTNEWSは、毎日10-20本の新着ニュースを公開しております。 また、デジタル社会に必要な視点を養う、DIGITIDEという特集コンテンツも毎日投稿しております。

そこで、週一回配信される、無料のメールマガジン会員になっていただくと、記事一覧やオリジナルコンテンツの情報が取得可能となります。

  • DXに関する最新ニュース
  • 曜日代わりのデジタル社会の潮流を知る『DIGITIDE』
  • 実践を重要視する方に聞く、インタビュー記事
  • 業務改革に必要なDX手法などDXノウハウ

など、多岐にわたるテーマが配信されております。

また、無料メルマガ会員になると、会員限定のコンテンツも読むことができます。

無料メールから、気になるテーマの記事だけをピックアップして読んでいただけます。 ぜひ、無料のメールマガジンを購読して、貴社の取り組みに役立ててください。

無料メルマガ会員登録