株式会社インサイトテクノロジーは、企業に散在しているデータを統合・可視化し、意思決定を支援するためのデータ活用基盤構築ソリューション「Insight Governor(インサイトガバナー)」の最新版「Ver. 1.1」の提供とサポートを、2023年7月から開始したことを発表した。
同社はこれまで、製造業、金融業、流通業の顧客とともに「Insight Governor」を活用した「顧客データ」や「製品データ」、「部品データ」の統合といったPoCを行っているが、データの形式が異なっていたり、登録ルールが混在していたりするため、時間や労力がかかるほか、統合自体が難しいケースなどが共通して起きていたとしている。
そこで「Ver.1.1」では、異なるテーブルやデータソースのデータを組み合わせて、日本語に強いAIによる名寄せができるようになった。
これにより、予め名寄せのルールを登録・管理することなく、氏名などの新字体・旧字体や表記ゆれ、製品名などの表記のばらつきを自動で検知できるようになった。
例えば、顧客データの「氏名」「社名」「住所」「電話番号」などの複数のデータを参照することで、同性同名の別人を正しく区別するといったことや、既存の名寄せルールを参照することでは難しかった、初出の「氏名」「社名」「製品名」などの名寄せが可能になる。

なお、この機能は、ChatGPTのような大規模言語モデルに、インサイトテクノロジー独自のファインチューニングを行って構築したものだ。
さらに、「Ver.1.1」には異なるデータソースの関連データを検知する機能が追加されている。
関連データとは、データ自体やデータ項目名などに類似性があるものを指すが、その関連性がわからないデータが社内に散在していることが多くある。これらの関連データを検知して紐付けることではじめて、データを分析に利用することができるようになる。
例えば、販売管理システムの「部品データ」と在庫管理システムの「部品データ」が各部署で別のデータ項目名で管理されているといったことがあるが、「Ver.1.1」では、これらの「部品データ」を類似性のあるデータとしてまとめて検知し、紐付けることができる。

無料メルマガ会員に登録しませんか?

IoTに関する様々な情報を取材し、皆様にお届けいたします。