富士通、AIを活用した化学文書検索サービス「SCIDOCSS」を提供開始

従来の化学業界における材料開発では、研究者が自身の経験やノウハウを基に、新たな化合物の配合の検討などを通じて新材料の開発が行われていたが、現在、研究者に依存しない効率的な材料開発手法を確立するため、ディープラーニングなどのAI技術を活用し、データに基づいて意思決定を行うデータ駆動型の材料開発が進んでいる。

特許を含む化学文書は、物性値をはじめ、化合物の合成条件や手順を示す合成プロセス情報などが記載されているため、新たな材料開発のアイデアを得るためのデータリソースとして注目を集めている。

しかし、膨大な化学文書から適切な情報を抽出するためには、化合物の化学構造式などの特徴や、用途に基づく化合物の分類など、化学特有の知識やノウハウを基に検索を行い、適切な情報かどうかを一つひとつ判断する必要があるため、労力や時間を要することが課題となっていた。

富士通株式会社は、化学メーカーなどが材料開発時にアイデア発掘のために行っている、特許などの化学文書検索をAIにより実現する「FUJITSU Digital Laboratory Platform SCIDOCSS」(以下、SCIDOCSS)の提供を開始した。

SCIDOCSSは、キーワードによる検索に加え、化学構造式そのものによる検索にも対応したほか、数十行にわたる文章による検索にも対応している。さらに、化合物にはIUPAC名(※1)などの様々な命名法があるほか、通称もあることから複数の名称が存在するが、同サービスでは名称の違いを名寄せするため、幅広い名称で検索が可能だ。

これらの機能により、容易に精度の高い検索結果を得ることが可能となり、研究者の経験則に依存せず効率的に求める化学文書を検索できる。

また、富士通がこれまで研究開発を行ってきた自然言語処理技術を適用することで、同サービスに内包する化学文書データベース内の文書に対し、AIが検索キーワードの頻出度などから重み付けを行い、検索キーワードとの関連度が高いものを利用者にとって重要度が高い情報と判定する。

さらに、化学構造式による検索時に、構造式の合致度が高いものを重要度が高い情報と判定するため、キーワードと化学構造式の2つを同時に検索することで、より精度高く重要度が高い順に検索結果を表示できる。事前に実施した実証実験においては、これまで約5日を要していた化学文書の検索業務を1日で完了できることが確認できた。同機能の活用により、化学文書検索をこれまで以上にスムーズに実施することができる。

富士通は今後、化合物の物性(※2)および物性値(※3)を文書中から抽出する機能の追加や、検索対象を化学論文へ拡大するなど、さらなる機能強化を実施するほか、富士通が保有する材料インフォマティクス(※4)技術との連携を図ることで、材料開発業務のさらなる効率化に貢献するとしている。また、同サービスの販売目標として2024年度末までに売上8.6億円を掲げている。

なお、SCIDOCSSのSaaS版の販売価格は1,000万円/年額から、操作トレーニング費用(オプション)が20万円となっており、パッケージ版の販売価格は1,600万円、初期費用が100万円、操作トレーニング費用(オプション)が20万円となっている。

※1 IUPAC名:国際純正・応用化学連合(IUPAC)が定めた、化合物命名法に基づいた化合物の名称。
※2 物性:物質が持つ密度、融点、熱伝導率などの物理的性質。
※3 物性値:物質が持つ密度、融点、熱伝導率などの性質を数値で示したもの。
※4 材料インフォマティクス:AIやビッグデータを活用し、材料開発の効率化を目指す取り組み。

プレスリリース提供:富士通