株式会社Preferred Networks(以下、PFN)は、同社が開発した130億パラメータの事前学習済み大規模言語モデル「PLaMo-13B(Preferred Language Model、プラモ)」を、研究・商用で利用可能なオープンソースソフトウェア(OSS)ライセンスで、2023年9月28日より公開した。
「PLaMo-13B」の開発にあたり、PFNは、学習に使用可能なオープンデータセットを独自に収集・加工して、1.4兆トークンの大規模な日英2言語のデータセットを作成した。
また、国立研究開発法人産業技術総合研究所が保有するAI橋渡しクラウド(ABCI)のNVIDIA A100を480GPU使用して、1か月弱の学習を行った。
この「PLaMo-13B」の推論に必要なコードおよびパラメータを、研究・商用利用が可能なライセンス(Apache License v2.0)で公開することで、日本語・英語に対応する大規模言語モデルを使った、様々な研究開発および検証を進められる環境を開発者に提供する。
また、PFNは、新会社である株式会社Preferred Elements(以下、PFE)を2023年11月1日に会社分割により設立する。
これにより、今回公開するOSSを超える大規模かつ高機能な基盤モデルの開発を促進し、2024年中に商用でのサービス提供の開始を目指すとともに、PFNグループのプロダクト・サービスでの活用を進めていく予定だ。
今後は、大規模言語モデルの課題として指摘されている偽情報(ハルシネーション)、バイアス、悪用リスクへの対策、事前学習用データの作成・収集に関して、国・大学・企業とも連携を深め、基盤モデルの開発につなげていくとしている。
無料メルマガ会員に登録しませんか?
IoTに関する様々な情報を取材し、皆様にお届けいたします。