富士通・理化学研究所他、スーパーコンピュータ「富岳」で学習した大規模言語モデル「Fugaku-LLM」を公開

近年、米国を中心に大規模言語モデル(以下、LLM)の開発が活発に行われ、研究開発、経済社会、安全保障などあらゆる場面において変革が起きている。

日本においても、日本のスーパーコンピュータのフラッグシップシステムである「富岳」における大規模な分散並列計算を実施するための環境整備が求められていた。

こうした中、東京工業大学 学術国際情報センターの横田理央教授の研究チームと東北大学 大学院情報科学研究科の坂口慶祐准教授、富士通株式会社 人工知能研究所の白幡晃一シニアプロジェクトディレクタ、理化学研究所のMohamed Wahibチームリーダ、名古屋大学 大学院工学研究科の西口浩司准教授、株式会社サイバーエージェント AI事業本部AI Labの佐々木翔大リサーチサイエンティスト、Kotoba Technologies Inc.の小島熙之CEOは、理化学研究所のスーパーコンピュータ「富岳」を用いて学習した日本語能力に優れたLLM「Fugaku-LLM」を2024年5月10日に公開した。

このモデルは、日本語能力に優れ、130億パラメータを持つもので、国内で多く開発されている70億パラメータより一般に高性能である。

今回、深層学習フレームワークを「富岳」に移植して、ニューラルネットワークの「Transformer」の性能を「富岳」上で最適化するとともに、並列分散学習手法を開発し適用することで、「富岳」を用いてLLMの学習を行う際の演算速度を6倍に高速化した。

さらに、「富岳」向けに、高速なTofuインターコネクトD上での集団通信の最適化を行うことにより、通信速度を3倍高速化することに成功した。これにより「富岳」のCPUを用いて、現実的な時間内でLLMを学習することが可能になった。

なお「Fugaku-LLM」は、オープンソースソフトウェアの公開に使われているプラットフォームである「GitHub」や「Hugging Face」を通じ公開しており、ライセンスに従う限りにおいては、研究および商業目的での利用が可能である。

無料メルマガ会員に登録しませんか?

膨大な記事を効率よくチェック!

IoTNEWSは、毎日10-20本の新着ニュースを公開しております。 また、デジタル社会に必要な視点を養う、DIGITIDEという特集コンテンツも毎日投稿しております。

そこで、週一回配信される、無料のメールマガジン会員になっていただくと、記事一覧やオリジナルコンテンツの情報が取得可能となります。

  • DXに関する最新ニュース
  • 曜日代わりのデジタル社会の潮流を知る『DIGITIDE』
  • 実践を重要視する方に聞く、インタビュー記事
  • 業務改革に必要なDX手法などDXノウハウ

など、多岐にわたるテーマが配信されております。

また、無料メルマガ会員になると、会員限定のコンテンツも読むことができます。

無料メールから、気になるテーマの記事だけをピックアップして読んでいただけます。 ぜひ、無料のメールマガジンを購読して、貴社の取り組みに役立ててください。

無料メルマガ会員登録