rinna、日英バイリンガルの大規模言語モデルをオープンソースで公開

企業:

rinna株式会社は、日本語と英語のバイリンガル大規模言語モデルを開発し、商用利用可能なライセンスでオープンソースとして公開したことを発表した。

今回発表された汎用言語モデルは、約40億パラメータを持つ日本語と英語のバイリンガルGPTであり、日本語と英語のテキスト生成ができる。

学習データには、オープンデータセットを用いており、透明性が高いモデルとなっている。学習データの割合は英語56%、日本語33%、ソースコード11%だ。

また、利用目的に合わせて追加学習することにより、モデルをカスタマイズすることが可能。日英バイリンガルモデルであるため、追加学習にはデータが充実している英語のデータセットを利用することもできる。

なお、40億パラメータは、LLMとしては少量のパラメータ数であるため、推論や追加学習(QLoRA等)を一般コンシューマ向けGPUでも実行することができる。

さらに、対話形式のテキストを生成する「対話言語モデル」、テキストと画像のマルチモーダル入力を実現する「画像対話モデル」、長いテキストの入力を可能とする「長期コンテキスト言語モデル」も開発し、公開した。

「対話言語モデル」は、汎用言語モデルに対して、対話形式でユーザの指示に応えているデータを用いてSFT追加学習をしており、対話形式のテキスト生成を行うことができる。

対話言語モデルの出力例(緑がユーザ入力、白がモデル出力)

「画像対話モデル」は、汎用言語モデルとBLIP-2を組み合わせた追加学習により、テキストと画像のマルチモーダル入力からのテキスト生成を実現している。

画像対話モデルの出力例(画像とオレンジがユーザー入力、グレーがモデル出力)

「長期コンテキストモデル」は、汎用言語モデルに対して、長いテキスト入力を可能とするための追加学習を行っており、入力トークンの上限を2048から8192トークンまで拡大している。

これら事前学習済みのモデルは、Hugging Faceに商用利用可能なMITライセンスで公開されており、オープンソースモデルであるため、ダウンロードすればローカル環境で実行することが可能だ。

今後は、今回開発したモデルの大規模化や、画像入力のマルチモーダルモデルだけでなく、音声を入力とするマルチモーダルモデルについての研究・開発を行っていくとしている。

無料メルマガ会員に登録しませんか?

膨大な記事を効率よくチェック!

IoTNEWSは、毎日10-20本の新着ニュースを公開しております。 また、デジタル社会に必要な視点を養う、DIGITIDEという特集コンテンツも毎日投稿しております。

そこで、週一回配信される、無料のメールマガジン会員になっていただくと、記事一覧やオリジナルコンテンツの情報が取得可能となります。

  • DXに関する最新ニュース
  • 曜日代わりのデジタル社会の潮流を知る『DIGITIDE』
  • 実践を重要視する方に聞く、インタビュー記事
  • 業務改革に必要なDX手法などDXノウハウ

など、多岐にわたるテーマが配信されております。

また、無料メルマガ会員になると、会員限定のコンテンツも読むことができます。

無料メールから、気になるテーマの記事だけをピックアップして読んでいただけます。 ぜひ、無料のメールマガジンを購読して、貴社の取り組みに役立ててください。

無料メルマガ会員登録
モバイルバージョンを終了