アリババクラウドがAI画像生成モデル「通義万相」を発表、中国企業向けにβテスト提供

アリババクラウドは、最新のAI画像生成モデル「通義万相(Tongyi Wanxiang)」を、上海で開催中の「世界人工知能会議2023」で発表した。なお、この生成AIモデルは、現在中国の企業顧客向けにベータテストを提供している。

「通義万相」は、アリババクラウド独自の大型モデルであるComposerを使用して開発され、知識整理、視覚AI、自然言語処理を搭載しており、さまざまなタスクを処理することに優れている生成AIモデルだ。

中国語や英語のテキストプロンプトに応答し、水彩画、油彩画、中国画、アニメーション、スケッチ、フラットイラスト、3D漫画など、多様なスタイルの画像を生成する。

また、このモデルは、任意の画像を類似したスタイルの新しい画像に変換したり、スタイル転送によって画像をスタイリッシュに変化させたりすることが可能だ。

これにより、元の画像の内容を保持しながら、別の画像の視覚スタイルを適用することができる。

さらに、言語、視覚、音声領域にわたるAIタスクの達成を支援するために設計された汎用フレームワークである「ModelScopeGPT(モデルスコープGPT)」を発表した。

「ModelScope」は、アリババクラウドが昨年導入したオープンソースのモデル・アズ・ア・サービスプラットフォームであり、900以上のAIモデルを搭載している。

「ModelScopeGPT」は、LLMをコントローラとして使用し、ModelScopeオープンソースコミュニティ内の広範なドメイン固有のエキスパートモデルに接続する。

なお、アリババクラウドは、今年4月にLLM「通義千問」をリリースしており、アリババクラウドのインテリジェント・アシスタント「聴悟(Tingwu)」にも統合され、アシスタントがマルチメディアコンテンツを理解・分析できるようになっている。

アリババクラウド・インテリジェンスの最高技術責任者(CTO)の周 靖人(Jingren Zhou)氏は、「通義万相のリリースにより、高品質な生成AI画像がより身近になり、Eコマース、ゲーム、デザイン、広告など、幅広い分野で革新的なAIアートやクリエイティブな表現の開発が進むでしょう。

また、コンテストやその他のコミュニティイベントを開催することで、より多くの開発者や起業家と関わることができ、彼らのアイデアを実現し、生産性を向上し、産業の未来を変革し、より汎用性の高いAIツールの作成を促進したいと考えています。」と述べている。

無料メルマガ会員に登録しませんか?

膨大な記事を効率よくチェック!

IoTNEWSは、毎日10-20本の新着ニュースを公開しております。 また、デジタル社会に必要な視点を養う、DIGITIDEという特集コンテンツも毎日投稿しております。

そこで、週一回配信される、無料のメールマガジン会員になっていただくと、記事一覧やオリジナルコンテンツの情報が取得可能となります。

  • DXに関する最新ニュース
  • 曜日代わりのデジタル社会の潮流を知る『DIGITIDE』
  • 実践を重要視する方に聞く、インタビュー記事
  • 業務改革に必要なDX手法などDXノウハウ

など、多岐にわたるテーマが配信されております。

また、無料メルマガ会員になると、会員限定のコンテンツも読むことができます。

無料メールから、気になるテーマの記事だけをピックアップして読んでいただけます。 ぜひ、無料のメールマガジンを購読して、貴社の取り組みに役立ててください。

無料メルマガ会員登録