アリババクラウドは、最新のAI画像生成モデル「通義万相(Tongyi Wanxiang)」を、上海で開催中の「世界人工知能会議2023」で発表した。なお、この生成AIモデルは、現在中国の企業顧客向けにベータテストを提供している。
「通義万相」は、アリババクラウド独自の大型モデルであるComposerを使用して開発され、知識整理、視覚AI、自然言語処理を搭載しており、さまざまなタスクを処理することに優れている生成AIモデルだ。
中国語や英語のテキストプロンプトに応答し、水彩画、油彩画、中国画、アニメーション、スケッチ、フラットイラスト、3D漫画など、多様なスタイルの画像を生成する。
また、このモデルは、任意の画像を類似したスタイルの新しい画像に変換したり、スタイル転送によって画像をスタイリッシュに変化させたりすることが可能だ。
これにより、元の画像の内容を保持しながら、別の画像の視覚スタイルを適用することができる。
さらに、言語、視覚、音声領域にわたるAIタスクの達成を支援するために設計された汎用フレームワークである「ModelScopeGPT(モデルスコープGPT)」を発表した。
「ModelScope」は、アリババクラウドが昨年導入したオープンソースのモデル・アズ・ア・サービスプラットフォームであり、900以上のAIモデルを搭載している。
「ModelScopeGPT」は、LLMをコントローラとして使用し、ModelScopeオープンソースコミュニティ内の広範なドメイン固有のエキスパートモデルに接続する。
なお、アリババクラウドは、今年4月にLLM「通義千問」をリリースしており、アリババクラウドのインテリジェント・アシスタント「聴悟(Tingwu)」にも統合され、アシスタントがマルチメディアコンテンツを理解・分析できるようになっている。
アリババクラウド・インテリジェンスの最高技術責任者(CTO)の周 靖人(Jingren Zhou)氏は、「通義万相のリリースにより、高品質な生成AI画像がより身近になり、Eコマース、ゲーム、デザイン、広告など、幅広い分野で革新的なAIアートやクリエイティブな表現の開発が進むでしょう。
また、コンテストやその他のコミュニティイベントを開催することで、より多くの開発者や起業家と関わることができ、彼らのアイデアを実現し、生産性を向上し、産業の未来を変革し、より汎用性の高いAIツールの作成を促進したいと考えています。」と述べている。
無料メルマガ会員に登録しませんか?

IoTに関する様々な情報を取材し、皆様にお届けいたします。