2023年4月は、生成系AIに関するニュースがたくさん発表された。「変化が早くてついていけない」という方も多いと思うので、ここに整理しておく。
1. イーロンマスク氏、TruthGPTを発表
イーロン・マスク氏は、「宇宙の本質を理解しようとする最大限の真実を追求するAIを始めるつもりだ」と述べ、これまでのAI反対の立場を覆すかのような発表を行った。
その一方で、6ヶ月間、AIの訓練を止める必要があると発表。
「機械が私たちの情報チャネルをプロパガンダや真実でないものであふれさせるべきだろうか?」
「全ての仕事を自動化すべきだろうか?」
「私たちに取って代わるかもしれない非人間的な心を開発する必要があるだろうか?」
「私たちの文明の制御を失う危険を冒すべきなのだろうか?」
という4つの問いを投げかけている。
すでに、TruthGPTのウェブサイトが立ち上がっているが、これはイーロン・マスク氏の立ち上げたものではないということで、注意が必要だ。
2. 画像生成AIアプリ「Microsoft Designer」が利用可能に
Designer is now readily available in preview! No more waitlist 🎉🎉
See how it can help you unleash your creative superpowers. Try it today: https://t.co/g2KLBpvLC5 #MicrosoftDesigner https://t.co/lBgDZt5iQV
— Microsoft Designer (@MSFT365Designer) April 27, 2023
最先端の画像生成AI「DALL-E 2」をベースとしたグラフィックスデザインアプリで、パワーポイントでスライドデザインを提供してくれる機能を切り出し、ウェブブラウザで使えるようにしたものだ。
自然言語を使って、さまざまなデザインを提案してくれる。
Canvaを使い慣れているユーザは、プロンプトが使えるようになったと考えればイメージしやすいかもしれない。
3. アマゾン、生成系AIアプリの構築を容易にする「Amazon Bedrock」を発表
このサービスは、AWSでさまざまなAIサービスを利用できるというものだ。
発表時点では、AI21 Labsの「Jurassic-2」ファミリー、Anthropicの「Claude」、Stability AIの「Stable Diffusion」、Amazonの「Titan」が含まれるということだ。
さすがに、OpenAIのGPTや、Google Bardを使える訳ではないようだが、今後どうなるかは不明。
開発環境を一変させる可能性ももつ、生成系AIをどう使いこなすのかが、大きな課題となってくる。
4. Adobe Fireflyにビデオ編集機能を追加
3/21にAdobeは、画像を編集するAIサービスを発表している。
公式サイトでは、例えば春の景色に対して、「雪景色に変えて欲しい」という入力をすると、景色が一変、雪景色になるというものだ。
そして、4月にはさらに動画編集に関するAIサービスも発表している。
こちらは、映像に対して自然言語入力により、音楽を追加する機能や、波の音を追加するなど環境音を追加する機能、さらには、朝の形式を夕方の景色に変換するといった機能、顔の部分だけ明るくして欲しいという編集や、テキスト入力、入力したテキストの加工など編集がかなり楽になりそうな機能が追加される。
さらに、ストーリーボードを生成してくれるツールなどもあり、自然言語の入力だけでプロ並みの動画が簡単に制作できるようになるため、動画制作が一変する可能性がある。
5. Meta、没入型VR環境を生成するAI「DINOv2」を発表
新しいAI、DINOv2は、一枚の画像だけで高精度な深度推定が可能となる。実際、任意の画像をアップロードするとその距離がわかるようになるので、画像から立体を起こすには必須となる技術だ。
また、人間が、空間上にある車や人を、「ここまでが車」「ここまでが人」と認識できるように、画像中の物体や領域を正確に識別しすることができる技術も公開されていて、DINOv2は初見の画像であっても、どこまでが物体の領域に入るのかを認識することができる。
さらに、多数の画像の中から特定の画像に似たものを抽出することもできる。何かの画像をみて、それに類似する画像はこれだ、ということを確からしさとともに表示することができるので、物体の認識が向上する。
こういった技術が開発されても、「いきなり、没入型VR環境を生成する」ということはできないわけだが、今回の発表によりその可能性がより高まった。
6. TikTokがAIアバターを発表
SNS界隈では、AIを使ったアバターの開発が盛んだ。
すでに、Snapchatには、アバターのAIチャットボットが提供されている。
ソーシャルメディアの専門家であるMatt Navarra氏によると、TikTokもAIアバターを開発していて、自分の写真を3~10枚送信し、アバターのスタイルを5種類まで選ぶと画像が生成される。それをダウンロードして、プロフィールに設定したり、TikTokの「ストーリーズ」でシェアしたりできるということだ。
日本でも、今年1月にSNOWを使ってAIアバターで生成した映像を、プロフィール画像に貼る人が続出したが、この流れは一定の需要がありそうだ。
7. Appleは、AIを活用したヘルスコーチングサービス「Quartz」を開発
最近のアップルは、ヘルスケア系の機能追加に熱心だが、今回は、コーチングサービスを開発しているということだ。
Apple Watchで取得できるデータに基づいた、パーソナライズされたコーチングプログラムを開発していて、運動、食習慣の改善、睡寝の質を向上させることをユーザーに促すことを目指しているのだという。
おまけ Stability AI、大規模言語モデル「StableLM」を発表
映像を制作してくれる、「Stable Diffusion」で有名ない、Stablity AIが、ChatGPTの対抗馬となる、大規模言語モデル「StableLM」を発表した。
まだまだ発展途上ということだが、なぜこぞって言語モデルを作るのだろうか。
それは、生成系AI全体に対して言えることとして、自然言語を前提に、プログラムを書いてくれたり、映像を作ってくれたり、音楽を作ってくれたり・・・なにかしてくれる、というものだからだろう。
現状、OpenAIのChatGPTがかなり使い勝手もよい状態とも言えるが、毎日のように新しい技術や発表が行われる生成系AIの世界では、まだ勝敗が決まった訳ではない。
IoTNEWSとしても、どの生成系AIでどんなことができるのか、について調査し、情報を公開していきたい。
無料メルマガ会員に登録しませんか?
IoTNEWS代表
1973年生まれ。株式会社アールジーン代表取締役。
フジテレビ Live News α コメンテーター。J-WAVE TOKYO MORNING RADIO 記事解説。など。
大阪大学でニューロコンピューティングを学び、アクセンチュアなどのグローバルコンサルティングファームより現職。
著書に、「2時間でわかる図解IoTビジネス入門(あさ出版)」「顧客ともっとつながる(日経BP)」、YouTubeチャンネルに「小泉耕二の未来大学」がある。