OpenAIは13日、新型AIとなる「GPT-4o(フォーオー)」を発表した。
発表の場で、OpenAIのミラ・ムアティCTOは、「これまでAIモデルの知能を高めることに注力してきたが、使いやすさで大きな前進を遂げた」と述べた。
では、どんな進化をしたのだろう。
まず、特出すべきは、従来のGPT4と比べて2倍の処理速度を実現し、運用コストは半分となったことだ。
これまでもテキストだけでなく、映像や音声といったさまざまなデータに対して対話を行なってきていたが、日常会話のパートナーと呼ぶには遅いなと感じるシーンも多かった。
今回の発表では、こう言った点が解消され、かなり高速になり、日常会話をしているような錯覚を覚えるレベルになっている。
驚きのデモの数々
GPT-4oは、日本語を含む50の言語に対応していて、デモでは、イタリア語と英語の通訳を買って出たが、英語で話しかけるとすぐにイタリア語に翻訳し、イタリア語で返答するとすぐに英語に翻訳するという技を見せた。
さらに、物語をシーンに合わせたいろんな抑揚で読んだり、歌いながら読むといったことも実現していた。
手書きの文字を認識しながら、数学の問題の解き方を教えてくれたり、「I ♡ ChatGPT」と書いた紙を見せると、少し照れくさそうにありがとうというような場面も見れ、本当にスマホの向こうには女性がいるのではないかと錯覚されるレベルのデモだった。
また、グラフの読み取り機能も向上していて、グラフがどういうことを表しているか、特徴となるポイントについても指摘してくれるので、今後さまざまなデータに対する会話もできそうだ。
マルチモーダル化の進化
今回の発表は、一言でいうと、マルチモーダル化の進化だといえる。
GoogleのGmeini 1.5Pro、アンソロピックのClaude 3、メタのLlama 3など、さまざまなAIが登場する中、OpenAIも先日動画生成ができるSoraが発表され話題になっていた。
今後生成AIの発展に、ますます、目が離せない。
無料メルマガ会員に登録しませんか?

IoTNEWS代表
1973年生まれ。株式会社アールジーン代表取締役。
フジテレビ Live News α コメンテーター。J-WAVE TOKYO MORNING RADIO 記事解説。など。
大阪大学でニューロコンピューティングを学び、アクセンチュアなどのグローバルコンサルティングファームより現職。
著書に、「2時間でわかる図解IoTビジネス入門(あさ出版)」「顧客ともっとつながる(日経BP)」、YouTubeチャンネルに「小泉耕二の未来大学」がある。