サイトアイコン IoTNEWS

OpenAI GPT-4oを発表 ヒトがスマホの向こうにいる感覚で会話が実現可能に

GPT 4o発表

OpenAIは13日、新型AIとなる「GPT-4o(フォーオー)」を発表した。

発表の場で、OpenAIのミラ・ムアティCTOは、「これまでAIモデルの知能を高めることに注力してきたが、使いやすさで大きな前進を遂げた」と述べた。

では、どんな進化をしたのだろう。

まず、特出すべきは、従来のGPT4と比べて2倍の処理速度を実現し、運用コストは半分となったことだ。

これまでもテキストだけでなく、映像や音声といったさまざまなデータに対して対話を行なってきていたが、日常会話のパートナーと呼ぶには遅いなと感じるシーンも多かった。

今回の発表では、こう言った点が解消され、かなり高速になり、日常会話をしているような錯覚を覚えるレベルになっている。

驚きのデモの数々

GPT-4oは、日本語を含む50の言語に対応していて、デモでは、イタリア語と英語の通訳を買って出たが、英語で話しかけるとすぐにイタリア語に翻訳し、イタリア語で返答するとすぐに英語に翻訳するという技を見せた。

さらに、物語をシーンに合わせたいろんな抑揚で読んだり、歌いながら読むといったことも実現していた。

手書きの文字を認識しながら、数学の問題の解き方を教えてくれたり、「I ♡ ChatGPT」と書いた紙を見せると、少し照れくさそうにありがとうというような場面も見れ、本当にスマホの向こうには女性がいるのではないかと錯覚されるレベルのデモだった。

また、グラフの読み取り機能も向上していて、グラフがどういうことを表しているか、特徴となるポイントについても指摘してくれるので、今後さまざまなデータに対する会話もできそうだ。

マルチモーダル化の進化

今回の発表は、一言でいうと、マルチモーダル化の進化だといえる。

GoogleのGmeini 1.5Pro、アンソロピックのClaude 3、メタのLlama 3など、さまざまなAIが登場する中、OpenAIも先日動画生成ができるSoraが発表され話題になっていた。

今後生成AIの発展に、ますます、目が離せない。

モバイルバージョンを終了