Googleは、Android端末上でユーザの日常的なタスクを先回りして処理し、自動化する新たなAI機能群「Gemini Intelligence」を発表した。
「Gemini Intelligence」は、デバイス上のハードウェアおよびソフトウェアと統合され、ユーザの指示に基づいて各種操作を代行するプロアクティブな機能群だ。
最大の特徴は、複数のアプリを横断したマルチステップタスクの自動化と、画面上のリストや画像を読み取り、その視覚情報を元に即座に必要なアクションを起こすことが可能な点だ。
例えば、メモアプリに長い買い物リストがある場合、リストの上で電源ボタンを長押ししてGeminiに指示することで、全ての商品を配達用のショッピングカートに自動で追加できる。
これにより、ユーザがアプリ間を手動で行き来してデータをコピーする手間を大幅に省くことができる。
加えて、ウェブブラウザ「Chrome」における機能も強化され、AIがウェブ上のコンテンツの要約や比較を行うほか、ユーザの関連情報を活用してモバイル画面での複雑なフォーム入力を自動的に完了させる機能が実装された。
さらに、新たな音声入力機能「Rambler」が導入された。
これは、人が自然に話す際の「えーっと」などの言い淀みを自動で取り除き、要点を整理して洗練されたテキストメッセージへと変換する機能である。
多言語が混在する音声であっても文脈やニュアンスを理解し、一つの自然な文章にまとめることができる。
その他、自然言語で用途を説明することで、必要な情報だけを表示するカスタムウィジェットを自動生成する機能も備えているとのことだ。
なお「Gemini Intelligence」は、今夏に最新のSamsung GalaxyおよびGoogle Pixelスマートフォン向けに段階的に提供が開始され、年内にはスマートウォッチやノートPC、自動車など幅広いAndroidデバイスへと展開される予定だ。
無料メルマガ会員に登録しませんか?

IoTに関する様々な情報を取材し、皆様にお届けいたします。
