マイクロソフトのエバンジェリストから、旧LINE株式会社でAIアシスタント「LINE CLOVA」をはじめとするAI技術の企画・開発を手掛け、さらに同社でAIカンパニーのCEOを務めていた砂金信一郎(いさご・しんいちろう)氏が、ソフトバンク株式会社の子会社であるGen-AX(ジェナックス)株式会社の代表取締役社長 CEOに就任した。
Gen-AXは今後、生成AIを活用したSaaS事業や専門コンサルティングサービスなどを展開するとのことだが、Gen-AXの代表に就任した経緯、そして、砂金氏が見るAIの現在の到達点や今後の可能性などについて伺った。(聞き手:IoTNEWS代表小泉耕二)
キャリアの集大成、ビジネスの現場で活用される自律的なAI実現へ
小泉: はじめに、Gen-AXではどのような事業を展開していくのかについて教えてください。
砂金: 大きく言うと、生成AIを活用してB2B向けに業務改革を行う企業です。
そのひとつとして、現在ソフトバンクとマイクロソフトが共同で開発しているシステムをベースに、Gen-AXが外部企業のニーズにあわせたシステムを開発し、提供します。
一例として、コールセンタでのユースケースをもとに説明します。
これまでのコールセンタ向けのAIは、シナリオを事前に定義した上で、利用者の選択に対して答えを提示するというものでした。
また、テキストベースでのAIチャットが登場したことで、電話からチャットでのやり取りへと移行されるかと思っていたのですが、電話というチャネルはなくならず、各チャネルに対してAIが使用されているという状況です。
こうした中、昨今の生成AI技術よって、マルチモーダル(※)処理もできるようになってきました。そこで、テキストチャットや電話といった、複数のチャネルでのやりとりを繋いで、自律的に考えて答えを出してくれるソリューションを実現すべく、開発を進めているところです。
※マルチモーダル:テキスト、画像、音声、動画など、複数の異なるデータを統合して処理する技術。
例えば、スマートフォンに関する質問に答えてくれるAIに、カメラの操作方法など簡単な質問の答えを学習させておくことは比較的容易ですが、通信回線のプランやキャリアを変えたいといった、膨大なシナリオが考えられるケースにおいては大量の学習が必要となり、現実的ではありません。
そこで、膨大なデータを元に学習をすすめるのではなく、一旦「AIに考えさせる」取り組みをしています。
現状、様々なタスクをこなせる自律的なAIのプロトタイプを作り始めていて、ある処理に対して、どのようなタスクを実行したらよいかを、AIに考えさせています。
そして、考えたタスクを実行するために必要な情報を、AIとコミュニケーションをとりながら収集し、最終的にRAG(※1)のような形で答えを出すか、必要な手続きをfunction calling(※2)経由で呼び出す、といった流れを作ろうとしています。
※1 RAG(Retrieval-Augmented Generation):ユーザの質問に関連するドキュメントをデータベースから検索し、検索した複数の情報を組み合わせてユーザの質問に回答する技術
※2 function calling:LLMが事前学習済みの知識で回答するのではなく、解決に必要な外部ツールを呼び出すための仕組み
こうしたルールをアプリケーションロジックとして細かく定義せず、できる限りプロンプト指示だけで完結できるAIに育てようと、現在開発を進めているところです。
小泉: コールセンタにかかってきた電話やチャットに書かれた内容から、AIが何を答えるべきかについて、AI自体に模索させるわけですね。
興味深い取り組みをされているなと思う一方で、とてもチャレンジングな取り組みだとも感じます。
こうした取り組みを実現する上では、Gen-AXという事業会社を新たに設立した方が良かったのでしょうか?
例えばソフトバンクの社内でR&D(研究開発)として取り組んだ方が、すぐに採算を取らなければならないというプレッシャーがなくなり、思い描くものを結果的に早く実現できるのではないかとも感じたのですが。
砂金: Gen-AXの設立理由に関しては、話が少し遡ります。
もともと私が、旧LINE株式会社のAIカンパニーCEOを務め、AIアシスタント「LINE CLOVA」をはじめとするAI技術の企画や開発をしていた頃、音声認識や当時の言語処理技術を活用して、B2Bの事業を展開しようとしていました。
LINEヤフー株式会社(旧LINE株式会社らのグループ内再編を経て発足)の関係会社である韓国のNAVER Cloudは既にB2B事業を展開していて、そこに「LINE CLOVA」チームや翻訳のチームなどが集まり、B2B事業を集約してゆこうという考えがあったのです。
一方、日本では、法人向けのチャットツールである「LINE WORKS」に、「LINE CLOVA」の要素技術を応用して、文字起こしや自動要約などのAIの機能を入れていくという構想が生まれ、私は「LINE CLOVA」の事業を当時のLINEから分社化し、「LINE WORKS」に統合するという取り組みを行なうこととなりました。
こうした中、世の中ではChat GPTをはじめとする生成AIブームが到来し、市場環境やステークホルダーの認識など、様々な前提条件が変わっていきました。
この頃、ソフトバンクは様々な角度でAIへの取り組みを公表していて、「グループ全体として良い形で進めていくにはどうしたらよいか」と議論を重ねる中で、LINEヤフーや、その他のグループ会社のAIメンバーがソフトバンク側の取り組みに参画するのがよい、という話が立ち上がりました。
ソフトバンクはまず、生成AIの基盤モデルを作り始めることが重要という判断のもと、LLMの研究開発を行うSB Intuitions株式会社を設立し、そこにLINEヤフーや他のグループ会社のAIエンジニアも参画し、モデルを作り始めることになりました。
一方、モデルの構築には時間がかかります。モデルを作ったからと言ってビジネスとして成り立つかは別問題で、おっしゃる通り儲けなければなりません。
そこでGen-AXでは、SB Intuitionsや、その他のLLMも活用しながら、生成AI技術を応用したB2Bプロダクトを開発してゆく役割を果たします。
このような経緯もあるので、B2Bプロダクトといっても、Gen-AXが開発してゆくプロダクトは、チャットツールを提供してきた「LINEらしさ」や、検索エンジンである「ヤフーらしさ」などで得たノウハウを生かしながら、生成AIを一過性のブームで終わらせず、業務に深く浸透して継続的に使われるものにしてゆきたいと考えています。
ChatGPTが爆発的にヒットした理由の一つは、チャット形式で少しずつカタカタと言葉を紡いでいるようなUI(ユーザーインターフェイス)により、チャットでありながら人と対話しているようなUX(ユーザーエクスペリエンス)を提案した点にあると考えています。生成AIの欠点である応答速度の問題をうまく隠して利点に変える秀逸なUX設計ですね。
ChatGPTに限らず、生成AI時代には、新しいUXが次々と発明されてゆくことになると思います。
その変化が起こりそうな領域のひとつが、冒頭にお話ししたコールセンタでの活用となります。
このコールセンタ向けソリューションの開発においては、マイクロソフトとソフトバンクが共同で開発するソフトバンク社内利用向けシステムをベースに、Gen-AXが外部のお客様向けにソリューションとして販売できるSaaSプロダクトにしたうえで、販売していこうとしています。つまり、共同開発したものを外販する部分に関しては、Gen-AXが行うという建て付けです。
個人的には、昔からB2Bで活用される、自律的なAIを構築したいと思っていました。
そうした中、ソフトバンクの実証フィールドを活用しながら、私の古巣であるマイクロソフトの協力を得ることができる。加えて、LINE時代の経験や生成AIというベーシックな技術が出てきたことにより、昔から構想していた「自律的なAIの実現」へ向けた環境が整ったと思っています。
よく「起業をしないのですか」とか「AIモデルを開発している有名企業に行かないのですか」と聞かれるのですが、会社の代表になりたいわけでも、モデルを追求して開発したいわけでもありません。
プロトタイプを作ったけど、評価をしたらプロジェクトが終了してしまうようなものではなく、ビジネスの現場で活用される、自律的なAIを世の中に浸透させていきたいという想いがあります。
これを実現するために、現状考えられる最適な方法を選択した結果、今の形になりました。

AIで業務改革までを実現
小泉: 砂金さんが実現されたい「自律的なAI」について、もう少し詳しく教えてください。
まず、AI自身が問いを立てて、業務の中まで入り込んでデータを探しにいき、背景を加味した上で求められている答えを出すということであれば、今世の中で展開されているChatGPTを活用したB2B向けのサービスとは全く別のものですよね。
例えばマイクロソフトのクラウドサービスAzureでは、ChatGPTを活用することができますが、基本的に自然言語対話のところしか使っていない。結局、中のデータを検索するには、データを整理して答えを出す必要がありますが、それは業務システムとしてAzureの中でソフトウエアを実装していると思います。
なので、その先の自律性までも実現しようと思うと、アルゴリズムの部分をAIで実装しなければならないと感じるのですが、そこまで踏み込まれようとしているのでしょうか。
砂金: まずやることとしては、「電話」「チャット」といった、エンドユーザに対するインターフェースと、RAGの一部として使われるベクトルデータベース検索(※)の構築です。
※ベクトルデータベース:画像やテキスト、センサデータなどの非構造化データや半構造化データをベクトルに変換し、検索・照合するためのデータベース。
また、学習済みのモデルに追加してデータを学習させるファインチューニングに必要なデータを収集する必要もあります。
この一連の流れを、AIを導入する企業とともに進めなければ、プロンプトを工夫してChat GPTを活用している業務から一向に進歩することができません。
現状、生成AIを活用した一般的なサービスでは、LLM自体がGPT4やClaudeなどの既製品LLMをそのままAPIで呼び出しているのですが、ここはオープンなモデルでも構いません。
チューニング手段が限られる既製品的なLLMを活用する上では、具体的な業務ロジックをモデル自体に学習させることは今のところ困難で、プロンプトで対応せざるを得ない状況です。
結果、複雑なロジックを必要とする領域で生成AIを精度高く活用することは難しいと考えられています。ただ、自由度の高いオープンなモデルも含めて適切な手段を考えてゆけば、「そんなことはないだろう」と我々は思います。
学習に必要なデータが、品質を保ちながら必要な分量集まるのなら、追加学習や強化学習が可能です。なので、早めに実際のコミュニケーションデータを集めることが重要になります。
そのために、Chat GPTのようなUIで収集する方法もあるかもしれませんが、実際の回答すべきデータを学習するという点においては、業務システム側に必要なUIを組み込むことが一定必要だと考えています。
具体的な例をひとつあげてみます。外部からのメールやフォームなどでの問い合わせに対する回答を、過去の対応履歴や業務マニュアルを参照しながら、回答文を作成する照会応答業務を考えてみることにします。
回答文を直接雑に生成しようとすると、ハルシネーションの問題以前にうまくいかないことは自明になりつつありますが、中間段階として行われる検索においても、専門的な業務知識にもとづく正確性や精度が非常に重要です。
ベクトル検索を利用することで、キーワードマッチより柔軟に、意味合いを考慮した検索が可能になるのですが、精度を継続的に高めてゆくためには、AIやITの専門家ではなく、業務をわかっている人が見て、AIが的確な検索結果を出しているかどうかを判定し、改善プロセスをまわしてゆく必要があります。
この一連の業務をAI化することは、一見簡単そうではあるのですが、サービス構築直後だけでなく、継続的に改善プロセスをまわしてゆくというところが、非常に難しいです。
そこで我々が目指しているのは、クライアント企業が「現場で日常的な業務をしているだけで、自然に学習に必要なデータを集めることができるUI・UXを構築する」ことです。
データ収集の手法を、現場の皆さんが日々の業務の中で活用されているインターフェースの中に自然と浸透させることができれば、「使えば使うほど賢くなるAIが作れる」と思っていただけるはずです。
こういうAIを作るためには、完成されたSaaSを提供して終わり、ということではなく、お客様に伴走していく必要があります。
さらに、データが集まりきって、ある程度業務を自動化することができれば、業務変革も実現できます。我々としては、AIで業務改革までができるよう体制を整えていくつもりです。
小泉: まず前提として、AIは万能であるという認識は捨てた方がいいということですね。
その上で、AIを業務に活かすにしても、ありものの文章を参照させて検索エンジンの延長上にあるものを賢くやっているように見せかけるのではなく、きちんとデータの中まで見て、どういうデータの在り方であればその問いに答えられるのかということまで考えられるAIを目指されている。
つまりそれは、人間の代わりを作っているように聞こえるのですが(笑)
業務特化型AIで、自律エージェントが生まれる未来
砂金: 人間の代わりになるAIはいつか辿り着きたいですが、まずは、「自律エージェント」に到達したいと思っています。
エージェントシステムに自律性を持たせるためには、あるナレッジにおいて、ちゃんと動いているという状態に加え、先ほども述べた通り、使えば使うほど知識が増えて賢くなるループが回る状態を構築し、AIに自律的に賢くなってもらう必要があります。
これを、汎用AIの中で語るのではなく、人間がやると工数がかかって大変だと思われている業務において、「業務特化型のAI」が自律的に自動化してくれる状態を想定しています。
その自律性は、60点くらいからはじまるかもしれませんが、業務を進める中で70点、80点と自動化できる範囲を広げていく。そして100点になれば、完全に自動化できるねといって手離れしていく道筋を描いています。
小泉: すごく大人な話ですね。
昨今の生成AIブームを見ると、「なんとなくAIがすごそうだ」という意識で導入して、結局大して使われずに「AIいまいちだった」という印象で終わってしまう。それはすごくもったいないことだと思います。
マイクロソフトがAzureを売るときも、Windowsが活用されていたという前提はあるものの、地道に現場に入って導入していたように、真面目に仕事を改善したり向上させたりしようとしている企業に適切に活用してもらうことが重要ですね。
砂金: そうですね。AIがいまいちだったという印象で終わってしまうことは、本当に避けたいと思っています。
現状の、「とりあえず社内でChatGPTを使ってみよう」という取り組みは、お試し期間としては重要なことですし、「なんかよくわからないけど良くなりそう」という淡い期待のもとに裾野が広がることは、決して悪いことではないと思います。
ただ、その次のロードマップを描けていないケースが多いと思います。ですので、我々も初期導入のコンサルティングというよりは、ロードマップづくりも伴走して行なっています。
AIは手段ですので、何ができるのかと聞かれたら答えられますが、現場にはどのような業務があって、どこを自動化すると効率化するのか、競争力を高められるのかといったことを企業ごとに考えることが重要なのです。
そのためには、現場の方々と話すことが、答えに近づく近道だと考えています。
完全無欠なAIをすぐに作ることはできませんが、今70点のものを80点にするために、共に考えて努力していくことはできます。
そして、この精度を上げていくという部分は、現在誰しもが苦労しているポイントでもあります。
現状、なんとなくRAGを導入しても、必要なチューニングやデータの前処理加工などができていなければ、精度は上がりません。
こういう現場を見ると、RAGを導入するというアプローチ自体は間違っていないけど、理解の解像度が足りないなと感じてしまいます。
目的のためには「何をどの順番でしなければいけないか」を理解することが重要です。
例えば、「まずはデータの加工をきちんとやろう」という話かもしれないし、「少しパラメータを変えよう」ということかもしれない。こうしたことを解像度高く、丁寧にやっていくほかないと思っています。
業務システムにAIを組み込むための障壁と解決策
小泉: 業務システムに関わってくる話となると、導入する企業はどうしても試しながら構築していく必要があると思うのですが、具体的にどのように進めているのでしょうか。
砂金: PoCの進め方は色々なケースがあります。
例えば、「まずはデータ収集に集中して取り組む」と決めたとしたら、データ収集のための専用のUIを作り込みます。今あるシステムの中にボタンを一個追加したりするだけの場合もありますから、この程度であれば変更の範囲としては許容されるものだと思います。
これまで通り業務システムを活用して日常業務を行いながらも、新たなボタンが増えるなど、少しだけ現場の手間を増やす。これが、各現場においてどこまで許容されるかを図りながら、少しずつデータ収集のためのUIを増やしたり、変更したりして、データの収集を進めます。
こうしたデータ収集が入口だとして、完全自律型エージェントによる回答が出口だとすると、その過程に一定の「ガードレール」が必要となります。
もし、現時点でもAIの性能がそれなりに良ければ、AIが怪しいことを出力しそうになった時、AI自身が踏みとどまってアラートを出して自律的に改善してくれるかもしれません。しかし、はじめからそこまで賢くするのは難しいと思います。
そこで、一定AIに任せて出力させる一方で、その業務に詳しい人間が「最後の非常ブレーキ」を持った状態を一定期間設けます。
例えば車の自動運転を想像してもらうとわかりやすいのですが、基本は自動運転に任せ、非常の際は人間の運転に切り替えるというイメージです。
こうしていくことで、「人よりもAIに任せておいた方が安全だ」という時代も来るかもしれませんが、現状では、法律も業務ルールも人が判断することを前提にしているので、ブレーキやハンドルは人が持っている状態にした方が良いと思います。
AIが賢くなっていった後は、完全にAIに任せるタイミングを見極めていく、というアプローチを考えています。
小泉: このAIに任せるタイミングの見極めはどのように行うのでしょうか。
砂金: 業務知識を学習するAIの完成度を図るためには、LLMOpsをまわして学習データを貯めながら改善してゆく必要があります。
実は、この「学習データ」が鬼門で、とにかく大量のデータがあれば良いということではなく、クオリティが高いことが大切です。
業務を効率化・自動化するためのAIにおいては、LLMをゼロから作るデータセットとは異なり、業務観点で意味あるラベルのついたデータが重要です。
ただし、履歴データは取扱要注意です。
例えばコールセンタ向けのAIであれば、会話の応答の丁寧さや確からしさの精度を上げるために、会話の履歴データを使うことが有効な場面もありますが、人間同士、または人間とAIの間のリアルな会話の中には、プライバシーや機微情報にかかわる発言が含まれてしまうリスクがあるため、そのままの状態で積極的に学習に利用するわけにはいきません。
可能な限りのマスキングを、ツールだけに頼らず手間暇かけて施すか、あるいは、直接学習には利用しないけれども、テストやQAで利用するといった配慮が求められます。
つまり、何を最適化させるかを決め、こういうデータがこれくらいのボリューム必要だということを知る。そして、データがあるなら提供してください、ないなら一緒に作りましょうという話になります。
こうして必要なデータを積み重ねて蓄積していくことで、最終的に判断を適切に行えるAIが生まれるのだと考えています。
AIだからこそ生み出せる価値の可能性
小泉: 砂金さんがおっしゃる「自律的なAI」が実現されれば、新たな価値を生み出すことができそうですね。
例えばサプライチェーンにおいて、いつも船便で運んでいる部品を、サイズが小さいから飛行機で運ぼうというアイディアは、日常業務をしていると出てきません。船で運ぶことが当たり前の業務になっていますし、一回あたりの輸送コストは船の方が安いからです。
でも、「船と飛行機の物量と早さとコスト」「部品が早く届いた場合の工場の体制と生産性」など、パラメータが多く人間では測るのが難しい複雑な業務プロセスについてAIがプランを考え、結果的にどれくらいの貢献度の差があるのかなどを加味したアイディアを提案してくれる可能性がありますよね。
ビジネスの現場では、人間が決める重み付けが微妙に絡み合って、最終的な意思決定がされると思うのですが、製品データや設計データ、製造処理に必要なデータや社内データなどを横断的に見た結果「こんな提案があるよ」と、人では思いつけない結果を出してくれる可能性を感じました。
砂金: おっしゃる通りです。今は、人間が判断することが正しいというパラダイムですが、AIが人間よりちょっと良い提案ができる可能性はあると思います。
そして、そうしたAIは、汎用的な仕組みの中で生まれてくるものではなく、「業務知識をしっかりと持った状態のAI」でなければ生み出せません。
我々としては、業務知識を持ったAIにできるだけ考えてもらえる環境を整えて、AIが出した結果に対して、人が「良い」「悪い」と判断していけるようにする。
こうしたプロセスを踏んでいけるよう、製造業や金融業など、各業界に向けたバーティカル(垂直)特化の専用アプリケーションのようなものを、お客様と一緒に作っていこうと考えています。
「事業を組み立てる人」「AIを作る人」「AI」三方の橋渡しをする
小泉: 最後に、これまで長年AIの開発や事業に取り組まれてきた砂金さんの、振り返りとこれからについて教えてください。
砂金: 私は、事業を組み立てる人と、AIを作る人の橋渡しができる存在だと思っています。
例えば、事業側の人が、ある業務のKPIを3ポイント上げたいとした場合に、AIのモデラーやリサーチャーに「このベクトル検索のこの指標で測った時の正答率を5%上げてほしい」というふうに、改善のタスクを落とし込んで具体的に話をすることができます。
このような橋渡しをすることで、事業側は目的に適したモデルを作ることができ、AI開発者側もPoCで終わらないプロダクトを作ることができます。
私やGen-AXのメンバーは、AIを手段として活用し、目指しているUXに落とし込んだり、業務効率化につなげたりすることで、業務改革を一緒に手伝うことができる存在だと思っています。
小泉: AIと従来のシステムの大きく違うところは、買って導入したら終わりというわけにはいかないところなので、橋渡しをする人はいなくてはならない存在ですね。
砂金: そうですね。AIは良くも悪くも手離れが悪い(笑)
ですので、AIも人のように扱うことが重要だと思っています。
人の場合は、新卒であれ中途であれ、採用したらトレーニングやワークショップ、食事会など、パフォーマンスを発揮できる環境を整えますよね。
AIに対しても、例えばラベル付けされたデータを用意してあげるといったように、人と同じように仕事の環境を整えてあげることが大切です。
日本人はAIにキャラクター性を持たせて可愛がることができる文化を持っていると思うので、AIが無機質なものと捉えるのではなく、「より良いアウトプットを出してもらうためには何をしてあげれば良いだろう」とAIに対して考えてあげることが重要だと考えています。
そうしているうちに、どこかのタイミングでAI自身が完全に自律的に必要な情報を集め始めるタイミングが来るかもしれませんが、それはまだ先の話です。
そこで私たちは、事業を組み立てる人とAIを作る人、その間を橋渡しして、それぞれが能力を発揮できるお手伝いをしたいと思っています。
小泉: 本日は貴重なお話をありがとうございました。
無料メルマガ会員に登録しませんか?

現在、デジタルをビジネスに取り込むことで生まれる価値について研究中。IoTに関する様々な情報を取材し、皆様にお届けいたします。