顧客アンケートは、顧客からのフィードバックを定量・定性的に把握し、サービスの改善や新たな価値の創造につなげるための重要な業務です。
しかし現実には、多くの企業でアンケート運用は時間と労力のかかる属人的な業務になっています。
例えば、「設問を毎回ゼロから作成しており、設計に時間がかかる」「回答率が低く、データの偏りが発生する」「自由記述の分析に時間がかかり、改善に活かしきれない」「担当者が変わると運用が止まってしまう」といった課題が挙げられます。
特に、顧客接点が長期的な取引を伴う業界では、「納品後の満足度」「技術サポート評価」「次期提案への要望」などを定期的に把握する必要がある一方、アンケート結果を分析して改善につなげるまでに数週間から1か月以上かかるケースも少なくありません。
そこで本記事では、まず「顧客アンケートにおける主な課題」を整理した上で、生成AIを活用することでどのようにそれらを解決できるのかを解説します。
さらに、実際に生成AIを使ってアンケートの設問設計・分析を行った結果を紹介しながら、現場での活用イメージと限界点を検証します。
顧客アンケートにおける課題
顧客アンケートは、単なる「調査」ではなく、「設計→配信→回収→集計→分析→改善提案→報告」という複数のステップから成る一連の改善プロセスです。
この流れのどこか一つでも滞ると、結果的にアンケートは「取っただけで終わる施策」になってしまいます。
企業がこのプロセス全体を運用するうえで直面する主な課題は、以下の二つが挙げられます。
設問設計の難しさ
一つ目は、「何を」「どう聞くか」という設問設計の難しさです。
調査の目的が曖昧なまま質問を作成すると、集まったデータが目的に貢献しない、または肝心な要因を聞き逃すことになります。
例えば、「製品に満足していますか?」と聞いても、「サポート」や「価格」など、真の離脱原因となる要素の評価が抜け落ちてしまう可能性があります。
その結果、「何が問題で、何を改善すべきか」が判断できず、調査が無駄に終わってしまいます。
また、質問文が回答者に異なる解釈をさせる曖昧な言葉を含んでいたり、企業が望む方向へ回答を誘導する表現をしていたりするケースもあります。
例えば、サービスの利用頻度を把握したいのに、「当社のサービスをよく利用しますか?」という設問にしてしまうと、同じ評価を選択している人でも、回答者の解釈によって毎日であったり毎月であったりと、バラツキがうまれます。
この場合、客観的なデータが得られず、集計結果にバイアス(偏り)がかかり、誤った意思決定につながります。
他にも、選択肢が網羅的でない、または複数の選択肢が重複してどれを選ぶべきか迷ってしまう場合や、どの基準で評価すればよいのかがわかりにくい表形式の質問は、回答者を混乱させ、回答率の低下や真意とは異なる適当な回答を招くことになります。
自由記述分析の膨大な労力
二つ目は、自由記述回答の処理の壁です。
「5段階で評価してください」などの数値で定量的な評価を聞く設問は、集計は簡単ですが、全てを定量的な設問にしてしまうと、「なぜその点数をつけたのか」という理由が分からず、本質的な原因究明や具体的な改善策の策定が難しくなります。
そこで、数値データの「なぜ」を明らかにするために自由記述の設問が不可欠ですが、その分析こそがアンケート業務のボトルネックとなっています。
なぜなら、自由記述は顧客が自由に記述する回答のため、誤字脱字や表記の揺れ、「特になし」「わからない」などのノイズ、複数の話題の混在などが大量に発生します。
これらを人力で一つ一つ読み込み、修正し、ルールを適用して整理する作業(データクレンジング)だけでも、膨大な時間を要します。
また、構造化されていないテキストを意味のあるテーマやカテゴリーに分類する作業は、分析担当者の主観に左右されやすく、明確な定義付けが困難です。
さらに、最初の分類ルールを試行錯誤し、数千件のコメント全てに手作業でラベルを付与するコーディングをする必要があります。
データクレンジングが終わったとしても、インサイト抽出にも時間と労力がかかります。
例えば、あるサービスの機能に不満であるという回答が多いと分かっても、それが「どのくらい深刻か」「どのような感情が伴っているか」「どの層の顧客からの意見か」といった深い洞察(インサイト)を、手作業で大量のテキストから抽出するのは骨の折れる作業です。
担当者は膨大なコメントの中から、改善策に直結する重要なキーワードや事例、想定外の要望などを見つけ出すために多くの時間を費やし、結果として分析のリードタイムが長期化します。このリードタイムの長さが、改善アクションの遅れにつながってしまいます。
生成AIが注目される理由
前章で見たように、顧客アンケート業務には「設問設計の難しさ」「自由記述分析の膨大な労力」という壁が存在します。
これらはいずれも、「人の経験と時間に依存する」ことで発生している課題です。
生成AIが注目されるのは、この「属人的な判断と処理」を補完し、再現性のある仕組みに変えられる点にあります。
ここでは、生成AIが注目される理由を、前章で挙げた2つの課題と対比しながら見ていきます。
設問設計を再現可能な知識に変える
設問設計は、調査の目的・対象・シナリオを踏まえて、何をどのように聞くかを論理的に構成する作業です。
これまでは、担当者の経験や過去事例に基づく「暗黙知」に頼る部分が大きく、担当者が変わるたびに質問の品質や切り口がばらつくという課題がありました。
生成AIはこれをテンプレート化し、「目的」「対象」「評価軸」などを入力することで、短時間で初稿を生成できます。
さらに、ChatGPTやGeminiなどの生成AIは、インターネット上に公開されている過去のアンケート設問やリサーチ設計の文体・構造を含む膨大なテキストをもとに学習しているため、曖昧な表現を避け、回答者が理解しやすい自然な文体に自動調整してくれます。
また、複数パターンの質問文を比較生成することで、回答の偏りを抑え、より目的に合った設問を選定することも容易です。
つまり、設問設計における生成AIの役割は、人の経験をテンプレート化し、再現性とスピードを両立することにあります。
これにより、従来は数日を要していた設問設計が、わずか数十分で完成するケースも珍しくありません。
自由記述のテキスト分析を自動化できる
これまで最も時間がかかっていたのが、自由記述の読み込みと分類でした。
生成AIは自然言語処理モデルとして訓練されており、テキストから「感情(ポジティブ/ネガティブ)」「テーマ」「頻出語」などを抽出するのが得意です。
例えば、100件の自由回答を読み込ませれば、「感情別の比率」「改善要望で多く挙がるテーマ」「想定外の声」といったインサイトを自動で整理してくれます。
これにより、担当者は文章を読む時間を短縮し、「どう改善するか」という本質的な分析・提案に集中できるようになります。
さらに、自由記述分析を定量データ(スコア)と紐づけて行うことで、「推奨度が高い顧客は何を評価しているのか」「不満層はどこでつまずいているのか」といった因果的なインサイトを得ることも可能です。
まとめ
生成AIを顧客アンケート業務に導入することで、以下のような効果が得られます。
| 項目 | 従来の課題 | 生成AI導入後の効果 |
|---|---|---|
| 設問設計 | 属人化・時間がかかる | テンプレート化・自動生成で短時間化 |
| 自由記述分析 | 読み込み・分類に膨大な労力 | 自動要約・感情分類で即時インサイト |
| 分析スピード | 結果反映に数週間 | 数時間〜1日でレポート化可能 |
| 改善提案 | 経験と勘に依存 | AIが定量+定性をもとに提案文を生成 |
このように、「人に依存した設計」と「人手に頼る分析」といった課題を、生成AIが「再現可能な仕組み」と「自動化された理解」に変えることで、企業がよりスピーディーかつ継続的に顧客の声を活用するのを支援します。
生成AIを活用し、設問設計からアンケート結果の分析をしてみた
では、実際に生成AIを活用して、顧客アンケートの設問設計とアンケート結果の分析を行ってみます。
設問設計
設問設計では、ChatGPTとGeminiの通常のチャット欄で作成しました。
プロンプトは以下の通りです。
想定シナリオ
項目内容架空企業株式会社スマートリンク・ソリューションズ
事業内容IoT機器を活用した工場向け生産モニタリングシステムの開発・販売
調査目的導入企業の満足度と継続利用意向を把握し、サポート体制改善と再契約率向上につなげる
対象システム導入後6か月〜1年の顧客企業担当者(想定100社)アンケート構成
「あなたはBtoB製造業向けの顧客アンケート設計の専門家です。以下の条件で10問以内のアンケートを作成してください。」
目的:IoTモニタリングシステム導入後の顧客満足度と改善点の把握
回答形式:5段階評価+自由記述
その結果、「導入効果」「操作性・サポート」「継続利用・改善要望」といった構成で質問を作成してくれました。
なお、ChatGPTは10問うち1問自由記述、Geminiは8問うち複数に自由記述といったような、微妙な違いはありましたが、両方とも自由記述の数や質問の微調整を行えば、活用できるクオリティだと感じました。
アンケート結果の分析
次に、設問設計で構築した設問をもとに作成したアンケートを実施し、その結果を分析します。
分析は、出力形式が決まっている方が複数回分析する際に便利なため、GPTやGemを活用しました。
なお、GPTやGemは、ChatGPTとGeminiの「カスタマイズ版」で、設定や役割、情報ソース、出力フォーマットを登録できる機能です。
設定した指示は、「顧客アンケート分析に特化した自動分析アナリストとして、CSVを読み込むと、平均値やNPS、自由記述の傾向分析、改善提案をレポート形式で出力する。」というものです。
その他にも、出力構成や出力スタイル、改善提案の方法や避けるべき表現などを設定しました。
そして、100社分の架空アンケートデータをアップロードし、分析をしてもらいました。
すると、指示した通りにNPS(商品やサービスに対する信頼・愛着を測る指標)や相関分析を行ってくれ、改善提案を出力してくれました。
一方、分析結果の数値は、Excelで同じ内容を分析した結果と照らし合わせると、いくつも誤差がありました。
また、分析結果を図にしてと新たに指示しても、文字化けしたり、日本語がおかしくなったりしています。
なお、Gemもほぼ同様の結果で、コメントの抜粋や改善提案といった自然言語の分析は適切に行ってくれるものの、数値は正確ではなく、図も文字化けしてしまいました。
自由記述に関しては、アンケート結果をテーマ別に分類し、そのテーマに関したコメントの件数、ポジティブな内容なのかネガティブな内容なのかを提示してくれ、内容を要約してくれています。
この結果に対して、「主な特徴」と記載してある内容は、どのコメントを参考しているのか聞くと、根拠となるコメントを提示してくれました。
しかし、根拠となるコメントは実際のアンケート結果にある内容ではなかったため、指摘すると、複数の回答結果から要約して提示しているという回答が返ってきました。
提示された複数の回答は、実際に顧客アンケートの結果にあるもので、内容も正しく要約されていました。
なお、根拠となるコメントとは別に、テーマ別の代表コメントも抜粋されており、このコメントは実際にアンケート結果にあるものの中から抜粋してくれていました。
結論
実際に生成AIを活用してみた結果、設問設計や自由記述分析といった自然言語処理では十分に実用レベルにある一方で、数値処理やグラフ生成といった定量分析は精度には現時点では課題があることがわかりました。
そのため、設問設計をChatGPTやGeminiといった生成AIを活用して作成した後、アンケート結果はExcelなどの表計算ツールで正確に算出し、算出した結果を用いたインサイトの抽出や改善提案、自由記述の分析をGPTやGemを活用するという流れが良いと感じました。
なお、グラフや図などで可視化を行いたい場合は、BIツールなどの活用が必要となるでしょう。(2025年10月27日時点)
アンケート・分析業務における生成AI活用プロセスと評価まとめ
| 工程 | 使用ツール | AIの実行領域 | 評価 | 主な課題 | 最適な運用方法 |
|---|---|---|---|---|---|
| 設問設計 | ChatGPT / Gemini(通常チャット) | ・調査目的に沿った設問構成の提案 ・質問文の言語調整 ・5段階評価+自由記述形式の自動生成 |
★★★★☆(高) | ・自由記述のバランス調整が必要 | AIが初稿を作成 → 人が微調整して最終化 |
| 定量分析 (集計・NPS計算・相関分析) |
GPT / Gem(カスタマイズ版) | ・分析フレームの自動化(平均・中央値・NPS算出) | ★★☆☆☆(低〜中) | ・数値誤差が発生 ・Excelとの整合性不足 |
数値処理はExcel等で実施 → AIで解釈補助 |
| グラフ生成・可視化 | GPT / Gem | ・分析結果の可視化提案 | ★☆☆☆☆(低) | ・日本語文字化け・図表レイアウト崩れ | 可視化は人が補完(AI出力は参考程度) |
| 自由記述分析 (定性分析) |
GPT / Gem | ・テーマ分類・感情分析・代表コメント抽出 ・要約と改善提案の提示 |
★★★★★(非常に高) | ・要約が抽象化される場合あり(意訳) | AIが自動要約 → 人が原文との照合で確認 |
| 改善提案・インサイト抽出 | GPT / Gem | ・要因整理と改善仮説の提示 ・担当・効果・難易度の構造化 |
★★★★☆(高) | ・定量根拠を伴わない提案も混在 | AI提案をベースに、定量根拠で補強 |
無料メルマガ会員に登録しませんか?
現在、デジタルをビジネスに取り込むことで生まれる価値について研究中。IoTに関する様々な情報を取材し、皆様にお届けいたします。


