生成AIとデータ分析の融合

2026.02.27
生成AIとデータ分析の融合

生成AIとデータ分析の融合

LLMを分析プロセスに埋め込む設計図

意思決定者に役立つのは「自然言語で質問して、そのまま意思決定に直結する示唆が返る」体験です。そこで有効なのが、分析基盤の上にLLMを二層で組み込む設計です。第一層は経営・現場向けの質問応答レイヤー。ダッシュボードやスプレッドシートに埋め込み、指標の分解、異常検知の理由候補、次に打つ施策案までを自然文で返します。第二層はアナリスト向けのCopilot化。スキーマを理解したうえでSQL・Python・ドキュメントを生成し、粒度や期間、結合キーを自動補完します。ChatGPT、Claude、Geminiはいずれも強力で、社内の文脈やスキーマを教えると精度が跳ね上がります。

最低限そろえるべき部品

  • メトリクス辞書とスキーマ辞書:売上の定義、期間の基準、除外条件などを自然文と例で記述
  • RAGパイプライン:辞書やドキュメントをベクトル検索し、根拠テキストを必ず提示
  • 実行ガード:読み取り専用、行数・コスト上限、時間帯制御、権限制御ビュー
  • 監査ログと評価ジョブ:質問、プロンプト、生成SQL、回答、根拠、コストを全て記録し自動採点

UIでは「疑わしきは保留」に寄せ、曖昧な場合は追加の質問を投げる設計にします。CopilotはIDEやBIに組み込み、スキーマの変更を検知したらプロンプトを自動更新させます。

ガバナンスと品質をプロンプトレベルで担保する

生成AIは自由度が高いぶん、制約を明文化して初めて業務で使えます。プロンプトテンプレートに「推測禁止」「根拠の抜粋必須」「不十分な根拠なら“わからない”と答える」「SQLはCTEで段階的に」「結合キーは辞書に従う」を埋め込みます。SQLはASTで解析し、書き込みやフルスキャンを拒否。PIIはビューでマスキングし、集計結果の最小母数を設定します。回答はすべて監査ログに保存し、後から再現できる状態を維持します。

評価指標(自動採点できるものから)

  • 根拠提示率:回答に出所テキストやメトリクス定義の引用が含まれる割合
  • 正答率:オラクル(既知の正解セット)に対する一致・近似の割合
  • ハルシネーション率:根拠にない断定をした比率
  • 実行コストとレイテンシ:クエリ費用、待ち時間の中央値・P95
  • 業務KPIの変化:在庫回転日数、粗利率、調査リードタイムなど

モデルは用途で使い分けます。説明の明瞭さはClaude、コード生成はCopilot連携、幅広い知識や多言語はChatGPT、要約や表形式の整形はGeminiが得意といった傾向があります。A/Bで比較し、コストも含めて選定します。

身近な企業活用例:地方ドラッグストア50店のやり直し

地方で50店舗を運営するドラッグストアA社。Excel中心で、欠品と廃棄が慢性化していました。データ基盤は整備済みでしたが、質問が属人化し、分析着手まで数日かかるのが課題でした。最初のトライは、ChatGPTに自然文からSQLを生成させる方法。しかし、売上定義の誤解や在庫テーブルの結合抜けで誤集計が発生。深夜にフルスキャンが走りコストも高騰、推奨発注量の誤りで欠品が一時的に増える失敗に。

改善では次を実施しました。

  • メトリクス辞書を整備しRAG化:売上は値引き後、返品当月控除、在庫は期末スナップショットと定義
  • 権限制御ビューとコスト上限:明細は一部ロールのみ、行数・スロット上限を設定
  • プロンプトテンプレ:根拠の抜粋必須、信頼区間や前提を明記、曖昧なら追加質問
  • SQLガード:CTE必須、結合キーのホワイトリスト、疑似本番データで自動回帰テスト
  • 意思決定ハンドオフ:一定金額以上の発注提案は店長承認が必要

3週間で再展開後、翌四半期に欠品率が18%減、期限切れ廃棄が12%減。クエリコストは35%削減、分析依頼から初期示唆までの時間は2日から30分に短縮。現場の声として「なぜそう言えるか」の根拠が表示される点が定着の決め手になりました。モデルは日次でChatGPTとClaudeを切り替え評価し、発注提案の説明の明快さでClaude、異常検知の文脈補完でChatGPTが優位という使い分けに落ち着きました。

導入ステップと運用のコツ

  1. 問いを10個書き出す:「在庫過多のSKUは?」「解約率のドライバは?」など、KPIと計算式まで明文化
  2. メトリクスレイヤを作る:指標の定義書とサンプル出力を用意し、RAGのコーパスに投入
  3. モデル比較:ChatGPT/Claude/GeminiでA/B、正答率・根拠提示率・コストを計測
  4. Copilotのガードレール設計:スキーマ辞書、結合キー規約、コスト上限、読み取り専用ロール
  5. 自動評価パイプライン:夜間にオラクル問題集で回帰テスト、しきい値を割れば自動ロールバック
  6. 人間の関与を設計:高リスク出力は承認必須、承認コメントを学習用フィードバックに回収

最終的に重要なのは「基盤に埋め込むこと」です。メタデータ、アクセス制御、ワークフロー、評価・監査を一枚の基盤に載せると、モデルやUIが変わっても運用が崩れません。生成AIがもたらす速さを、データ解析プラットフォーム事業の土台に安全に接続することで、現場の意思決定はようやく持続的に加速します。