
生成AIとデータ分析の融合
LLMを分析プロセスに埋め込む設計図
意思決定者に役立つのは「自然言語で質問して、そのまま意思決定に直結する示唆が返る」体験です。そこで有効なのが、分析基盤の上にLLMを二層で組み込む設計です。第一層は経営・現場向けの質問応答レイヤー。ダッシュボードやスプレッドシートに埋め込み、指標の分解、異常検知の理由候補、次に打つ施策案までを自然文で返します。第二層はアナリスト向けのCopilot化。スキーマを理解したうえでSQL・Python・ドキュメントを生成し、粒度や期間、結合キーを自動補完します。ChatGPT、Claude、Geminiはいずれも強力で、社内の文脈やスキーマを教えると精度が跳ね上がります。
最低限そろえるべき部品
- メトリクス辞書とスキーマ辞書:売上の定義、期間の基準、除外条件などを自然文と例で記述
- RAGパイプライン:辞書やドキュメントをベクトル検索し、根拠テキストを必ず提示
- 実行ガード:読み取り専用、行数・コスト上限、時間帯制御、権限制御ビュー
- 監査ログと評価ジョブ:質問、プロンプト、生成SQL、回答、根拠、コストを全て記録し自動採点
UIでは「疑わしきは保留」に寄せ、曖昧な場合は追加の質問を投げる設計にします。CopilotはIDEやBIに組み込み、スキーマの変更を検知したらプロンプトを自動更新させます。
ガバナンスと品質をプロンプトレベルで担保する
生成AIは自由度が高いぶん、制約を明文化して初めて業務で使えます。プロンプトテンプレートに「推測禁止」「根拠の抜粋必須」「不十分な根拠なら“わからない”と答える」「SQLはCTEで段階的に」「結合キーは辞書に従う」を埋め込みます。SQLはASTで解析し、書き込みやフルスキャンを拒否。PIIはビューでマスキングし、集計結果の最小母数を設定します。回答はすべて監査ログに保存し、後から再現できる状態を維持します。
評価指標(自動採点できるものから)
- 根拠提示率:回答に出所テキストやメトリクス定義の引用が含まれる割合
- 正答率:オラクル(既知の正解セット)に対する一致・近似の割合
- ハルシネーション率:根拠にない断定をした比率
- 実行コストとレイテンシ:クエリ費用、待ち時間の中央値・P95
- 業務KPIの変化:在庫回転日数、粗利率、調査リードタイムなど
モデルは用途で使い分けます。説明の明瞭さはClaude、コード生成はCopilot連携、幅広い知識や多言語はChatGPT、要約や表形式の整形はGeminiが得意といった傾向があります。A/Bで比較し、コストも含めて選定します。
身近な企業活用例:地方ドラッグストア50店のやり直し
地方で50店舗を運営するドラッグストアA社。Excel中心で、欠品と廃棄が慢性化していました。データ基盤は整備済みでしたが、質問が属人化し、分析着手まで数日かかるのが課題でした。最初のトライは、ChatGPTに自然文からSQLを生成させる方法。しかし、売上定義の誤解や在庫テーブルの結合抜けで誤集計が発生。深夜にフルスキャンが走りコストも高騰、推奨発注量の誤りで欠品が一時的に増える失敗に。
改善では次を実施しました。
- メトリクス辞書を整備しRAG化:売上は値引き後、返品当月控除、在庫は期末スナップショットと定義
- 権限制御ビューとコスト上限:明細は一部ロールのみ、行数・スロット上限を設定
- プロンプトテンプレ:根拠の抜粋必須、信頼区間や前提を明記、曖昧なら追加質問
- SQLガード:CTE必須、結合キーのホワイトリスト、疑似本番データで自動回帰テスト
- 意思決定ハンドオフ:一定金額以上の発注提案は店長承認が必要
3週間で再展開後、翌四半期に欠品率が18%減、期限切れ廃棄が12%減。クエリコストは35%削減、分析依頼から初期示唆までの時間は2日から30分に短縮。現場の声として「なぜそう言えるか」の根拠が表示される点が定着の決め手になりました。モデルは日次でChatGPTとClaudeを切り替え評価し、発注提案の説明の明快さでClaude、異常検知の文脈補完でChatGPTが優位という使い分けに落ち着きました。
導入ステップと運用のコツ
- 問いを10個書き出す:「在庫過多のSKUは?」「解約率のドライバは?」など、KPIと計算式まで明文化
- メトリクスレイヤを作る:指標の定義書とサンプル出力を用意し、RAGのコーパスに投入
- モデル比較:ChatGPT/Claude/GeminiでA/B、正答率・根拠提示率・コストを計測
- Copilotのガードレール設計:スキーマ辞書、結合キー規約、コスト上限、読み取り専用ロール
- 自動評価パイプライン:夜間にオラクル問題集で回帰テスト、しきい値を割れば自動ロールバック
- 人間の関与を設計:高リスク出力は承認必須、承認コメントを学習用フィードバックに回収
最終的に重要なのは「基盤に埋め込むこと」です。メタデータ、アクセス制御、ワークフロー、評価・監査を一枚の基盤に載せると、モデルやUIが変わっても運用が崩れません。生成AIがもたらす速さを、データ解析プラットフォーム事業の土台に安全に接続することで、現場の意思決定はようやく持続的に加速します。