AI社内展開のリアルな課題

2026.02.23
AI社内展開のリアルな課題

AI社内展開のリアルな課題

PoC止まりを抜ける要件定義:評価軸は“業務の前後”で決める

社内展開が失速する典型は「すごいデモ」からのPoC連発です。突破口は、業務の前後関係に紐づいた評価軸を初回から固定することです。対象は“説明が5分で済む小さな仕事”に限り、2週間スプリントで回します。例:問い合わせメール要約、議事録の要点抽出、ナレッジ検索の下書きなど。

成功指標の決め方

  • 時間短縮:担当者1件あたり処理時間を計測(開始前1週間→導入後1週間)。
  • 品質:サンプル50件の出力を3段階でブラインド評価(可/要修正/不可)。
  • 再現性:同プロンプト・同入力でのばらつき率(出力差分文字数や採点基準)。
  • コスト:1件あたりのトークン費用と人件費の差分(閾値超過で自動停止)。

仕様は“入力と出力”で書く

要件書は「誰が・どの画面から・どのファイル/テキストを入れ・どの形式で受け取るか」を明文化します。プロンプト自体は資産なので、Gitで版管理し、テンプレごとにKPIオーナーを設定します。モデルはChatGPT/Claude/Geminiなど複数を候補に入れ、同じプロンプト・同じ評価セットで横比較します。

データガバナンスとセキュリティ:ルール→仕組み→監査の三段攻め

「外部に学習されない設定にしているから大丈夫」は誤解の元です。保護すべきは学習だけでなく、提示・保存・再配布です。最低限の実務は次の通りです。

  • 権限設計:社内文書のRAG索引は部門タグで分割し、交差アクセスを既定で遮断。RBACをSSO連携、人事異動時はSCIMで自動剥奪。
  • 入力ガード:個人情報・取引先名は入力時にマスキング。正規表現+辞書で自動ブロックし、例外申請はチケット駆動。
  • 出力ガード:生成文に出典URLと根拠スニペットを強制付与(根拠が無ければ回答拒否)。
  • 監査:プロンプト/出力/参照ドキュメントのハッシュを90日保存。月次でリスクレビュー。
  • 費用統制:部門ごとに月額上限と深夜帯停止。閾値80%でSlackに自動通知。

ツール選定では、M365重心ならCopilot、長文要約や文脈保持に強いのはClaude、社外検索やツール連携を絡めるならGemini、対話全般はChatGPTが扱いやすい、という現実解が見えます。モデルの善し悪しは変動するため、ベンダーロックインを避ける「プロンプト互換」と「評価データセットの内製化」が肝です。

現場定着の運用:教育・ガイドライン・サポートを“軽量に継続”

導入初月の熱量が落ちた瞬間にシャドーITが再発します。運用は“軽量に続ける”設計にします。

最小構成の運用設計

  • 90分ハンズオン:各部門の実データで3本のテンプレを一緒に作成。
  • プロンプト雛形集:用途別に10本だけ。毎月2本の差し替えサイクル。
  • 失敗事例集:ハルシネーションやポリシー違反の実例と回避策を共有。
  • サンドボックス:本番と同UIで学べる検証環境。出力に「学習禁止・転送不可」の透かし。
  • 駆け込み寺:社内チャットに“AI当番”スレッド。質問に翌営業日までに一次回答。
  • 変更管理:モデル更新や料金改定は「影響→推奨アクション→適用期日」の3行で全社通知。

ガイドラインは「禁止の羅列」ではなく、許可される具体例と境界線(入力可/要マスク/不可)を図で示します。評価と費用の見える化ダッシュボードを用意し、部門長が自分で使い方を改善できるようにします。

身近な企業の導入ストーリー:中堅ECのつまずきと再起

コールセンター30名在籍のEC運営企業は、全社にChatGPTの利用を解禁しました。最初の1カ月は議事録やメルマガ案出しで盛り上がったものの、CS返信の質が担当者ごとにばらつき、NGワード混入の冷や汗も。費用も個別アカウントで見えず、経営会議で「一度仕切り直し」に。

再開時は対象業務を「問い合わせ要約→一次返信ドラフト→ナレッジ参照」の3ステップに限定。RAGを社内FAQ/マニュアルのみに絞り、出力には必ず根拠リンクを付与。モデルは一次要約にClaude、ドラフト生成にChatGPT、Office文書の整理にCopilotを割り当て、外部サイト横断の調査だけGeminiを使うポリシーにしました。プロンプトはGitで管理し、50件の評価セットで毎週ABテスト。入力には顧客名と住所を自動マスキング、解除はSV承認制です。

結果、CSの平均処理時間は38分→25分、初回解決率は+8pt。品質レビューで「要修正」率が27%→12%に下がり、月間の生成AIコストは上限内に収まりました。現場の声は「返答が早くなり、難問は人が腰を据えて対応できる」。一方で季節商材の新語に弱い課題が残り、月次でFAQを自動抽出→編集→RAG再索引の運用を追加。いまは繁忙期の夜間だけ人的増員を抑制できています。

このケースの学びは、万能ツールを配るのではなく「業務の粒度を固定し、根拠提示を強制し、評価データで継続改善」することです。モデルは目的別に分担し、プロンプト/評価/監査を横串で回す“プラットフォーム思考”が、社内展開の速度と安全性を両立させます。生成AIプラットフォーム事業は、まさにこの横串(ID連携、権限、RAG、評価/監査、費用統制)を標準機能として提供し、現場の実装負担を減らすことで価値を発揮します。