生成AIとセキュリティ監査の関係

2026.03.07
生成AIとセキュリティ監査の関係

生成AIとセキュリティ監査の関係

監査が見たいのは「再現性」と「境界」

生成AIの監査は、古典的なIT監査の延長では収まりません。焦点は二つ、再現性と境界です。再現性とは、いつ誰がどのプロンプトをどのモデル(バージョン、温度、システムプロンプト、ツール権限)で実行し、何を返したかを後から追跡・再実行できること。境界とは、社内データがどこから外に出て、どこで止まるのか(学習・保管・一時利用の差)を明確にすることです。ここが曖昧なままPoCを広げると、意図せぬ個人情報の外送や、モデル更新による回答の揺らぎが監査で刺さります。

たとえばChatGPTやClaude、Gemini、Copilotはエンタープライズ向けに「学習に使わない設定」やテナント分離を提供していますが、設定と利用実態が一致しているかは別問題です。監査に耐えるには、モデル単体ではなく「ゲートウェイ、権限、ログ、データ前処理」を含めた運用面の証跡が要になります。

監査可能な生成AIアーキテクチャ設計

アイデンティティと権限

SSO連携とRBACは前提です。ユーザー、業務用途、データドメインごとに「使えるモデル」「呼べるツール」「RAGの索引範囲」を分け、承認フローと変更管理を残します。APIキーは個人配布を避け、プラットフォーム側でプロキシ化して用益権を集中管理します。

データの扱いと境界

送信前にDLPでPIIや機密表現を検出・マスク(例:顧客氏名はトークン化、カード番号は送信拒否)。RAGはインデクサ側でアクセス制御を行い、検索クエリとヒット文書IDをログ化。推論先はエンタープライズ契約のエンドポイントを優先し、ゼロリテンションを強制します。暗号鍵はKMSで集中管理し、一時キャッシュにはTTLを設定します。

ログ設計と再現性

プロンプトと応答は原文保存が望ましいですが、規程上難しければ可逆マスキング+ハッシュで改ざん検知を担保。モデル名・バージョン・パラメータ・ツール呼び出し・RAGのソース・ユーザーID(擬名化)・トレースIDを1イベントに束ね、保持期間と削除手順を規定します。重大ケースのみ原文サンプリング保存の二層ログも有効です。

モデルと安全性の管理

利用可能モデルはホワイトリスト化し、更新時は評価を必須化。脱獄・プロンプトインジェクション・データ漏えいの自動テストセット(OWASP LLM Top 10相当)を回し、ヒット率と回避策(ガードレール、コンテンツフィルタ、ツール権限見直し)を記録します。回答品質は社内評価データで定点観測し、閾値割れはロールバックできるようにします。

監査項目と意思決定の指標

  • データ境界: 外部送信前にDLPを通過したプロンプト比率100%、機密検知の再現率95%以上、機密外送インシデント0件/月。
  • 再現性: モデル更新後も重要プロンプトの再現誤差(スコア差)±5%以内。トレースIDから24時間以内に事象再現可能。
  • 安全性: プロンプトインジェクション模擬攻撃の成功率5%未満、コンテンツガードでのブロック率と過検知率のバランス指標(F1スコア0.9以上)。
  • 権限: ツール呼び出しの権限不一致0件、RAGでの越権ヒット0件。承認なしモデル追加0件。
  • 運用: 重大ログの改ざん検知ステータス100%、削除リクエスト対応SLA48時間以内。

提出証憑の例は、データフロー図、モデル台帳(提供者・バージョン・学習/保持ポリシー)、評価結果レポート、レッドチーム記録、ログサンプル、変更管理記録、ベンダー契約要約(データ保持・第三国移転)です。これらが揃えば、経営側は「どの業務にどのモデルをどの条件で開放するか」を定量で判断できます。

身近な企業活用例:中堅ECの失敗と改善

カスタマーサポートで回答テンプレ作成にChatGPTの個人アカウントを使い始め、オペレーターが注文情報を貼り付ける運用が横行。内部監査で個人情報外送の可能性が指摘され、拡大が停止しました。

改善では、まず生成AIゲートウェイを導入し、社内からの呼び出しは同ゲートウェイ経由に集約。用途別にClaudeとGeminiをホワイトリスト化し、ゼロリテンションを強制。問い合わせ対応はRAG化して社内FAQとマニュアルのみを参照、個人情報は送信前にDLPでマスク。プロンプトはCopilotのナレッジ活用も含めテンプレ化し、変更は承認制に。ログは原文を可逆マスクで保存し、重大ケースは原文サンプルで保持しました。

結果、監査は「外送データ境界の明確化」「モデル更新の評価記録」を評価。CSの応答時間は30%短縮、顧客満足は8ポイント改善、個人情報外送は0件を維持。監査対応工数は前期比で40%削減しました。ポイントは、ツール選定よりも「経路の統制」「証跡の設計」に投資したことです。

まとめ:プラットフォームに監査容易性を組み込む

生成AIはモデルの性能だけでなく、再現性と境界を設計できるかが事業の信用を左右します。モデル選択、権限、データ前処理、ログ、評価、契約を一枚のプラットフォームで貫通させれば、監査は負担から強みに変わります。生成AIプラットフォーム事業としては、政策(Policy-as-Code)と観測(Tracing/Logging)を標準機能にし、モデル横断の統制と証憑化を容易にすることが、ユーザー企業の意思決定と継続運用を静かに後押しします。