分析コスト試算の方法

2026.03.15
分析コスト試算の方法

分析コスト試算の方法

まずどこにお金が出ているかを棚卸す(5つの箱)

分析の費用は「見えにくい変動費」と「薄く広がる固定費」に分散します。最初に、次の5つの箱へ必ず仕分けます。

  • 人件費:データアナリスト、エンジニア、PM、業務側レビュー。時給、稼働率、ミーティング比率、レビュー回数、待ち時間を記録します。
  • 計算/ストレージ:クエリ実行、ノートブック、ETL、学習用GPU、ダッシュボード更新。ドライバーは「クエリ本数×平均スキャン量(GB/TB)」「実行分(vCPU/GPU時)」「TB-月」「バージョン数」です。
  • データ移動/ネットワーク:DWH間の転送、外部API課金、取り込みツールの従量。転送GB、同期頻度、APIコール数を持ちます。
  • ツール/ライセンス:BI、オーケストレーション、カタログ、ノートブック、LLMアシスト。席数、アクティブ率、上位プランの必要条件を把握します。
  • 運用/ガバナンス:監視、権限管理、セキュリティレビュー、監査ログ保管。ジョブ数、失敗率、警告数、保持期間をドライバーにします。

この棚卸は「何にいくら」だけでなく「何回・何分・何GB」を作る作業です。数が取れない場合は、ログ/請求のエクスポートを最短経路で取ることから始めます。

単価とボリュームから積み上げる試算式

基本式とドライバー

原則は単価×数量です。総コスト=人件費+実行/保管+移動+ツール+運用−自動化効果。ドライバーは「クエリ本数」「平均スキャン量」「実行分」「TB-月」「APIコール」「席数」「ジョブ数」。この粒度でWBSを切るとブレが小さくなります。

人件費は「作成+レビュー+リワーク」で見る

人件費=役割別時給×(作成時間+レビュー時間+リワーク)。たとえばダッシュボード1本=作成4時間×1.2(レビュー係数)×1.15(リワーク率)=5.52時間。ChatGPTやClaudeでSQLたたき台を作ると作成時間は減りますが、プロンプト試行と検証の時間を別計上すると実態に近づきます。CopilotでETLの雛形を生成、Geminiで仕様書要約と影響範囲の洗い出しを行う場合も「短縮前提の係数」を明示し、効果検証の余白を残します。

クラウド実行・保管の積み上げ

  • クエリコスト=平均スキャン量(TB)×単価(/TB)×本数。ノートブックは実行分×単価(/分)。
  • ETL/オーケストレーション=ジョブ数×平均実行分×単価+失敗リトライ分。
  • 学習=GPU時×回数×単価+チェックポイント保管(TB-月)。
  • ストレージ=TB-月×単価+バージョニング係数(世代数)。

案件/部門へ配賦するには、クエリタグやラベル、ワークスペース単位のメータを必ず付与します。これで「どの分析がどれだけ払ったか」を追跡できます。

按分と料金メニューを決める

共通費はドライバーで按分します。席数按分(BI)、実行分按分(DWH/ETL)、容量按分(データレイク)など。ユーザー側の意思決定を促すなら「最低料金+従量」の二部料金にすると、無駄な深夜実行やフルスキャンが減ります。

最初の1時間で作れる“ラフ試算テンプレート”

  1. 請求データをエクスポート(DWH/ストレージ/ネットワーク)。クエリ別・ジョブ別に集計できる最小単位を確保。
  2. 人件費の時給テーブルを役割別に作成。過去2週間の実績から「作成/レビュー/待ち」の比率を仮置き。
  3. 上位10本の重いクエリ/ジョブを抽出し、平均スキャン量、実行分、失敗率、所有チームを把握。
  4. 分析WBS(例:データ取り込み→前処理→集計→検証→可視化→レビュー)に各ドライバーを貼り付け。
  5. 単価×数量でベース試算を出す。人件費は係数(レビュー/リワーク)込みで積む。
  6. 感度分析:平均スキャン量±20%、リワーク率±10%、ダッシュボードPV±30%の三変量で表を作る。
  7. 配賦ルール(席数/実行分/容量)を定義し、部門別の見込み配賦額を計算。
  8. 改善案のROI計算枠を用意(例:サンプリング導入=スキャン量30%減、スケジューラ統合=失敗率半減)。

補助作業は自動化します。請求CSVの整形はCopilotでスクリプト化、仕様の要約や影響範囲はGemini、SQLの初期案はChatGPTやClaudeで作り、検証とレビューに人の時間を集中させます。

身近な企業活用例:D2Cアパレルの失敗と改善

ECと広告の最適化で週次ダッシュボードを量産しましたが、クラウドDWHの請求が3カ月で1.4倍に膨張。

原因は、

  • マーケと分析で同一データを重複保持(TB-月が増大)。
  • ChatGPTで生成したSQLがJOINの粒度を誤り、テーブル全走査が頻発。
  • ダッシュボードの深夜自動更新が全環境で並行実行(実行分が二重化)。

上記の方法でコストドライバーを可視化。クエリにチーム/案件ラベルを必須化、重い上位20本をClaudeで最適化の叩き台を作り、エンジニアが検証。サンプリングビューを導入し、PVの少ないダッシュボードは手動更新へ。ワークスペースを分離し「最低料金+従量」の社内チャージを採用。結果、

  • 平均スキャン量33%減、ダッシュボード更新実行分40%減。
  • 重複データの統廃合でストレージ25%削減。
  • マーケ部門の月次配賦が可視化され、予算会議で「どの分析を残すか」の議論が前倒しに。

数字の裏取りを続けるため、請求データの日次取り込みと部門別レポートを定例化。Copilotで最適化PRのテンプレを整え、Geminiで変更影響を要約し、運用の手戻りを抑えました。

意思決定につながる“現場の指標”で回す

分析は「速い・安い・正しい」のトレードオフです。単価×数量の積み上げに、レビュー/リワーク/待ち時間の係数、ラベルによる配賦、感度分析の3点を入れれば、経営・現場の会話に耐える試算になります。データ解析プラットフォーム事業では、この枠組みをメータリング、請求連携、ラベル必須化、クォータ、FinOpsレポートとして仕組みに埋め込むほど、利用者の行動が自然と最適化されます。コストは削るためだけでなく、どの分析に張るかを決める材料です。プラットフォームがその判断を日常化できるかが、事業の質を底上げします。