視聴データを活用したレコメンド設計

視聴データの分解とKPIの置き方

動画プラットフォームでの「当てにいく」レコメンドは、クリック率よりも、その後の滞在と満足をどう測るかで決まります。最低限のイベント粒度は、インプレッション・クリック・再生開始・30秒到達・総視聴時間・完視・離脱タイムスタンプ・再視聴・ミュート/スキップ・評価/コメント/保存・フォロー/購読。加えて、セッション長・直近視聴ジャンル・デバイス/回線・配信後経過日数・同時再生数などの文脈を持たせます。

KPIは「短期の反応」と「中長期の関係性」を分けて設計します。短期は30秒到達率、完視率、セッションあたり視聴時間、フリーズ発生率。中長期は翌日/7日再訪率、新作発見率（初視聴作品の割合）、ジャンル多様性（シャノンエントロピー）など。広告型は視聴時間×広告表示品質、サブスク型は解約率/継続日数との相関を検証し、ランキング目的関数に重み付けします。

モデル設計：候補生成→ランキング→再配置

候補生成（Recall）

まずは高速に「当たりそうな集合」を用意します。代表的には、視聴同時系列に基づく共視グラフ、ユーザー/アイテム二塔モデルの埋め込み近傍探索、直近セッションのシーケンス類似、地域・言語・デバイス別の新着ブースト。履歴が薄いユーザーには、テキスト/字幕/タグからのコンテンツ埋め込みで近傍検索、人気×新規性を混ぜます。

再配置（Re-Rank）と探求

同質な動画ばかり並ぶと飽きます。リスト内類似度に上限を設け、ジャンル・長さ・制作年の分散を確保。コンプライアンスや編成の優先枠はルールで挿入します。探索はマルチアームドバンディットで、露出制御しつつ新作の学習データを確保。説明可能性はクリックの質を上げます。「最近見た歴史ドキュメンタリーに近い分析調」のような理由文は、字幕要約とタグから自動生成すると運用負荷が下がります。

コールドスタートとメタデータ強化

新作は視聴データが乏しいため、字幕/概要/台本から意味情報を抽出して初期配置を行います。ChatGPT、Claude、Geminiを使うと、ジャンル/トーン/対象年齢/NG要素の自動タグ付けや30秒要約の生成が実務的です。要約は説明文にも転用でき、クリックベイトに寄らない魅力訴求に効きます。サムネイルのバリエーション検証にはStable Diffusionでの案出し→人レビュー→A/B配信の流れが軽量です。

実装・運用で差がつくポイント

データ基盤とSLA

イベントはスキーマを厳格化し、遅延到着を想定したウィンドウ集計を導入します。特徴量は「オンライン更新可能」「再現性のあるオフライン計算」を両立するため、共通のストアを用意。候補生成は近傍探索サーバを別立てし、P95レイテンシを明確化、タイムアウト時は人気×多様性のデフォルトにフォールバック。モデルの再学習は日次/週次で、分布シフトを監視しアラートを設置します。

評価設計

オフラインは、候補生成でRecall@100、ランキングでNDCG@10/期待視聴時間を見ると分解が明瞭。オンラインはセッション視聴時間、30秒到達率、完視率、新作発見率、7日再訪率を主要とし、ガードレールに離脱増・読み込み失敗率・苦情件数を置きます。A/Bは段階リリースで、短期指標の改善が長期継続に繋がるかを必ず遅行で追跡します。

運用の現実解

レコメンドは編集・権利・広告枠とも隣接します。ビジネスルールはモデル後に明示的に適用し、衝突時はログに残す。説明文の自動生成やタグ整備は人の最終確認を残し、トラブル時に即時停止できるスイッチを設計しておきます。ユーザー同意・年齢制限・地域規制は、配信可否フラグとして早い段階で絞り込みます。

身近な活用例：小規模チームでも回る改善サイクル

学習系の短尺動画サブスクを運営する社員45名の中小事業者。人気順と新着の二段だけで編成していたため、定番動画に露出が集中し、完視率は高いが新作が育たず、7日再訪が伸び悩む状況でした。イベントはページビュー中心で、視聴の粒度が粗いのが根本要因でした。

改善は3ステップ。まず1カ月で「30秒到達」「離脱秒」「再視聴」を計測可能にし、セッションIDを導入。次に2週間で共視グラフの候補生成を構築し、ランキングはGBDTで「30秒到達×期待視聴時間」を最適化。最後に再配置で多様性制約と、新作に週次で探索枠5％を割り当てました。字幕の自動タグ付けと要約生成はChatGPT/Claude/Geminiを併用し、タグ品質を人がスポットチェック。サムネイル案はStable Diffusionで複数生成→デザイナーが選定→A/B配信。

結果、3カ月で新作発見率が+21％、セッション視聴時間が+14％、完視率は横ばいを維持。特に週末の長尺学習コンテンツが適切に面を取り、定番への過剰依存が解消されました。副次的に「あなたが最近見た‘試験対策’に近い要点整理」という理由表示がクリックの質を押し上げ、カスタマーサポートへの「同じ動画ばかり出る」苦情が減少。小規模でも、計測の粒度→二段構えのモデル→再配置と説明の順で積み上げると、無理なく成果が出ることが分かります。

レコメンドは単なる技術ではなく、「何を成功とみなすか」を意思決定に落とす設計作法です。視聴データの解像度を上げ、候補生成とランキングを分離し、再配置でビジネスと体験のバランスを取る。動画プラットフォーム事業では、この積み木を粘り強く回すことが、継続率と収益、そして信頼の土台になります。

視聴データを活用したレコメンド設計

視聴データを活用したレコメンド設計

視聴データの分解とKPIの置き方

モデル設計：候補生成→ランキング→再配置

候補生成（Recall）

ランキング（Precision）

再配置（Re-Rank）と探求

コールドスタートとメタデータ強化

実装・運用で差がつくポイント

データ基盤とSLA

評価設計

運用の現実解

身近な活用例：小規模チームでも回る改善サイクル

関連記事

年間運用総括レポート

年間分析総括レポート

年間SES事業総括レポート

成功事例総括とベストプラクティス