
視聴データを活用したレコメンド設計
視聴データの分解とKPIの置き方
動画プラットフォームでの「当てにいく」レコメンドは、クリック率よりも、その後の滞在と満足をどう測るかで決まります。最低限のイベント粒度は、インプレッション・クリック・再生開始・30秒到達・総視聴時間・完視・離脱タイムスタンプ・再視聴・ミュート/スキップ・評価/コメント/保存・フォロー/購読。加えて、セッション長・直近視聴ジャンル・デバイス/回線・配信後経過日数・同時再生数などの文脈を持たせます。
KPIは「短期の反応」と「中長期の関係性」を分けて設計します。短期は30秒到達率、完視率、セッションあたり視聴時間、フリーズ発生率。中長期は翌日/7日再訪率、新作発見率(初視聴作品の割合)、ジャンル多様性(シャノンエントロピー)など。広告型は視聴時間×広告表示品質、サブスク型は解約率/継続日数との相関を検証し、ランキング目的関数に重み付けします。
モデル設計:候補生成→ランキング→再配置
候補生成(Recall)
まずは高速に「当たりそうな集合」を用意します。代表的には、視聴同時系列に基づく共視グラフ、ユーザー/アイテム二塔モデルの埋め込み近傍探索、直近セッションのシーケンス類似、地域・言語・デバイス別の新着ブースト。履歴が薄いユーザーには、テキスト/字幕/タグからのコンテンツ埋め込みで近傍検索、人気×新規性を混ぜます。
ランキング(Precision)
候補を数百本に絞ったら、視聴確率と満足の期待値を推定します。特徴量は、ユーザー側(最近の再生速度、夜間視聴比率、短尺嗜好、連ドラ継続傾向)、アイテム側(開始30秒の情報密度、平均完視率、サムネイルコントラスト、公開からの経過日数)、相互作用(同ジャンル連続視聴時の視聴時間上振れ、曜日×ジャンル)。モデルはロジスティック回帰やGBDTで十分戦えますが、セッション文脈を重視する場合はシーケンスモデルを検討。目的関数は「30秒到達の確率×期待視聴時間×新作ペナルティ/ブースト」で、ビジネス方針に合わせて係数を調整します。
再配置(Re-Rank)と探求
同質な動画ばかり並ぶと飽きます。リスト内類似度に上限を設け、ジャンル・長さ・制作年の分散を確保。コンプライアンスや編成の優先枠はルールで挿入します。探索はマルチアームドバンディットで、露出制御しつつ新作の学習データを確保。説明可能性はクリックの質を上げます。「最近見た歴史ドキュメンタリーに近い分析調」のような理由文は、字幕要約とタグから自動生成すると運用負荷が下がります。
コールドスタートとメタデータ強化
新作は視聴データが乏しいため、字幕/概要/台本から意味情報を抽出して初期配置を行います。ChatGPT、Claude、Geminiを使うと、ジャンル/トーン/対象年齢/NG要素の自動タグ付けや30秒要約の生成が実務的です。要約は説明文にも転用でき、クリックベイトに寄らない魅力訴求に効きます。サムネイルのバリエーション検証にはStable Diffusionでの案出し→人レビュー→A/B配信の流れが軽量です。
実装・運用で差がつくポイント
データ基盤とSLA
イベントはスキーマを厳格化し、遅延到着を想定したウィンドウ集計を導入します。特徴量は「オンライン更新可能」「再現性のあるオフライン計算」を両立するため、共通のストアを用意。候補生成は近傍探索サーバを別立てし、P95レイテンシを明確化、タイムアウト時は人気×多様性のデフォルトにフォールバック。モデルの再学習は日次/週次で、分布シフトを監視しアラートを設置します。
評価設計
オフラインは、候補生成でRecall@100、ランキングでNDCG@10/期待視聴時間を見ると分解が明瞭。オンラインはセッション視聴時間、30秒到達率、完視率、新作発見率、7日再訪率を主要とし、ガードレールに離脱増・読み込み失敗率・苦情件数を置きます。A/Bは段階リリースで、短期指標の改善が長期継続に繋がるかを必ず遅行で追跡します。
運用の現実解
レコメンドは編集・権利・広告枠とも隣接します。ビジネスルールはモデル後に明示的に適用し、衝突時はログに残す。説明文の自動生成やタグ整備は人の最終確認を残し、トラブル時に即時停止できるスイッチを設計しておきます。ユーザー同意・年齢制限・地域規制は、配信可否フラグとして早い段階で絞り込みます。
身近な活用例:小規模チームでも回る改善サイクル
学習系の短尺動画サブスクを運営する社員45名の中小事業者。人気順と新着の二段だけで編成していたため、定番動画に露出が集中し、完視率は高いが新作が育たず、7日再訪が伸び悩む状況でした。イベントはページビュー中心で、視聴の粒度が粗いのが根本要因でした。
改善は3ステップ。まず1カ月で「30秒到達」「離脱秒」「再視聴」を計測可能にし、セッションIDを導入。次に2週間で共視グラフの候補生成を構築し、ランキングはGBDTで「30秒到達×期待視聴時間」を最適化。最後に再配置で多様性制約と、新作に週次で探索枠5%を割り当てました。字幕の自動タグ付けと要約生成はChatGPT/Claude/Geminiを併用し、タグ品質を人がスポットチェック。サムネイル案はStable Diffusionで複数生成→デザイナーが選定→A/B配信。
結果、3カ月で新作発見率が+21%、セッション視聴時間が+14%、完視率は横ばいを維持。特に週末の長尺学習コンテンツが適切に面を取り、定番への過剰依存が解消されました。副次的に「あなたが最近見た‘試験対策’に近い要点整理」という理由表示がクリックの質を押し上げ、カスタマーサポートへの「同じ動画ばかり出る」苦情が減少。小規模でも、計測の粒度→二段構えのモデル→再配置と説明の順で積み上げると、無理なく成果が出ることが分かります。
レコメンドは単なる技術ではなく、「何を成功とみなすか」を意思決定に落とす設計作法です。視聴データの解像度を上げ、候補生成とランキングを分離し、再配置でビジネスと体験のバランスを取る。動画プラットフォーム事業では、この積み木を粘り強く回すことが、継続率と収益、そして信頼の土台になります。