
AIレコメンドで視聴拡大を狙う
伸びない理由を指標で可視化する
視聴が伸びないとき、アルゴリズムの前に「何が詰まっているのか」を指標で切り分けます。ホーム面のCTRが高いのに平均視聴時間が伸びないのは「釣り見出し最適化」の兆候、逆にCTRが低く検索依存が強いなら「発見性の不足」が疑わしいです。おすすめ面、検索、次に見る(Up Next)、通知の各面で分解し、面ごとに目的関数を定義します。
- 主要KPI:セッション平均視聴時間、1本あたり期待視聴分数(pWatchTime)、7日継続視聴率
- 補助指標:新規クリエイター露出比率、コンテンツカバレッジ、重複率、ジャンル多様性、ユーザー操作の打ち消し率(低評価・スキップ)
- 安全・品質:ガイドライン違反検知率、苦情率、年齢制限フラグ率
オフライン検証はNDCG・Recall@Kで候補網羅性を、オンラインはA/BでpWatchTime・セッション長・苦情率を最低2週は見ます。短期のCTRだけで意思決定すると、長尺や新規クリエイターが削られがちです。
ハイブリッド推薦の設計図:候補生成→再ランキング→探索
候補生成(広く速く集める)
まずは数百~数千件の「出し得る候補」を集めます。履歴ベースの共起(同一セッションの共視聴)やアイテム2ベクトルで近傍を引き、コールドスタート用に内容ベースも併用します。内容ベースは音声文字起こしや説明文から埋め込みを作り、ベクトル検索でテーマ近傍を引くのが堅実です。新規動画は、ChatGPTやGemini、Claudeでタイトル・要約・タグの自動生成を行うと埋め込み精度が上がり、早期から適切な面に乗りやすくなります。候補段階で年齢制限や重複、既視聴の除外を済ませると無駄打ちが減ります。
再ランキング(深く正しく並べる)
候補を数十件に絞る主役です。目的関数は「クリック」ではなく「期待視聴分数」がおすすめです。特徴量はユーザーの短期・長期嗜好、時間帯、端末、動画の長さ、冒頭離脱率、鮮度など。モデルは勾配ブースティングや双塔DNNが扱いやすく、位置バイアスは補正を入れます。加えて多様性・鮮度制約をペナルティで組み込み、同一クリエイターや同一テーマの連続露出を緩和します。Up Nextは直近視聴との相性を重視、ホームは多様性と発見性を重視、通知は高確度・短尺優先など、面ごとに目的を切り替えるのが肝です。
探索(将来の学習データを取りにいく)
確信の高い並びだけでは新規が育ちません。3位・7位など一部スロットをコンテキストバンディット(ε-greedyやThompson Sampling)にし、過去露出の少ない良候補を挿入します。探索率は苦情率を監視しながら自動調整。学習は日次で再学習、実時間シグナル(直近スキップ、連続視聴)だけはフィーチャーストアで数分遅延の近似リアルタイム更新にすると効果が出やすいです。開発はCopilotで計測コードや評価スクリプトを素早く整備し、分析の反復速度を上げます。
実装・運用チェックリスト(90日で土台を作る)
- 計測基盤:視聴開始/終了/シーク/スキップ/フォロー/苦情のイベント設計。セッションIDと位置情報の匿名化、保持期間の策定。
- 特徴量整備:ユーザーのトピック分布(短期/長期)、時間帯、デバイス、動画側の長さ・鮮度・タグ・安全フラグをフィーチャーストアに集約。
- 候補生成:共起・類似視聴の近傍探索と、テキスト/音声ベースの埋め込み検索をハイブリッドに。レイテンシ目標はP95で50ms以内。
- 再ランキング:期待視聴分数を目的関数にしたモデルを面別に用意。多様性・鮮度のルールをペナルティで同居。
- A/B運用:5~10%のホールドバック(現行)を常設。主要KPIの下振れガードレール(例:苦情率+0.1pt以上で自動停止)。
- コールドスタートと安全:GeminiやChatGPT、Claudeで要約・タグ・年齢適合性の一次判定を自動化し、人手レビューの負荷を減らす。
UIも性能の一部です。「あなたへのおすすめの理由(例:最近◯◯を視聴)」を短文で表示し、興味なし/ミュート/通報の導線を1タップに。ネガティブフィードバックは次回の候補生成で即時反映し、学習にも重み付けします。検索結果にも「関連性」「新着」「長尺」などのタブを置くと目的別に回遊が増えます。
身近な企業活用例:教養系動画アプリの失敗と改善
教養・趣味ジャンル中心で月間アクティブ40万人規模の動画アプリ。トップは「新着/人気」の2列のみで、セッション平均視聴時間は8.2分で頭打ち。新規クリエイターの露出が低く、検索経由が6割を占めていました。最初の打ち手はCTR最適化の並び替えでしたが、クリックは+22%になった一方、冒頭30秒離脱が悪化し苦情率も上がる失敗に。
再設計では、1) 音声文字起こしからの要約・タグ生成を導入(要約と安全の一次判定はChatGPTとGemini、曖昧なケースはClaudeで再判定)、2) ユーザー嗜好を5次元のトピックベクトルに圧縮し短期/長期で重みを切替、3) 候補生成は共起と埋め込みのハイブリッド、4) 再ランキングは期待視聴分数と多様性ペナルティ、5) ホームの3位・7位をバンディット探索スロットに設定、6) UIに「おすすめの理由」と「興味なし」を追加、という手順で4週間A/Bを実施しました。
結果、平均視聴時間は+18%、新規クリエイター露出比率は+34%、通知からの復帰率は+9%。CTRは微増に留まりましたが、冒頭離脱と苦情率は改善。特に「Up Next」を視聴履歴近傍に寄せ、ホームで多様性を担保した面別チューニングが効きました。運用面では、探索率の自動調整と、失速時に現行へ即時ロールバックできる常設ホールドバックが意思決定の安心材料になりました。
AIレコメンドは魔法ではなく、候補を広く集め、目的に沿って並べ、未来の学習データを取りにいく地道な作業の積み重ねです。動画プラットフォーム事業では、発見性の設計と安全・多様性のバランスが中長期の視聴を左右します。面ごとに目的を分け、学習と探索を回し続けることが、視聴拡大と健全なエコシステムの両立につながります。