核心概念
生成モデルは、ユーザー-アイテム相互作用履歴だけでなく、テキスト、画像、動画といった複雑なデータ分布をモデル化し、サンプリングする能力を発展させてきた。これにより、従来の推薦システムにはない新しい推薦タスクを実現できるようになった。
要約
本論文は、生成モデルを用いた推薦システム(Gen-RecSys)に関する包括的かつ学際的なサーベイである。主な内容は以下の通り。
- 相互作用駆動型の生成モデルの基礎的な概要を提供する。
- 大規模言語モデル(LLM)の推薦、検索、対話型推薦への適用について説明する。
- 画像やビデオコンテンツの処理と生成を行う multimodal モデルについて紹介する。
- Gen-RecSysの影響と危害を評価するための必要な視点を強調し、オープンな課題を特定する。
統計
生成モデルは、ユーザーの過去の好みアイテムから、新しいアイテムを生成することができる。
大規模言語モデルは、ユーザーの好みや問い合わせを理解し、それに基づいて推薦を行うことができる。
多様なデータモダリティ(テキスト、画像、動画など)を統合することで、より正確で関連性の高い推薦が可能になる。
引用
"生成モデルは、ユーザー-アイテム相互作用履歴だけでなく、テキスト、画像、動画といった複雑なデータ分布をモデル化し、サンプリングする能力を発展させてきた。"
"大規模言語モデルは、ユーザーの好みや問い合わせを理解し、それに基づいて推薦を行うことができる。"
"多様なデータモダリティ(テキスト、画像、動画など)を統合することで、より正確で関連性の高い推薦が可能になる。"