Core Concepts
大規模言語モデル(LLM)の推論能力を活用し、思考グラフ(GoT)フレームワークを用いてユーザーの短期、長期、協調的な嗜好情報を統合することで、逐次推薦の精度を向上させることができる。
本論文は、逐次推薦システムにおける大規模言語モデル(LLM)の活用に関する研究論文である。従来の逐次推薦システムは、ユーザーの行動履歴に基づいて次の行動を予測するが、データセットの知識の限界により、その精度には限界があった。そこで本論文では、LLMの高度な言語理解と生成能力を活用し、ユーザーの行動履歴からより多くの情報を抽出し、推薦精度を向上させることを目的とする。
従来手法の課題
従来のニューラル逐次推薦システムは、ユーザーの行動履歴のシーケンスモデリング能力に依存しており、テキスト情報などを十分に活用できていない点が課題として挙げられる。また、LLMを用いた推薦システムにおいても、LLMの推論能力を十分に活用できていないケースが多い。
GOT4Rec の提案
本論文では、LLMの推論能力を最大限に活用し、ユーザーの行動履歴に含まれる多様な情報を効果的に統合する逐次推薦手法であるGOT4Recを提案する。GOT4Recは、思考グラフ(GoT)フレームワークを用いることで、ユーザーの短期的な嗜好、長期的な嗜好、そして類似ユーザーからの協調的な嗜好という3つの重要な情報源をユーザーの行動履歴から抽出する。
GOT4Rec の構成要素
思考グラフ: LLMとの対話をモデル化し、推論プロセスを表現する。各頂点は思考(thought)を表し、推薦ステップの解決策や関連するグローバル情報をカプセル化する。
短期推論プロセス: ユーザーの行動履歴から直近のインタラクションを抽出し、ゼロショットCoTプロンプト戦略を用いてユーザーの短期的な嗜好を捉え、ユーザーが好みそうな3つのカテゴリを特定する。
長期推論プロセス: ユーザーの行動履歴全体を入力とし、ゼロショットCoTプロンプト戦略を用いてユーザーの長期的な嗜好を捉える。
協調推論プロセス: 類似ユーザーの行動履歴を取得し、ゼロショットCoTプロンプト戦略を用いて、現在のユーザーが興味を持ちそうなアイテムを生成する。
多層検索モジュール: 類似ユーザーの行動履歴を検索するシーケンスレベル検索と、推薦アイテムがデータセット内の正解とどの程度一致するかを評価するアイテムレベル検索の2段階のアプローチを採用する。
実験結果
3つのデータセットを用いた実験の結果、GOT4Recは従来のニューラル逐次モデルとLLMプロンプト戦略の両方を上回る性能を示した。特に、食品データセットにおいては、NDCG@10でCoT-SCを73.93%、HR@5で67.49%上回るという大幅な改善が見られた。
結論
GOT4Recは、LLMの高度な推論能力を活用し、ユーザーの短期、長期、協調的な嗜好情報を統合することで、逐次推薦の精度を向上させることができる。
Stats
食品データセットにおいて、GOT4RecはNDCG@10でCoT-SCを73.93%、HR@5で67.49%上回るという大幅な改善が見られた。