核心概念
GPTRecは、Next-K戦略を使用して訓練されることで、Top-K戦略と同等の効果を達成する。
要約
最近の変形Transformerモデル(BERT4RecやSASRec)は、NDCGなどの精度ベースのメトリクスに基づいて次アイテム予測タスクで最先端のパフォーマンスを達成しています。一方、GPTRecモデルは、Top-Kモデルとは異なるNext-K戦略を使用し、従来のTop-K推奨事項と比較してより複雑なアイテム間依存性に対応できます。この研究では、GPTRecが教師生徒法によって訓練された場合、Next-K戦略を使用した場合でも同等の効果を達成できることが示されました。これは、次世代シーケンシャル推奨モデルにおける新しいトレーニング手法の重要性を強調しています。
統計
最初からすべて表示されます。
それらがありません。
引用
"Sequential recommender models work with chronologically ordered sequences of interactions, to predict the next interaction in the sequence."
"Our proposed training scheme, in principle, can align the model with any measurable recommendation metric."
"Inspired by RLHF, we propose a reinforcement learning-based approach."