核心概念
大規模言語モデル(LLM)を使用した生成的ユーザーシミュレーターは、人間の行動をシミュレートする能力に関する新しいプロトコルを導入します。
统计
大規模言語モデル(LLM)による成功率:0.24(gpt-4)、0.53(gpt-4 + DI + PP)
エントロピー:6.42(text-davinci, ItemsTalk)
相関係数:0.75(gpt-4 + DI + PP, 頻出アイテム)
引用
"Simulators tend to favor mentioning popular items."
"Endowing simulators with varying levels of pickiness improves correlation."
"Model choice and prompting strategies may enhance realism in simulator preference."