核心概念
RSDは、LLM推論を加速する革新的な木ベースの仮説的デコーディング手法であり、従来の手法を大幅に上回る性能を示す。
摘要
最近の研究では、大規模言語モデル(LLMs)の推論処理における自己回帰デコーディングの制約が問題とされています。本研究では、再帰的仮説的デコーディング(RSD)アルゴリズムを提案し、木構造を活用した効率的なサンプリング手法であるRSD-CとRSD-Sを導入しています。さらに、再帰的拒否サンプリングにより、木構造の検証とターゲットモデル分布の正確な回復が可能であることを示しています。実験結果から、RSD-Sが他の手法よりも優れた性能を示すことが明らかになっています。
统计
RSDはSDやSpecTrよりもブロック効率やMBSUで常に優れている。
RSD-Sは高い予算でもSDよりもブロック効率やMBSUで勝利している。
トークンレートでは、RSD-Sが他の基準線よりも厳密に優れている。
引用
"RSDは、LLM推論を加速する革新的な木ベースの仮説的デコーディング手法であり、従来の手法を大幅に上回る性能を示す。"
"再帰的拒否サンプリングは、木構造内で同じ親シーケンスから生成されたトークンがp(·|τ(k)l)から置換なしサンプリングされることを示しています。"