本論文は、人間とLM(言語モデル)の協働における因果推論の問題を扱っている。人間とLMの協働では、LMが提案したテキストセグメントを人間が編集・応答するという相互作用が典型的である。効果的な人間-LM協働には、過去の人間-LM対話から、編集スタイルや応答スタイルなどの効果的なテキストベースの相互作用戦略を見出すことが不可欠である。
この目的は本質的に因果的であり、「人間が異なる編集/洗練戦略を採用した場合、協働の結果はどのように変化するか」という因果的な「what-if」の問題に駆動されている。この因果推論の問題に対する主な課題は、適切な因果推定量を定式化することである。従来の平均処理効果(ATE)推定量は、高次元のテキストベースの処理に適用できないという問題がある。
そこで本論文は、新しい因果推定量である「Incremental Stylistic Effect (ISE)」を提案する。ISEは、テキストの編集が及ぼすスタイルの変化の平均的影響を特徴づけるものである。これにより、高次元のテキストベースの処理に起因する問題を解決する。本論文では、ISEの非parametric同定条件を確立し、CausalCollabアルゴリズムを開発して、様々な人間-LM協働シナリオでISEを推定する。
実証研究の結果、CausalCollabは、交絡要因を効果的に軽減し、競合手法に比べて反事実的な推定を大幅に改善することを示している。本研究の成果は、人間がLMとの協働において、より効果的な編集戦略を学習するのに役立つ。
Till ett annat språk
från källinnehåll
arxiv.org
Djupare frågor