핵심 개념
大型語言模型 (LLM) 在處理需要多步驟推理的複雜知識查詢時仍面臨挑戰,本研究揭示了 LLM 在多跳查詢中存在的局限性,特別是模型在處理第二跳查詢時,可能因為第一跳查詢的結果解析過晚,導致後續層缺乏必要知識而無法正確預測答案。
Biran, E., Gottesman, D., Yang, S., Geva, M., & Globerson, A. (2024). Hopping Too Late: Exploring the Limitations of Large Language Models on Multi-Hop Queries. arXiv preprint arXiv:2406.12775v2.
本研究旨在探討大型語言模型 (LLM) 在處理多跳查詢時的內部機制,並分析其在該任務上的局限性。