核心概念
本文提出了一種名為檢索增強預測(RAF)的框架,透過檢索和利用歷史時間序列數據中的相似模式來提高時間序列預測的準確性,特別是在零樣本預測和針對特定數據集進行微調的情況下。
論文概述
本論文介紹了一種名為檢索增強預測(RAF)的新框架,旨在提升時間序列基礎模型(TSFM)的預測準確性。RAF 的核心概念是利用檢索技術,從歷史時間序列數據中找到與當前預測目標相似的模式,並利用這些模式來增強預測過程。
研究背景
近年來,大型語言模型(LLM)的成功推動了其他模態基礎模型的發展,時間序列分析便是其中之一。時間序列基礎模型(TSFM)的出現,例如 Chronos,展現了在各種時間序列領域中實現高效零樣本預測的潛力。然而,時間序列數據的動態性和事件驅動特性對預測提出了挑戰,特別是在缺乏相關外部上下文或存在複雜模式和依賴關係的情況下。
RAF 框架
RAF 框架旨在解決上述挑戰,其核心思想是利用檢索增強生成(RAG)的原理,從外部數據庫中檢索與查詢相關的文檔,並將其整合到生成過程中。RAF 框架主要包含以下步驟:
索引和數據庫構建: 根據不同的數據域(數據集)構建專用的數據庫,用於存儲歷史時間序列數據。
匹配和相似性度量: 使用嵌入相似性作為度量標準,從數據庫中檢索與原始時間序列最匹配的時間序列。
實例標準化: 對原始時間序列和檢索到的時間序列進行實例標準化,以減輕訓練和測試數據之間的分佈偏移影響。
檢索查詢形成: 將檢索到的時間序列(包括檢索到的上下文和檢索到的未來)與標準化的原始上下文進行拼接,形成增強的時間序列,作為 Chronos 模型的輸入。
實驗結果
論文在兩個基準數據集上對 RAF 框架進行了評估,結果表明 RAF 在大多數數據集上均優於基準方法,特別是在零樣本預測和模型微調的情況下。此外,研究還發現模型規模對 RAF 的性能有顯著影響,較大的模型從檢索增強預測中受益更多。
主要貢獻
本論文的主要貢獻包括:
引入了 RAF 作為 TSFM 的一種原則性預測框架。
描述和研究了兩種 RAF 變體:樸素 RAF 和高級 RAF。
檢驗了 RAF 在兩種模型規模下的性能,揭示了其在不同模型能力下的有效性。
總結
RAF 框架提供了一種有效的方法,可以利用歷史時間序列數據中的相似模式來提高時間序列預測的準確性。該框架具有廣泛的適用性,可以應用於各種時間序列預測任務,特別是在需要適應不同的歷史數據上下文和預測需求的情況下。
统计
Chronos Mini 在無噪聲環境下也無法執行檢索任務。
在 Benchmark I 中,RAF 在 Weather、FRED-MD 和 ETTh1 數據集上表現最佳。
在 Benchmark II 中,RAF 在 Tourism (Quarterly) 和 Uber TLC 數據集上表現最佳。
Advanced RAF 在 Weather、ETTh1、FRED-MD 和 NN5 數據集上表現出顯著改進。