Khái niệm cốt lõi
본 논문에서는 대규모 언어 모델(LLM)에서 사용되는 검색 기반 증강(Retrieval Augmentation) 기술을 시계열 예측 모델에 적용하여 예측 정확도를 향상시키는 RAF(Retrieval Augmented Forecasting) 프레임워크를 제안합니다.
Tóm tắt
검색 기반 증강을 활용한 시계열 예측 향상 방법: RAF 프레임워크 소개
본 논문에서는 시계열 기반 모델(TSFM)의 예측 정확도를 향상시키기 위해 검색 기반 증강(Retrieval Augmentation) 기술을 활용한 RAF(Retrieval Augmented Forecasting) 프레임워크를 제안합니다. RAF는 주어진 시계열 데이터와 유사한 패턴을 가진 과거 데이터를 검색하여 예측 모델의 입력으로 활용함으로써, 모델이 보다 정확한 예측을 수행하도록 돕습니다.
최근 대규모 언어 모델(LLM) 분야에서 검색 기반 증강(RAG) 기술이 주목받고 있으며, 이는 지식 집약적인 작업에서 모델의 생성 능력을 향상시키는 데 효과적임이 입증되었습니다.
시계열 데이터는 시간에 따라 변화하는 특성상 관련된 외부 맥락 정보 없이 정확한 예측이 어려울 수 있습니다.
기존의 시계열 예측 방법들은 지진, 금융 위기, 선거와 같은 드문 사건들을 예측하는 데 어려움을 겪어 왔습니다.
RAF는 시계열 데이터베이스에서 주어진 쿼리와 유사한 시계열을 검색하고, 검색된 시계열을 모델의 입력으로 활용하여 예측을 수행합니다.
주요 구성 요소
인덱싱 및 데이터베이스 구축: 각 데이터 도메인(데이터 세트)에 특정된 데이터베이스를 구축합니다.
매칭 및 유사도 측정: 쿼리 시계열과 데이터베이스 내 시계열 간의 유사도를 측정하여 가장 유사한 시계열을 검색합니다. 본 논문에서는 임베딩 유사도를 기반으로 ℓ2 norm을 유사도 측정 기준으로 사용합니다.
인스턴스 정규화: 훈련 데이터와 테스트 데이터 간의 분포 변화를 완화하기 위해 인스턴스 정규화를 적용합니다.
검색 쿼리 형성: 검색된 시계열을 쿼리 시계열과 연결하여 모델의 입력으로 사용합니다.