Centrala begrepp
LLM을 활용하여 보행자의 과거 및 미래 움직임 패턴을 모델링하고, 이를 통해 보행자 궤적을 정확하게 예측하는 방법을 제안한다.
Sammanfattning
이 논문은 보행자 궤적 예측을 위해 LLM(Large Language Model)을 활용하는 새로운 접근법인 LG-Traj를 소개한다.
- 과거 관측 궤적과 LLM이 생성한 과거 움직임 단서를 활용하여 보행자의 움직임 패턴을 모델링한다.
- 미래 궤적 클러스터링을 통해 얻은 미래 움직임 단서를 추가로 활용한다.
- 움직임 인코더와 소셜 디코더로 구성된 트랜스포머 기반 아키텍처를 사용하여 보행자의 움직임 패턴과 주변 보행자와의 상호작용을 모델링한다.
- 관측 궤적을 특이값 분해를 통해 증강하여 표현 학습을 향상시킨다.
제안 방법은 ETH-UCY와 SDD 데이터셋에서 기존 최신 방법들을 능가하는 성능을 보였다. 또한 다양한 실험을 통해 LLM 기반 움직임 단서, 위치 인코딩, 궤적 증강 등의 핵심 구성 요소가 성능 향상에 중요한 역할을 함을 입증하였다.
Statistik
보행자 궤적 예측에서 평균 변위 오차(ADE)가 20% 이상 감소하였다.
최종 변위 오차(FDE)가 3% 이상 감소하였다.
Citat
"LLM을 활용하여 보행자의 과거 및 미래 움직임 패턴을 효과적으로 모델링할 수 있다."
"움직임 인코더와 소셜 디코더로 구성된 트랜스포머 기반 아키텍처가 보행자 움직임 패턴과 상호작용을 잘 포착한다."
"관측 궤적의 특이값 분해 기반 증강이 표현 학습을 향상시킨다."