본 연구는 연속 환경에서의 비전-언어 네비게이션(VLN-CE) 작업에서 발생하는 충돌 문제를 다룬다. 기존 VLN-CE 연구들은 주로 이산 환경의 VLN 기술을 연속 환경으로 확장하는 데 초점을 맞추었지만, 충돌 문제를 간과하였다. 이로 인해 에이전트가 계획된 경로에서 벗어나거나 장애물 영역에 갇혀 네비게이션 작업에 실패하는 경우가 많았다.
이를 해결하기 위해 본 연구는 VLN-CE 내에서 발생할 수 있는 충돌 시나리오를 세 가지로 분류하였다: 1) 웨이포인트 충돌 - 예측된 웨이포인트가 장애물 영역에 위치하는 경우, 2) 네비게이션 충돌 - 다음 선택된 웨이포인트로 이동하는 과정에서 장애물을 만나는 경우, 3) 동적 충돌 - 보안 또는 프라이버시 문제로 인해 선택된 웨이포인트가 비 네비게이블 상태가 되는 경우.
이를 해결하기 위해 본 연구는 Safe-VLN 알고리즘을 제안한다. Safe-VLN은 두 가지 핵심 구성 요소를 포함한다: 1) 웨이포인트 예측기는 시뮬레이션된 2D LiDAR 점유 마스크를 활용하여 장애물 영역에 위치한 웨이포인트를 제거하고, 2) 네비게이터는 '재선택' 전략을 사용하여 에이전트가 충돌 영역에 갇히는 것을 방지한다.
실험 결과, Safe-VLN은 기존 VLN-CE 알고리즘에 비해 네비게이션 성능을 크게 향상시키고, 충돌 발생을 통계적으로 유의미하게 감소시켰다.
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Lu Yue,Dongl... at arxiv.org 04-15-2024
https://arxiv.org/pdf/2311.02817.pdfDeeper Inquiries