이 연구는 복합적인 대화형 지시 따르기 작업을 해결하기 위한 다단계 합성 추론 에이전트(MCR-Agent)를 제안한다. MCR-Agent는 다음과 같은 3단계로 구성된다:
이러한 다단계 구조를 통해 에이전트는 복잡한 작업을 효과적으로 처리할 수 있다. 특히 마스터 정책은 물체 인코딩 모듈(OEM)을 활용하여 탐색 중 상호작용 대상 물체를 파악한다.
실험 결과, MCR-Agent는 기존 방식 대비 높은 효율성을 보이며, 특히 새로운 환경에서 우수한 성능을 달성했다. 이는 다단계 합성 추론 접근법이 복합적인 대화형 지시 따르기 작업에 효과적임을 보여준다.
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Suvaansh Bha... alle arxiv.org 03-14-2024
https://arxiv.org/pdf/2308.09387.pdfDomande più approfondite