이 연구는 복합적인 대화형 지시 따르기 작업을 해결하기 위한 다단계 합성 추론 에이전트(MCR-Agent)를 제안한다. MCR-Agent는 다음과 같은 3단계로 구성된다:
이러한 다단계 구조를 통해 에이전트는 복잡한 작업을 효과적으로 처리할 수 있다. 특히 마스터 정책은 물체 인코딩 모듈(OEM)을 활용하여 탐색 중 상호작용 대상 물체를 파악한다.
실험 결과, MCR-Agent는 기존 방식 대비 높은 효율성을 보이며, 특히 새로운 환경에서 우수한 성능을 달성했다. 이는 다단계 합성 추론 접근법이 복합적인 대화형 지시 따르기 작업에 효과적임을 보여준다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Suvaansh Bha... a las arxiv.org 03-14-2024
https://arxiv.org/pdf/2308.09387.pdfConsultas más profundas