본 논문에서는 비 파지 조작 작업에서 다양한 행동 정책을 학습하기 위해 확산 정책을 하이브리드 오프 정책 강화 학습 프레임워크에 통합하는 HyDo 알고리즘을 제안하며, 이를 통해 시뮬레이션 및 실제 로봇 실험에서 향상된 성능과 뛰어난 일반화 능력을 보여줍니다.
로봇 내비게이션에서 조건부 흐름 매칭(CFM) 기반의 새로운 접근 방식인 FlowNav는 기존의 확산 모델 기반 방법보다 훨씬 빠르게 정확한 동작 정책을 생성하여 실시간 애플리케이션에 적합합니다.
본 논문에서는 로봇의 이동 계획 및 제어를 위해 모델의 복잡도를 작업에 따라 적응적으로 조절하는 새로운 모델 예측 제어 (ACMPC) 방식을 제안합니다.
단순 모방 학습만으로는 정밀 조립과 같은 고정밀 작업을 수행하기에 충분하지 않으며, 잔차 강화 학습을 통해 행동 복제 모델을 개선하여 로봇의 조립 성공률을 높일 수 있다.
영화에서 사 réalisme 을 추구하면서 애니매트로닉스 분야에서 상당한 발전이 이루어졌으며, 특히 메카트로닉스 기술의 통합은 애니매트로닉스의 기능과 사실성을 향상시키는 데 중추적인 역할을 합니다.
본 논문에서는 매개변수가 동차 공간에 속하는 경우 그룹 이론적 관점에서 Fisher 정보 행렬(FIM) 및 Cramér-Rao 하한(CRB)을 이용한 매개변수 추정 방법을 제시합니다.
덱스미믹젠은 소수의 인간 시연 데이터에서 대규모의 로봇 조작 데이터를 자동으로 생성하는 시스템으로, 양손 능숙한 조작 작업을 수행하는 로봇의 모방 학습을 위한 데이터 부족 문제를 해결합니다.
본 논문에서는 로봇이 새로운 작업을 학습하는 동안 이전에 학습한 기술을 잊지 않고 효율적으로 여러 작업을 수행할 수 있도록 하는 희소 확산 정책 (SDP) 프레임워크를 제안합니다.
본 논문에서는 라이다 센서 데이터와 NMPC (비선형 모델 예측 제어) 기반 계획 프레임워크를 활용하여 폐색 환경에서 예측 불가능한 동적 장애물을 안전하게 회피하며 목표 지점까지 이동하는 로봇 주행 알고리즘을 제안합니다.
자기 지도 학습(SSL)은 동적 환경에서 기존의 지도 학습 및 강화 학습 방법보다 우수한 성능을 보이며, 라벨링된 데이터나 보상 함수 없이 로봇이 파지 전략을 실시간으로 학습하고 개선할 수 있도록 합니다.