본 연구는 신호 시간 논리(STL) 사양을 사용하여 복잡한 제어기의 행동을 모방하는 신경망 제어기를 학습하는 새로운 방법을 제안한다. 이를 위해 반례 기반 데이터 수집과 커버리지 측정을 활용하여 효율적인 학습을 달성한다.
연속적 도메인 무작위화(CDR)는 도메인 무작위화와 지속적 학습을 결합하여 시뮬레이션에서 순차적으로 무작위화 매개변수의 부분 집합을 학습함으로써 시뮬레이션-실제 전이를 향상시킨다.
대칭 계단 사전조건화는 병렬 궤적 최적화에서 선형 시스템의 성능을 향상시키는 중요한 방법이다.
입력 지연 없이 원활한 계산을 위한 강력한 튜브 기반 모델 예측 제어의 핵심 메시지는 로봇 조작 계획의 성능 향상과 응답 속도 향상입니다.
SVG-MPPI는 빠르게 변하는 다중 모달 최적 행동 분포를 처리하기 위한 새로운 MPPI 기반 SOC 방법으로, SVGD 방법을 활용하여 수렴 대상을 안내하여 닫힌 형태로 모드 탐색 솔루션을 찾을 수 있습니다.