大規模言語モデル(LLM)はドローンなどのロボットシステムの制御にますます使用されていますが、現実世界のアプリケーションで物理的な脅威や危害を引き起こすリスクは未解明です。本研究では、ドローン制御のための包括的なベンチマークを開発することにより、LLMの物理的安全性を評価する上での重要なギャップに対処します。
本稿では、従来のマルチステート制約カルマンフィルタ(MSCKF)の計算コストの課題を、新しい特徴管理手法を用いることで解決する高速マルチステートカルマンフィルタ(FMSCKF)を提案する。
ロボットが複雑な接触を伴うタスクをうまく実行するには、位置だけでなく力の制御も重要である。本稿では、人間の動作データからタスクに応じたコンプライアンスを学習する「適応型コンプライアンスポリシー(ACP)」を提案する。ACPは、接触力を最小限に抑えつつ正確なトラッキングを可能にする近似的なコンプライアンスプロファイルを学習することで、従来の visuomotor ポリシーよりも高い性能を実現する。
C3P-VoxelMapは、メモリ効率と計算効率を大幅に向上させながら、従来のボクセルマップよりも高い精度を実現する、LiDAR SLAMのための新しいボクセルマッピング手法である。
強化学習とダイナミック運動プリミティブを組み合わせた階層的なアプローチにより、動的環境下でも新しいタスクに対して適応的かつリアルタイムの軌道生成を実現する。
3D大規模言語モデルの命令フォロー能力を強化するため、ロバストな命令生成エンジンを用いて大規模な命令フォロー データを生成し、モデルの空間理解と物体参照・接地能力を向上させた。
本研究では、S-RRT*アルゴリズムと逆瞬時運動学を組み合わせることで、連続剛体マニピュレータの高品質な端末軌道を生成しつつ、効率的な障害物回避を実現する新しい手法を提案する。
拡散モデルを用いて、LIDARセンサ観測と任意の地図情報に基づいて、グローバルな位置推定と衝突回避経路計画を統合的に実現する。
BEVベースの特徴抽出ネットワークを深層強化学習に統合することで、自動運転システムが周辺環境をより包括的かつ構造化された理解を得られ、大幅な性能向上を実現する。
人間共存型環境でのタスク遂行を目的として、LLMを活用した主体的アシスタントロボット「AssistantX」を開発した。