本研究では、ロボットが家庭環境で効率的に物体を検索できるよう、常識シーングラフベースのターゲット位置特定手法(CSG-TL)を提案した。CSG-TLは、事前に構築された地図上の固定アイテムの空間的関係と、大規模言語モデルから得られる物体単位の常識知識を統合したシーングラフモデルを活用する。
まず、ScanNetデータセットから常識シーングラフ(CSG)を構築する。CSGはノードが物体、エッジが物体間の空間的・機能的関係を表す。次に、ターゲット物体をCSGに追加し、ターゲットとその他物体の相関関係を学習するCSG-TLモデルを構築する。
CSG-TLは、ターゲットとCSG内の他物体の相関確率を推定する。この確率に基づいて、ターゲットの存在可能性の高い領域を特定し、ロボットの効率的な検索を支援する。
実験では、ScanNetデータセットとAI2THORシミュレータを用いて、CSG-TLの優れた性能を確認した。さらに、CSG-TLを組み込んだ物体検索フレームワークCSG-OSを提案し、シミュレーション実験とジャッカルロボットによる実世界実験で高い検索成功率を示した。
本手法は、ロボットが家庭環境で物体を効率的に検索するための重要な技術である。今後は、より複雑な環境や言語理解の向上など、適応範囲の拡大に取り組む予定である。
Para Outro Idioma
do conteúdo original
arxiv.org
Principais Insights Extraídos De
by Wenqi Ge,Cha... às arxiv.org 04-02-2024
https://arxiv.org/pdf/2404.00343.pdfPerguntas Mais Profundas