本論文では、3次元点群の登録を高速かつロバストに行うためのFPGA向けの手法を提案している。
まず、PointNetを用いて点群の特徴を抽出する際のメモリ使用量を削減するため、入力点群を小さなタイルに分割して処理する手法を提案した。これにより、中間特徴マップの保持に必要なメモリ量をO(N)からO(B)に削減できる。さらに、重みの量子化手法LLTを適用することで、パラメータを全てオンチップに保持できるようにした。
次に、この軽量なPointNet特徴抽出器を基に、2つの点群登録手法の専用加速器コアを設計した。1つ目のPointLKCoreは、PointNetLKアルゴリズムを実装したものである。Jacobian計算の方法を改善することで、量子化の影響を抑えつつ高速に動作するようにした。2つ目のReAgentCoreは、ReAgentアルゴリズムを実装したものである。離散的な変換ステップを予測するアクターネットワークを統合し、対応点不要で効率的な登録を実現している。
提案手法をZCU104 FPGAボードで実装・評価した結果、ARM Cortex-A53 CPUに比べて44.08-45.75倍高速、Intel Xeon CPUやNvidia Jetsonボードに比べて1.98-11.13倍高速、Nvidia GeForce GPUに比べて163.11-213.58倍エネルギー効率的であることを示した。また、ノイズや大きな初期ズレに対してもロバストな性能を発揮し、15ms未満で良好な解を見つけられることを確認した。
إلى لغة أخرى
من محتوى المصدر
arxiv.org
الرؤى الأساسية المستخلصة من
by Keisuke Sugi... في arxiv.org 04-02-2024
https://arxiv.org/pdf/2404.01237.pdfاستفسارات أعمق