核心概念
本研究は、事前の密な視点情報や正確なカメラパラメータを必要とせずに、疎視点かつ姿勢フリーの条件下で効率的に3Dシーンを再構築する手法を提案する。
摘要
本研究は、InstantSplatと呼ばれる新しい枠組みを提案している。InstantSplatは、密な3Dステレオモデルから得られる3Dプライオアを活用し、疎視点かつ姿勢フリーの条件下でも1分以内に3Dシーンの再構築と新規視点合成を実現する。
具体的には以下の2つのモジュールから構成される:
- 粗幾何初期化(CGI)モジュール:
- 事前学習済みの密なステレオモデルを用いて、訓練用の全ビューにわたる初期的な3Dジオメトリと、カメラパラメータを迅速に推定する。
- 高速3Dガウシアン最適化(F-3DGO)モジュール:
- CGIモジュールで得られた初期化された3Dガウシアンと、カメラパラメータを同時に最適化する。
- これにより、姿勢推定精度と描画品質を大幅に向上させることができる。
実験では、大規模な屋外データセットTanks & Templesを用いて評価を行った。その結果、InstantSplatは従来手法と比べて、SSIMを32%向上させつつ、絶対軌跡誤差(ATE)を80%削減することができた。これにより、InstantSplatが疎視点かつ姿勢フリーの条件下でも有効な解決策であることが示された。
统计
提案手法(InstantSplat)の処理時間は37秒(訓練)、SSIMは0.89
Nope-NeRFの処理時間は約100分、SSIMは0.68
NeRFmmの処理時間は約30分、SSIMは0.53
CF-3DGSの処理時間は60秒、SSIMは0.59