本論文は、少数の入力画像から高速かつ高品質な新規ビューを合成する手法を提案している。
まず、構造から運動(SfM)と深層学習ベースの密な幾何情報を活用して、マルチレベルのボクセルグリッドを構築する。次に、Annealing Signed Distance Function (ASDF)と呼ばれる新しい幾何学的な正則化手法を提案する。ASDF損失は、訓練の初期段階では表面を強く滑らかにし、後期には詳細な幾何情報を捉えられるように徐々に緩和する。これにより、少数の入力画像でも安定した最適化が可能となる。
提案手法は、既存手法と比べて最大45倍高速な訓練時間を実現しつつ、ScanNetデータセットやNeRF-Realデータセットにおいて同等の性能を示す。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Byeongin Jou... a las arxiv.org 04-01-2024
https://arxiv.org/pdf/2403.19985.pdfConsultas más profundas