本論文では、Click2Trimapと呼ばれる新しいモデルを提案している。このモデルは、ユーザーのクリック入力を利用して高品質なトリマップを生成することができる。
まず、トリマップ予測をクリックベースの3クラスインタラクティブセグメンテーションタスクとして定式化し、Iterative Three-class Training Strategy (ITTS)を提案している。ITTSは、トリマップの3つのクラスを個別に扱うことで、効果的にトリマップを予測することができる。
さらに、トリマップの未知領域の正解率を高めるため、Conditioned Unknown Prioritized Simulation (CUPS)を導入している。CUPSは、未知領域への優先的なクリック付与により、マッティングの精度を向上させる。
実験の結果、Click2Trimapは既存のクリックベースのマッティング手法を大幅に上回る性能を示し、わずか5秒程度の操作で高品質なトリマップとアルファマットを生成できることが確認された。また、トリマップベースの動画マッティング手法との統合も可能であり、動画マッティングの効率化にも貢献できる。
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Chenyi Zhang... a las arxiv.org 04-02-2024
https://arxiv.org/pdf/2404.00335.pdfConsultas más profundas