NeRFベースの表現を使用して、ピクセル単位のVLM特徴を直接エンコードすることで、複雑な追加モジュールを必要とせずに、オープンセットの3Dセマンティック分割を実現する。さらに、NeRFの新規ビュー合成機能を活用して、分割性能を向上させる。