本文提出了一種混合蟒蛇網路(HMNet)來解決少量樣本分割(FSS)任務。
首先,作者指出直接使用標準蟒蛇模型進行支持和查詢特徵融合會存在兩個問題:
支持特徵遺忘問題:在掃描查詢特徵時,隱藏狀態中的支持特徵比例會逐漸降低,導致許多查詢像素無法充分利用支持信息。
類內差距問題:查詢前景雖然與支持前景屬於同一類,但可能存在視覺差異,查詢前景可能更傾向於融合自身特徵而非支持特徵。
為解決上述問題,作者提出了混合蟒蛇模塊(HMB),包括:
支持特徵回顧蟒蛇(SRM):定期回顧支持特徵,確保隱藏狀態中始終包含豐富的支持信息。
查詢特徵截斷蟒蛇(QIM):阻止查詢像素之間的相互作用,強制它們融合更多支持特徵。
實驗結果表明,HMNet在PASCAL-5i和COCO-20i基準上均優於現有最佳方法,分別提升了2.2%和3.2%的平均IoU。
翻译成其他语言
从原文生成
arxiv.org
更深入的查询