Temel Kavramlar
ポリープ分割の精度向上のために、変換器エンコーダを用いた逆アテンション機構を導入したRTA-Formerネットワークを提案する。
Özet
本論文では、ポリープ分割のための新しいネットワークアーキテクチャであるRTA-Formerを提案している。RTA-Formerは、変換器エンコーダをバックボーンとして採用し、デコーダ部に逆アテンション(RA)機構を統合することで、ポリープの境界領域の分割精度を向上させている。
具体的には以下の3つの主要な貢献がある:
- 新しいネットワークアーキテクチャの提案: 変換器エンコーダで生成された階層的特徴を利用し、逆変換アテンション(RTA)機構を組み込むことで、ポリープの境界領域に注目できるようにした。
- 柔軟なバックボーンネットワーク: 提案するデコーダアーキテクチャは、計算コストと性能のバランスを取るために、異なるサイズのPVTバックボーンと組み合わせることができる。
- 複数のデータセットでの性能評価: 5つのポリープ分割データセットで評価を行い、提案手法がState-of-the-Artの性能を達成することを示した。また、RTA-Formerの汎化性能の高さも確認できた。
İstatistikler
ポリープ分割タスクにおいて、RTA-Former-MモデルはKvasir-SEGデータセットでDICE 0.921、mIoU 0.873を達成し、最高性能を示した。
RTA-Former-Lモデルは、CVC-ClinicDBデータセットでDICE 0.938、mIoU 0.888を記録し、優れた性能を発揮した。
全体的に、RTA-Formerモデルはさまざまなデータセットで高い汎化性能を示し、ポリープ分割の精度向上に貢献することが確認された。
Alıntılar
"RTA-Formerは、変換器エンコーダをバックボーンとして採用し、デコーダ部に逆アテンション(RA)機構を統合することで、ポリープの境界領域の分割精度を向上させている。"
"RTA-Formerの提案するデコーダアーキテクチャは、計算コストと性能のバランスを取るために、異なるサイズのPVTバックボーンと組み合わせることができる。"
"RTA-Formerは5つのポリープ分割データセットで評価を行い、State-of-the-Artの性能を達成し、高い汎化性能も確認された。"