核心概念
RS-Mambaは、超高解像度リモートセンシング画像の密度予測タスクにおいて、線形計算量で大域的な特徴をモデル化することができる。
摘要
本論文では、超高解像度リモートセンシング画像の密度予測タスクに対して、RS-Mambaを提案している。
- 超高解像度リモートセンシング画像は、非常に高い空間解像度を持つため、個々のオブジェクトや複数のオブジェクト間の大規模な空間的特徴が重要となる。
- 畳み込みニューラルネットワークモデルは局所的な畳み込み演算のため、大域的な特徴をモデル化するのが困難である。
- トランスフォーマーベースのモデルは大域的なモデル化能力を持つが、大規模な超高解像度画像を処理するのに計算量が二次的に増大するという課題がある。
- 大規模な画像を小さなパッチに分割する一般的な手法では、大域的な文脈情報が失われてしまう。
- RS-Mambaは、線形計算量で大域的な特徴をモデル化することができ、大規模な超高解像度画像を効果的に処理することができる。
- RS-Mambaは、全方向選択走査モジュールを用いて、複数の方向から大域的な特徴をモデル化する。
- 実験の結果、RS-Mambaは単純な構造と学習アプローチにもかかわらず、超高解像度リモートセンシングの密度予測タスクにおいて最先端の性能を達成した。
統計資料
超高解像度リモートセンシング画像は、個々のオブジェクトや複数のオブジェクト間の大規模な空間的特徴を持つ。
畳み込みニューラルネットワークモデルは局所的な畳み込み演算のため、大域的な特徴をモデル化するのが困難である。
トランスフォーマーベースのモデルは大域的なモデル化能力を持つが、大規模な超高解像度画像を処理するのに計算量が二次的に増大する。
大規模な画像を小さなパッチに分割する一般的な手法では、大域的な文脈情報が失われてしまう。
引述
"RS-Mambaは、線形計算量で大域的な特徴をモデル化することができ、大規模な超高解像度画像を効果的に処理することができる。"
"RS-Mambaは、全方向選択走査モジュールを用いて、複数の方向から大域的な特徴をモデル化する。"