מושגי ליבה
提案されたSatMAE++アプローチは、マルチスケール事前学習を活用し、光学およびマルチスペクトル画像において優れたパフォーマンスを実現します。
תקציר
最近の非監督学習の進歩により、大規模なビジョンモデルが未ラベルデータで事前学習することで有望な結果を達成しています。リモートセンシングデータでは、標準的な自然画像データセットとは異なり、さまざまなセンサーテクノロジーから取得されるため、多様なスケール変動やモダリティが存在します。提案されたSatMAE++アプローチは、複数のスケール情報を活用したマルチスケール事前学習を行い、光学およびマルチスペクトル画像に対して効果的です。これにより、すべてのデータセットで最先端のパフォーマンスが達成されます。
סטטיסטיקה
SatMAE++はBigEarthNetデータセットで多ラベル分類タスクにおいて平均精度(mAP)の増加率2.5%を達成しました。
SatMAE++はViT-Largeバックボーンを使用してfMoW-Sentinelデータセットで最高精度得点63.23%を達成しました。
SatMAE++はUC-MercedデータセットでSatMAEに比べて約3.6%の改善をもたらしました。
ציטוטים
"Existing satellite image pre-training methods either ignore the scale information present in the remote sensing imagery or restrict themselves to use only a single type of data modality."
"Our proposed approach, named SatMAE++, performs multi-scale pre-training and utilizes convolution based upsampling blocks to reconstruct the image at higher scales making it extensible to include more scales."
"Extensive experiments on six datasets reveal the merits of proposed contributions, leading to state-of-the-art performance on all datasets."