Основні поняття
본 연구는 원격 탐사 이미지에서 건물 추출과 변화 탐지 작업을 통합하는 일반적인 기반 모델 RSBuilding을 제안한다. RSBuilding은 다중 레벨 특징 샘플러와 작업 프롬프트 기반 교차 주의 디코더를 통해 작업 간 시너지를 활용하고 다양한 장면에 걸쳐 일반화 능력을 향상시킨다.
Анотація
본 연구는 원격 탐사 이미지에서 건물 추출과 변화 탐지 작업을 통합하는 일반적인 기반 모델 RSBuilding을 제안한다.
- 강력한 Transformer 기반 인코더를 통해 이미지 특징을 추출하고, 다중 레벨 특징 샘플러를 통해 다양한 스케일의 정보를 증강한다.
- 작업 프롬프트 기반 교차 주의 디코더를 도입하여 작업 간 시너지를 활용하고 공간-시간적 정보를 통합한다.
- 일부 작업에 대한 감독 정보가 부족한 경우에도 모델이 원활하게 수렴할 수 있도록 연합 학습 전략을 개발했다.
- 약 245,000장의 이미지로 구성된 대규모 RSBuilding 데이터셋을 구축하여 모델을 학습하고, WHU, INRIA, LEVIR-CD, S2Looking, BANDON 등의 데이터셋에서 우수한 성능을 보였다.
Статистика
건물 추출 작업에서 제안 모델은 WHU 데이터셋에서 92.15%의 IoU, INRIA 데이터셋에서 82.68%의 IoU를 달성했다.
변화 탐지 작업에서 제안 모델은 LEVIR-CD 데이터셋에서 86.19%의 IoU, S2Looking 데이터셋에서 52.46%의 IoU를 달성했다.
BANDON 데이터셋에서 건물 추출 작업의 IoU는 80.55%, 변화 탐지 작업의 IoU는 58.68%를 기록했다.
Цитати
"본 연구는 원격 탐사 이미지에서 건물 추출과 변화 탐지 작업을 통합하는 일반적인 기반 모델 RSBuilding을 제안한다."
"RSBuilding은 다중 레벨 특징 샘플러와 작업 프롬프트 기반 교차 주의 디코더를 통해 작업 간 시너지를 활용하고 다양한 장면에 걸쳐 일반화 능력을 향상시킨다."