이 연구에서는 푸리에 신경망 연산자(FNO)를 활용하여 다양한 크기의 이미지를 동시에 학습할 수 있는 새로운 딥러닝 프레임워크를 제안한다. FNO는 입력 이미지 크기에 불변하는 특성을 가지고 있어, 기존 합성곱 신경망(CNN)과 달리 네트워크 구조를 변경하지 않고도 다양한 크기의 이미지를 처리할 수 있다.
제안된 프레임워크의 핵심은 FNO 레이어 출력에 정적 최대 풀링(static max pooling)을 적용하는 것이다. 이를 통해 입력 이미지 크기와 무관한 고정 크기의 특징 벡터를 생성할 수 있다. 이 특징 벡터는 분류기의 입력으로 사용된다.
연구팀은 3차원 디지털 다공성 매체의 투과율 예측 문제를 벤치마크 사례로 활용하였다. 실험 결과, 제안된 프레임워크는 다양한 크기의 다공성 매체 이미지에 대해 우수한 예측 성능을 보였다(R2 score 0.96809). 또한 기존 접근법과 비교했을 때, 제안된 방식이 다양한 크기의 이미지에 대해 더 효과적인 것으로 나타났다.
추가적으로 연구팀은 FNO 레이어의 하이퍼파라미터(예: 푸리에 모드 수, 채널 폭)가 모델 성능에 미치는 영향을 분석하였다. 이를 통해 제안된 프레임워크의 일반화 능력을 향상시킬 수 있는 방향을 제시하였다.
翻譯成其他語言
從原文內容
arxiv.org
深入探究