Core Concepts
확산 모델의 역확산 과정에서 발생하는 특이점을 이론적으로 분석하고, 이를 해결하기 위한 플러그인 방식의 SingDiffusion 방법을 제안한다.
Abstract
이 논문은 확산 모델의 역확산 과정에서 발생하는 특이점을 이론적으로 분석하고, 이를 해결하기 위한 방법을 제안한다.
- 이론적 분석:
- 역확산 과정이 가우시안 분포로 근사될 수 있음을 증명
- t=0과 t=1에서 발생하는 특이점을 분석
- t=1에서의 특이점은 제거 가능
- t=0에서의 특이점은 고유한 특성
- SingDiffusion 방법 제안:
- t=1에서의 특이점을 해결하기 위해 x-prediction 모델 ¯yθ를 학습
- 기존 확산 모델과 플러그인 방식으로 통합하여 사용 가능
- 평균 밝기 문제를 해결하고 전반적인 이미지 품질 향상
- 실험 결과:
- 다양한 확산 모델에 SingDiffusion을 적용하여 평균 밝기 문제 해결
- 기존 확산 모델 대비 FID 및 CLIP 점수 향상
Stats
평균 밝기 문제를 겪는 기존 확산 모델들의 평균 밝기 값:
"Solid white background": 141.43, 150.52
"Solid black background": 83.09, 99.67
SingDiffusion 적용 시 평균 밝기 값:
"Solid white background": 212.59, 227.43
"Solid black background": 3.04, 0.29
Quotes
"Improperly dealing with such singularities leads to an average brightness issue in applications, and limits the generation of images with extreme brightness or darkness."
"To address this challenge, Guttenberg et al. [9] add extra offset noise during the training process to allow the network could learn the overall brightness changes of the image. Unfortunately, the offset noise usually disrupts the pre-defined marginal probability distribution and further invalidates the original sampling formula."