Conceitos Básicos
HART는 자기회귀 모델과 확산 모델의 장점을 결합하여 고품질 이미지를 효율적으로 생성하는 새로운 방법입니다.
Resumo
HART: 하이브리드 자기회귀 트랜스포머를 사용한 효율적인 비주얼 생성
본 연구 논문에서는 이미지 생성 분야에서 확산 모델에 필적하는 품질을 유지하면서도 훨씬 빠른 속도를 자랑하는 자기회귀 모델인 HART(Hybrid Autoregressive Transformer)를 제안합니다.
HART는 이미지의 연속적인 잠재 공간을 이산적인 토큰과 잔차 토큰으로 분해하는 하이브리드 토큰화 기법을 사용합니다. 이산적인 토큰은 전체적인 이미지 구조를 나타내는 반면, 잔차 토큰은 이미지의 세부적인 정보를 담고 있습니다. HART는 이산적인 토큰을 모델링하기 위해 확장 가능한 해상도의 자기회귀 트랜스포머를 사용하고, 잔차 토큰은 효율적인 잔차 확산 프로세스를 통해 학습됩니다.