본 연구는 사용자 스케치를 활용하여 정밀한 이미지를 생성하는 방법을 제안합니다. 기존 방식의 한계를 극복하기 위해 다음과 같은 접근법을 도입했습니다:
스케치 어댑터: 입력 스케치를 세부적인 텍스트 임베딩으로 변환하여 공간 조건화의 한계를 극복합니다. 이를 통해 스케치의 의미적 의도를 보존하면서도 출력 이미지의 왜곡을 방지할 수 있습니다.
추상화 인식 시간 단계 샘플링: 스케치의 추상화 수준에 따라 시간 단계 샘플링 확률을 조절하여 출력 이미지의 품질과 스케치 충실도를 향상시킵니다.
차별화된 지도: 사전 학습된 스케치 기반 이미지 검색 모델의 지식을 활용하여 스케치와 사진의 세부적인 연관성을 강화합니다. 이를 통해 기존 방식의 한계인 공간 조건화로 인한 출력 왜곡을 해결할 수 있습니다.
이러한 접근법을 통해 본 연구는 사용자 스케치를 활용하여 정밀하고 사실적인 이미지를 생성할 수 있습니다. 특히 텍스트 프롬프트 없이도 단순한 스케치만으로도 원하는 이미지를 생성할 수 있습니다.
A otro idioma
del contenido fuente
arxiv.org
Ideas clave extraídas de
by Subhadeep Ko... a las arxiv.org 03-13-2024
https://arxiv.org/pdf/2403.07234.pdfConsultas más profundas