얼굴 교체를 위한 확산 모델을 소개하는 기술 보고서이다. IP-Adapter, ControlNet 및 Stable Diffusion의 inpainting 파이프라인과 같은 세 가지 구성 요소로 구성된 기본 프레임워크를 사용하여 얼굴 특징 인코딩, 다중 조건 생성 및 얼굴 inpainting을 수행한다. 또한 얼굴 가이드 최적화와 CodeFormer 기반 블렌딩을 도입하여 생성 품질을 더욱 향상시킨다. DreamBooth-LoRA와 같은 최근 경량 사용자 정의 방법을 사용하여 신원 일관성을 보장하고, 안정적인 확산의 inpainting 능력을 활용하여 얼굴 정렬을 보정한다. 실험은 CelebA-HQ에서 수행되었으며, 얼굴 정렬과 신원 충실성을 양적으로 보여준다.
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Feifei Wang lúc arxiv.org 03-05-2024
https://arxiv.org/pdf/2403.01108.pdfYêu cầu sâu hơn