本文提出了SyncTalk,这是一种基于神经辐射场(NeRF)的高度同步的语音驱动说话头合成方法。SyncTalk包含三个主要模块:
Face-Sync Controller:
Head-Sync Stabilizer:
Portrait-Sync Generator:
通过大量实验和用户研究,SyncTalk在同步性和逼真度方面显著优于现有方法,并且能够以50 FPS的速度生成高分辨率的说话头视频。
Til et andet sprog
fra kildeindhold
arxiv.org
Vigtigste indsigter udtrukket fra
by Ziqiao Peng,... kl. arxiv.org 04-30-2024
https://arxiv.org/pdf/2311.17590.pdfDybere Forespørgsler