本論文は、データ効率的なGenerative Adversarial Networks (GANs)の一般化性能を向上させる新しい正規化手法CHAINを提案している。
まず、GANの一般化誤差を理論的に分析し、識別器の重み勾配を抑えることが重要であることを示した。次に、バッチ正規化(BN)をGANの識別器に適用する際の勾配爆発問題を指摘した。
そこで、CHAINでは、BNの中心化ステップをゼロ平均正則化に置き換え、スケーリングステップにリプシッツ連続性制約を導入することで、この問題を解決した。さらに、正規化された特徴と非正規化された特徴を適応的に補間することで、識別と一般化のバランスを取る。
理論的な分析により、CHAINが勾配を抑制し、訓練の安定性と一般化性能を向上させることを示した。実験結果では、CIFAR-10/100、ImageNet、低shot学習、高解像度少量データ生成タスクなどで、従来手法を大きく上回る性能を達成している。
Іншою мовою
із вихідного контенту
arxiv.org
Ключові висновки, отримані з
by Yao Ni,Piotr... о arxiv.org 04-02-2024
https://arxiv.org/pdf/2404.00521.pdfГлибші Запити