PuLIDは、IDフィデリティを高く維持しつつ、元のモデルの振る舞いへの影響を効果的に低減する新しいチューニングフリーのIDカスタマイズ手法を提案する。
テキストから画像への拡散モデルを、人間の効用を最大化することで整列させる。ペアの好み情報を収集する必要がなく、単純なイメージごとのバイナリフィードバックのみで学習できる。
参照画像に基づいて、人間が解釈可能で転用可能なプロンプトを自動的に生成し、様々なテキストから画像生成モデルに適用することができる。
ユーザープロンプトを自動的に最適化することで、テキストから画像への一貫性を向上させる