後見人平均予測と最適輸送を組み合わせることで、完全な知覚指標の下で最小MSEを達成する。
従来の学習型画像圧縮(LIC)は、テストデータとトレーニングデータの違いにより性能が低下する問題がある。提案するCICは閉ループ構造を持ち、この問題を解決し、高画質な画像再構成を実現する。
ユーザーの要求に合わせて、局所的および全体的な編集を可能にする、テキストプロンプトと画像プロンプトを統合した画像編集手法を提案する。
グラフラプラシアン正則化子を用いた最大事後確率問題の解を展開することで、既知の良好なディノイザーから初期化された解釈可能な深層ディノイザーを構築する。
画像圧縮における率-歪み-分類(RDC)モデルを提案し、画像圧縮と視覚分析の間のトレードオフを最適化する統一的なフレームワークを提供する。
低光環境下の画像強化のためのRetinex理論に基づくMambaアーキテクチャの提案。従来のRetinex手法と深層学習手法の長所を組み合わせ、計算効率の高い2D選択走査モデルを導入することで、高品質な画像強化を実現する。
画像フォレンジックスと画像アンチフォレンジックスの競争に対して、深層学習を用いた画像修復手法を提案し、既存の画像改ざん検出モデルに対する有効性を示す。
提案するDCTransformerは、JPEG圧縮画像の量子化係数を効果的に回復することができる。
実世界の画像デノイジングのために、非対照学習に基づく拡散モデルを提案する。対応する清浄画像のペアが必要ないため、実世界の複雑な降雨パターンに適応できる。
エントロピー画像を利用することで、従来のグレースケール画像に比べてより多くのキーポイントを生成し、コピー移動型偽造検出の精度を向上させることができる。また、エントロピーレベルクラスタリングアルゴリズムを開発することで、キーポイントの非理想的な分布による処理の複雑化を抑えることができる。