本論文では、JPEG圧縮画像の量子化係数を回復するための新しい手法であるDCTransformerを提案している。主な特徴は以下の通りである:
空間的および周波数的相関を捉えるための双方向アーキテクチャを持つ。これにより、量子化された係数の疎さに対処できる。
量子化行列の埋め込みと輝度-色度アラインメントヘッドを導入することで、幅広い圧縮品質因子に対応できる単一モデルを実現している。
DCTドメインでの学習を採用しており、これまでにないTransformerベースのモデルを提案している。
提案手法は、既存のピクセルドメインおよびDCTドメインの手法と比較して、優れた性能を示している。特に、ブロック化アーティファクトの除去に優れており、より自然な画像を生成できることが確認された。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Mingyu Ouyan... lúc arxiv.org 05-06-2024
https://arxiv.org/pdf/2308.09110.pdfYêu cầu sâu hơn