この論文は、テキストから画像を生成する自己回帰型モデルのスケーリングに関する研究論文である。特に、トークンの表現方法(離散/連続)と生成順序(ランダム/ラスタ)という2つの重要な設計要素が、モデルの性能とスケーリングに与える影響について詳細に分析している。
To Another Language
from source content
arxiv.org
Key Insights Distilled From
by Lijie Fan, T... at arxiv.org 10-18-2024
https://arxiv.org/pdf/2410.13863.pdfDeeper Inquiries