この論文は、テキストから画像を生成する自己回帰型モデルのスケーリングに関する研究論文である。特に、トークンの表現方法(離散/連続)と生成順序(ランダム/ラスタ)という2つの重要な設計要素が、モデルの性能とスケーリングに与える影響について詳細に分析している。
In un'altra lingua
dal contenuto originale
arxiv.org
Approfondimenti chiave tratti da
by Lijie Fan, T... alle arxiv.org 10-18-2024
https://arxiv.org/pdf/2410.13863.pdfDomande più approfondite