この論文は、テキストから画像を生成する自己回帰型モデルのスケーリングに関する研究論文である。特に、トークンの表現方法(離散/連続)と生成順序(ランダム/ラスタ)という2つの重要な設計要素が、モデルの性能とスケーリングに与える影響について詳細に分析している。
Sang ngôn ngữ khác
từ nội dung nguồn
arxiv.org
Thông tin chi tiết chính được chắt lọc từ
by Lijie Fan, T... lúc arxiv.org 10-18-2024
https://arxiv.org/pdf/2410.13863.pdfYêu cầu sâu hơn