本論文では、確率的勾配降下法(SGD)のための新しい対数ステップサイズを提案している。
まず、ステップサイズの値は収束率に重要な影響を及ぼすことを述べている。ステップサイズが大きすぎると最適点に収束しない可能性があり、小さすぎると収束が遅くなる可能性がある。そのため、様々なステップサイズ手法が提案されてきた。
提案手法の新しい対数ステップサイズは、他の手法に比べてゼロに収束するのが遅く、最終的な反復での選択確率が高くなる特徴がある。これにより、最終的な反復での性能が向上すると考えられる。
理論的には、提案手法のステップサイズを用いたSGDアルゴリズムが滑らかな非凸関数に対して、O(1/√T)の収束率を達成できることを示した。
実験では、FashionMnist、CIFAR10、CIFAR100データセットを用いて、提案手法と既存手法を比較した。その結果、提案手法が特にCIFAR100データセットにおいて、畳み込みニューラルネットワークモデルを使った場合に0.9%の精度向上を達成したことを示した。
Vers une autre langue
à partir du contenu source
arxiv.org
Questions plus approfondies