Centrala begrepp
Follow-the-Regularized-Leader(FTRL)의 적응형 학습률은 경쟁 비율 분석과 Best-of-Both-Worlds 알고리즘에 대한 효과적인 방법론을 제시한다.
Statistik
FTRL의 경쟁 비율은 Θ(√ξ)로 특성화될 수 있음.
ξ-approximately monotone non-increasing sequence의 하한에 대한 경쟁 비율이 제시됨.
stability-penalty matching 알고리즘은 경쟁 비율을 최적화하는데 효과적임.
Citat
"Our proposed update rule, referred to as stability-penalty matching, also facilitates constructing the Best-Of-Both-Worlds (BOBW) algorithms for stochastic and adversarial environments."